RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA CPU+GPU超級芯片大升級!

硬件世界 ? 來源:硬件世界 ? 2023-08-10 09:37 ? 次閱讀

NVIDIA官方宣布了新一代GH200 Grace Hopper超級芯片平臺,全球首發(fā)采用HBM3e高帶寬內(nèi)存,可滿足世界上最復(fù)雜的生成式AI負(fù)載需求。

NVIDIA 2022年3月推出了Grace Hopper超級芯片,首次將CPU、GPU融合在一塊主板上,不過直到今年5月份才量產(chǎn)。

其中,Grace CPU擁有72個Armv9 CPU核心、198MB緩存,支持1TB/s高帶寬的LPDDR5X ECC內(nèi)存,還支持PCIe 5.0。

Hopper GPU則采用臺積電4nm定制工藝,800億晶體管,集成18432個CUDA核心、576個Tenor核心、60MB二級緩存,支持6144-bit HBM高帶寬內(nèi)存,此前版本配備的是96GB HBM3。

雙路配置的系統(tǒng)中,兩顆新一代GH200超級芯片可帶來144個CPU核心、8PFlops(8千萬億次浮點(diǎn)計算每秒) AI性能、282GB HBM3e內(nèi)存,容量是現(xiàn)在的3.5倍,而高達(dá)10TB/s的帶寬也是現(xiàn)在的3倍。

基于NVLink高速總線,GH200超級芯片還可以繼續(xù)拓展互連,GPU可以訪問全部的CPU內(nèi)存,雙路配置下總?cè)萘靠蛇_(dá)1.2TB。

NVIDIA沒有透露采用的HBM3e來自哪家供應(yīng)商,很可能是SK海力士。

首批基于GH200超級芯片的系統(tǒng)將在2024年第二季度出貨。

順帶一提,AMD Instinct MI300A、MI300X AI加速器分別配備128GB、192GB HBM3,后者帶寬超過5TB/s。

NVIDIA Ada Lovelace架構(gòu)在桌面、筆記本游戲卡上已經(jīng)布局完畢,如今在工作站上也圓滿了。

今天,NVIDIA正式發(fā)布了RTX 5000 ADA、RTX 4500 ADA、RTX 4000 ADA三款新專業(yè)卡,加上此前的旗艦級RTX 6000 ADA、半高式RTX 4000 SFF ADA,高中低端都齊了。

RTX 6000 ADA旗艦卡為雙插槽、單渦輪風(fēng)扇設(shè)計,滿血的AD102 GPU核心,配備18176個CUDA核心、568個Tensor核心,核心加速頻率可達(dá)2.5GHz。

顯存搭檔384-bit 48GB GDDR6 ECC,等效頻率20GHz,帶寬為960GB/s,整卡功耗300W,四個DP 1.4a接口

FP32浮點(diǎn)性能91.1TFlops(每秒91.1萬億次),價格高達(dá)6800美元,約合人民幣4.90萬元。

RTX 5000 ADA延續(xù)了老大哥的造型、AD102核心,精簡到12800個CUDA核心、400個Tensor核心。

顯存也砍到256-bit 32GB,頻率18GHz,帶寬降至578GB/s,功耗也來到250W。

浮點(diǎn)性能65.3TFlops,相當(dāng)于旗艦卡的約72%,價格4000美元,約合人民幣2.88元。

RTX 4500 ADA外觀依然不變,但內(nèi)部改成了AD104核心(跳過AD103),7680個CUDA核心、240個Tensor核心的規(guī)模與RTX 4070 Ti完全一致。

核心頻率是全系列最高的2.6GHz,顯存是192-bit 24GB GDDR6 ECC,頻率18GHz,帶寬432GB/s。

浮點(diǎn)性能39.6TFlops,價格2250美元,約合人民幣1.62萬元。

RTX 4000 ADA改成了單插槽設(shè)計,還是單個渦輪風(fēng)扇,AD104核心,6144個CUDA核心、192個Tensor核心、160-bit 20GB GDDR6顯存,接口四個mini DP 1.4a,這些都和SFF半完全一致。

不過核心頻率從1.56GHz大幅提高到2.2GHz,顯存頻率也從16GHz提高到18GHz,浮點(diǎn)性能來到了26.7TFlops,功耗也從70W大幅增至130W。

價格倒是沒變,還是1250美元,約合人民幣9000元。

Boxx、戴爾、Lamdda、聯(lián)想、惠普等將從今年秋天開始陸續(xù)推出搭載新卡的工作站,甚至有的會配備四塊RTX 6000 ADA,總顯存多達(dá)192GB。

43f9e084-36cd-11ee-9e74-dac502259ad0.png

442e621e-36cd-11ee-9e74-dac502259ad0.png






審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 晶體管
    +關(guān)注

    關(guān)注

    77

    文章

    9682

    瀏覽量

    138079
  • 緩存器
    +關(guān)注

    關(guān)注

    0

    文章

    63

    瀏覽量

    11658
  • PCIe接口
    +關(guān)注

    關(guān)注

    0

    文章

    120

    瀏覽量

    9702
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    303

    瀏覽量

    5804
  • NVIDIA顯卡
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    3149

原文標(biāo)題:NVIDIA CPU+GPU超級芯片大升級!史無前例282GB內(nèi)存

文章出處:【微信號:hdworld16,微信公眾號:硬件世界】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    NVIDIA 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI 超級計算機(jī)

    市的 Colossus 超級計算機(jī)集群達(dá)到了 10 萬顆 NVIDIA? Hopper? GPU 的巨大規(guī)模。該集群使用了 NVIDIA Spectrum-X? 以太網(wǎng)網(wǎng)絡(luò)平臺,該平臺
    發(fā)表于 10-30 09:33 ?142次閱讀
    <b class='flag-5'>NVIDIA</b> 以太網(wǎng)加速 xAI 構(gòu)建的全球最大 AI <b class='flag-5'>超級</b>計算機(jī)

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】--全書概覽

    本帖最后由 1653149838.791300 于 2024-10-16 22:19 編輯 感謝平臺提供的書籍,厚厚的一本,很有分量,感謝作者的傾力付出成書。 本書主要講算力芯片CPU
    發(fā)表于 10-15 22:08

    名單公布!【書籍評測活動NO.43】 算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析

    紙質(zhì)媒體的高質(zhì)量和專業(yè)網(wǎng)絡(luò)媒體的信息更新速度。 算力芯片在最近15年有著巨大性能突破,這些年Intel的CPU芯片從雙核128位SIMD到眾核512位SIMD;NVIDIA
    發(fā)表于 09-02 10:09

    NVIDIA GB200超級芯片引領(lǐng)液冷散熱新紀(jì)元

    ,特別是其單顆B200芯片功耗高達(dá)1000W,以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級芯片GB200功耗驚人地
    的頭像 發(fā)表于 08-01 16:35 ?968次閱讀

    NVIDIA GB200 CPU+GPU超級芯片功耗達(dá)2700W

    7月31日,集邦咨詢發(fā)布的最新報告揭示了AI服務(wù)器領(lǐng)域的一個重要趨勢:隨著計算能力與功耗的同步攀升,特別是NVIDIA計劃在年底推出的下一代Blackwell平臺將帶來顯著的功耗增長,液冷散熱技術(shù)正逐步成為行業(yè)標(biāo)配,預(yù)計今年底其市場滲透率將達(dá)到10%。
    的頭像 發(fā)表于 07-31 13:02 ?1012次閱讀

    超級猛獸 GPU ?NVIDIA GeForce RTX 5090 基本頻率接近 2.9 GHz

    ABSTRACT摘要根據(jù)最新傳言,旗艦級NVIDIAGeForceRTX5090GPU看起來將是一款超級猛獸。據(jù)稱,顯卡的基本時鐘速度將設(shè)定在2.9GHz左右,幾乎達(dá)到3GHz的門檻
    的頭像 發(fā)表于 07-12 08:26 ?433次閱讀
    <b class='flag-5'>超級</b>猛獸 <b class='flag-5'>GPU</b> ?<b class='flag-5'>NVIDIA</b> GeForce RTX 5090 基本頻率接近 2.9 GHz

    CPU渲染和GPU渲染優(yōu)劣分析

    GPU的出現(xiàn),基于GPU的渲染獲得了很大的普及。這些GPU是特定用途的芯片,在某些情況下提供與CPU渲染相當(dāng)?shù)慕Y(jié)果。從廣義上講,
    的頭像 發(fā)表于 05-23 08:27 ?588次閱讀
    <b class='flag-5'>CPU</b>渲染和<b class='flag-5'>GPU</b>渲染優(yōu)劣分析

    進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

    CPU和72個Blackwell GPU,并通過NVIDIA NVLink技術(shù)連接。DGX SuperPOD可以通過NVIDIA Quantum InfiniBand連接多個機(jī)架,實(shí)
    發(fā)表于 05-13 17:16

    利用NVIDIA組件提升GPU推理的吞吐

    本實(shí)踐中,唯品會 AI 平臺與 NVIDIA 團(tuán)隊合作,結(jié)合 NVIDIA TensorRT 和 NVIDIA Merlin HierarchicalKV(HKV)將推理的稠密網(wǎng)絡(luò)和熱 Embedding 全置于
    的頭像 發(fā)表于 04-20 09:39 ?714次閱讀

    AI服務(wù)器異構(gòu)計算深度解讀

    AI服務(wù)器按芯片類型可分為CPU+GPU、CPU+FPGA、CPU+ASIC等組合形式,CPU+GPU是目前國內(nèi)的主要選擇(占比91.9%)
    發(fā)表于 04-12 12:27 ?606次閱讀
    AI服務(wù)器異構(gòu)計算深度解讀

    NVIDIA推出搭載GB200 Grace Blackwell超級芯片NVIDIA DGX SuperPOD?

    NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計算機(jī) —— 搭載 NVIDIA GB200 Grace Blackwell 超級
    的頭像 發(fā)表于 03-21 09:49 ?692次閱讀

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI 超級計算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲技術(shù),可將集群中 Grace Blackwell 超級芯片的數(shù)量擴(kuò)展至數(shù)萬個,通過
    發(fā)表于 03-19 10:56 ?419次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬億參數(shù)級的生成式 AI <b class='flag-5'>超級</b>計算

    深度解讀Nvidia AI芯片路線圖

    Nvidia是一個同時擁有 GPU、CPU和DPU的計算芯片和系統(tǒng)公司。Nvidia通過NVLink、NVSwitch和NVLink C2C
    發(fā)表于 03-13 09:25 ?920次閱讀
    深度解讀<b class='flag-5'>Nvidia</b> AI<b class='flag-5'>芯片</b>路線圖

    Nvidia與AMD新芯片,突破PCIe瓶頸

    AMD 和 NvidiaGPU 都依賴 PCI 總線與 CPU 進(jìn)行通信。CPUGPU 有兩個不同的內(nèi)存域,數(shù)據(jù)必須通過 PCI
    的頭像 發(fā)表于 03-08 14:15 ?664次閱讀
    <b class='flag-5'>Nvidia</b>與AMD新<b class='flag-5'>芯片</b>,突破PCIe瓶頸

    為什么GPUCPU更快?

    GPUCPU更快的原因并行處理能力:GPU可以同時處理多個任務(wù)和數(shù)據(jù),而CPU通常只能一次處理一項(xiàng)任務(wù)。這是因?yàn)?b class='flag-5'>GPU的架構(gòu)使得它可以同時
    的頭像 發(fā)表于 01-26 08:30 ?2392次閱讀
    為什么<b class='flag-5'>GPU</b>比<b class='flag-5'>CPU</b>更快?
    RM新时代网站-首页