RM是什么平台,RM新时代|官方理财平台

NVIDIA 于太平洋時間 3 月 18 日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Grace Blackwell 超級芯片的 NVIDIA DGX SuperPOD。這臺 AI 超級計算機可以用于處理萬億參數(shù)模型，能夠保證超大規(guī)模生成式 AI 訓(xùn)練和推理工作負(fù)載的持續(xù)運行。

全新 DGX SuperPOD 采用新型高效液冷機架級擴展架構(gòu)，基于 NVIDIA DGX GB200 系統(tǒng)構(gòu)建而成，在 FP4 精度下可提供 11.5 exaflops 的 AI 超級計算性能和 240 TB 的快速顯存，且可通過增加機架來擴展性能。

每個 DGX GB200 系統(tǒng)搭載 36 個 NVIDIA GB200 超級芯片，共包含 36 個 NVIDIA Grace CPU 和 72 個 NVIDIA Blackwell GPU。這些超級芯片通過第五代 NVIDIA NVLink 連接成一臺超級計算機。與 NVIDIA H100 Tensor Core GPU 相比，GB200 超級芯片在大語言模型推理工作負(fù)載方面的性能提升了高達(dá) 30 倍。

NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛表示：“NVIDIA DGX AI 超級計算機是推進 AI 產(chǎn)業(yè)變革的工廠。新一代 DGX SuperPOD 集 NVIDIA 加速計算、網(wǎng)絡(luò)和軟件方面的最新進展于一體，能夠幫助每一個企業(yè)、行業(yè)和國家完善并生成自己的 AI?！?/strong>

Grace Blackwell 架構(gòu)的 DGX SuperPOD 由 8 個或以上的 DGX GB200 系統(tǒng)構(gòu)建而成，這些系統(tǒng)通過 NVIDIA Quantum InfiniBand 網(wǎng)絡(luò)連接，可擴展到數(shù)萬個 GB200 超級芯片。用戶可通過 NVLink 連接 8 個 DGX GB200 系統(tǒng)中的 576 塊 Blackwell GPU，從而獲得海量共享顯存空間，來賦能下一代 AI 模型。

面向生成式 AI 時代的全新機架級擴展的DGX SuperPOD 架構(gòu)

采用 DGX GB200 系統(tǒng)構(gòu)建而成的全新 DGX SuperPOD 采用了統(tǒng)一的計算網(wǎng)絡(luò)。除第五代 NVIDIA NVLink 網(wǎng)絡(luò)外，還包括 NVIDIA BlueField-3 DPU，并將支持同為今日發(fā)布的 NVIDIA Quantum-X800 InfiniBand 網(wǎng)絡(luò)。這個架構(gòu)可為計算平臺中的每塊 GPU 提供高達(dá)每秒 1800 GB 的帶寬。

另外，第四代 NVIDIA 可擴展分層聚合和規(guī)約協(xié)議（SHARP）技術(shù)可提供 14.4 teraflops 的網(wǎng)絡(luò)計算能力，與上一代產(chǎn)品相比，新一代 DGX SuperPOD 架構(gòu)的網(wǎng)絡(luò)計算能力提高了 4 倍。

統(tǒng)包式架構(gòu)搭配先進的軟件，實現(xiàn)前所未有的正常運行時間

全新 DGX SuperPOD 是一臺完整的數(shù)據(jù)中心級 AI 超級計算機，在與 NVIDIA 認(rèn)證合作伙伴提供的高性能存儲集成后，能夠滿足生成式 AI 工作負(fù)載的需求。每臺超級計算機都在出廠前完成了搭建、布線和測試，從而大大加快了在用戶數(shù)據(jù)中心的部署速度。

Grace Blackwell 架構(gòu)的 DGX SuperPOD 具有智能預(yù)測管理功能，能夠持續(xù)監(jiān)控軟硬件中的數(shù)千個數(shù)據(jù)點，通過預(yù)測并攔截導(dǎo)致停機和低效的根源以節(jié)省時間、能耗和計算成本。

即使沒有系統(tǒng)管理員在場，該軟件也能識別需要重點關(guān)注的領(lǐng)域并制定維護計劃，靈活調(diào)整計算資源，通過自動保存和恢復(fù)作業(yè)來防止停機。

如果軟件檢測到需要更換組件，該集群將激活備用容量以確保工作能夠及時完成。為任何必要的硬件更換做好安排，以免出現(xiàn)計劃之外的停機。

NVIDIA DGX B200 系統(tǒng)推動各行各業(yè) AI 超級計算發(fā)展

NVIDIA 還發(fā)布了一款統(tǒng)一用于 AI 模型訓(xùn)練、微調(diào)和推理的通用 AI 超級計算平臺 NVIDIA DGX B200 系統(tǒng)。

采用風(fēng)冷傳統(tǒng)機架式設(shè)計的 DGX 已被全球各行各業(yè)數(shù)千家企業(yè)廣泛采用，DGX B200 是 DGX 系列的第六代產(chǎn)品。采用 Blackwell 架構(gòu)的全新 DGX B200 系統(tǒng)包含 8 個 NVIDIA B200 Tensor Core GPU 和 2 個第五代英特爾至強處理器。用戶還可以使用 DGX B200 系統(tǒng)構(gòu)建 DGX SuperPOD，打造能夠幫助大型開發(fā)團隊運行多種不同作業(yè)的 AI 卓越中心。

DGX B200 系統(tǒng)憑借全新 Blackwell 架構(gòu)中的 FP4 精度特性，可提供高達(dá) 144 petaflops 的 AI 性能、1.4TB 海量的 GPU 顯存和 64TB/s 的顯存帶寬，從而使得該系統(tǒng)的萬億參數(shù)模型實時推理速度比上一代產(chǎn)品提升了 15 倍。

DGX B200 系統(tǒng)包含帶有 8 個 NVIDIA ConnectX-7 網(wǎng)卡和 2 個 BlueField-3 DPU 的高性能網(wǎng)絡(luò)，每個連接的帶寬高達(dá) 400 Gb/s，可通過 NVIDIA Quantum-2 InfiniBand 和 NVIDIA Spectrum-X 以太網(wǎng)網(wǎng)絡(luò)平臺支持更高的 AI 性能。

軟件和專家為擴大生產(chǎn)級 AI的規(guī)模提供支持

所有 NVIDIA DGX 平臺均包含用于企業(yè)級開發(fā)和部署的 NVIDIA AI Enterprise 軟件。DGX 用戶可以通過使用該軟件平臺中的預(yù)訓(xùn)練的 NVIDIA 基礎(chǔ)模型、框架、工具套件和全新 NVIDIA NIM 微服務(wù)來加速他們的工作。

NVIDIA DGX 專家與部分獲得 NVIDIA DGX 平臺支持認(rèn)證的合作伙伴將在每個部署環(huán)節(jié)為用戶提供幫助，以便其迅速實現(xiàn) AI 投產(chǎn)。在系統(tǒng)投入運行后，DGX 專家還將繼續(xù)協(xié)助用戶優(yōu)化其 AI 管線和基礎(chǔ)設(shè)施。

供應(yīng)情況

NVIDIA 全球合作伙伴預(yù)計將在今年晚些時候提供基于 DGX GB200 和 DGX B200 系統(tǒng)構(gòu)建而成的 NVIDIA DGX SuperPOD。

審核編輯：劉清

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4978

瀏覽量
102984

超級計算機

超級計算機

+關(guān)注

關(guān)注
2

文章
461

瀏覽量
41942

超級芯片

超級芯片

+關(guān)注

關(guān)注
0

文章
34

瀏覽量
8876

生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
502

瀏覽量
471

收藏人收藏

掃一掃，分享給好友

復(fù)制鏈接分享

評論

發(fā)布評論請先登錄

相關(guān)推薦

Supermicro推出直接液冷優(yōu)化的NVIDIA Blackwell解決方案

，宣布推出高性能的SuperCluster。這一端對端AI數(shù)據(jù)中心解決方案采用NVIDIA Blackwell平臺，專為兆級參數(shù)規(guī)模的生成式AI時代所設(shè)計。全新SuperCluster將可大幅增加液冷

發(fā)表于 11-25 10:39 ?310次閱讀

英偉達(dá)推出GB200 NVL4平臺：整合了兩個GB200芯片

11月19日消息，人工智能（AI）芯片大廠英偉達(dá)（NVIDIA）正式推出了兩個全新的AI解決方案硬件平臺，一個是BlackwellGB200NVL4，一個是HopperH

發(fā)表于 11-21 01:06 ?222次閱讀

NVIDIA助力丹麥發(fā)布首臺AI超級計算機

這臺丹麥最大的超級計算機由該國政府與丹麥 AI 創(chuàng)新中心共同建設(shè)，是一臺 NVIDIA DGX SuperPOD 超級計算機。

發(fā)表于 10-27 09:42 ?426次閱讀

微軟Azure首獲英偉達(dá)GB200 AI服務(wù)器

微軟Azure在社交平臺上宣布了一項重要進展，公司已經(jīng)成功獲得了搭載英偉達(dá)最新GB200超級芯片的AI服務(wù)器。這一舉措使微軟Azure成為全球云服務(wù)供應(yīng)商中首個采用英偉達(dá)

發(fā)表于 10-10 17:01 ?522次閱讀

NVIDIA GB200芯片產(chǎn)能受挫，股價遭遇重挫

近日，全球圖形處理器（GPU）巨頭NVIDIA遭遇了前所未有的產(chǎn)能挑戰(zhàn)，其備受矚目的GB200系列芯片預(yù)計產(chǎn)量大幅低于市場預(yù)期，這一消息如同重錘般擊中了投資者信心，導(dǎo)致公司股價在美股市場經(jīng)歷了一場劇烈震蕩。

發(fā)表于 08-08 10:33 ?679次閱讀

NVIDIA GB200超級芯片引領(lǐng)液冷散熱新紀(jì)元

，特別是其單顆B200芯片功耗高達(dá)1000W，以及由一顆Grace CPU與兩顆Blackwell GPU組成的超級

發(fā)表于 08-01 16:35 ?968次閱讀

NVIDIA AI Enterprise榮獲金獎

NVIDIA AI Enterprise、GH200 Grace Hopper 超級芯片和 Spectrum-X 在 COMPUTEX 20

發(fā)表于 05-29 09:27 ?444次閱讀

英偉達(dá)Blackwell GB200 AI芯片今年預(yù)估出貨50萬片

英偉達(dá)正積極擴大其人工智能服務(wù)器的產(chǎn)能。據(jù)最新消息，Blackwell GB200人工智能服務(wù)器預(yù)計在2024年的出貨量將達(dá)到50萬片，到了2025年，這一數(shù)字將猛增至200萬片。

發(fā)表于 05-24 11:40 ?693次閱讀

進一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片

解決方案——DGX SuperPOD?。每個采用液冷技術(shù)的機架配備36個NVIDIA GB200 Grace

發(fā)表于 05-13 17:16

英偉達(dá)Blackwell平臺網(wǎng)絡(luò)配置分析

采用 DGX GB200 系統(tǒng)的 NVIDIA DGX SuperPOD 專為訓(xùn)練和推理萬億參數(shù)生成式AI 模型而構(gòu)建。

發(fā)表于 04-17 11:01 ?1404次閱讀

超微電腦借助英偉達(dá)Blackwell架構(gòu)，打造頂尖生成式AI系統(tǒng)

超微電腦Supermicro近日宣布，其全新一代人工智能系統(tǒng)已正式問世，該系統(tǒng)基于NVIDIA的革命性Blackwell架構(gòu)，展現(xiàn)了前所未有的人工智能性能。該系列新品包括NVIDIA GB20

發(fā)表于 03-25 10:27 ?596次閱讀

NVIDIA Blackwell DGX SuperPOD助力萬億級生成式AI計算

全新 DGX SuperPOD 采用新型高效液冷機架級擴展架構(gòu)，基于 NVIDIA DGX GB200 系統(tǒng)構(gòu)建而成，在 FP4 精度下可提

發(fā)表于 03-21 09:49 ?209次閱讀

英偉達(dá)推出百億參數(shù)AI模型處理方案——DGX SuperPOD

據(jù)悉，新型DGX SuperPOD采用全新的高效水冷機架式設(shè)計，搭載英偉達(dá)DGX GB200系統(tǒng)，F(xiàn)P4精度下具備11.5 exaflops

發(fā)表于 03-19 14:35 ?738次閱讀

NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD，適用于萬億參數(shù)級的生成式 AI 超級計算

——? NVIDIA 于今日發(fā)布新一代 AI 超級計算機 —— 搭載 NVIDIA GB200 Gra

發(fā)表于 03-19 10:56 ?420次閱讀

英偉達(dá)計劃拉大GB200與B100/B200規(guī)格差異，以刺激用戶購買GB200

早些時候，IT之家用一張路線圖展示了英偉達(dá)計劃在2024年推出Hopper GH200 GPU，其后將依次推出基于Blackwell的GB200

發(fā)表于 03-14 16:36 ?2743次閱讀