RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA為加速生成式AI而設(shè)計(jì)的超級(jí)芯片全面投產(chǎn)

GPU視覺(jué)識(shí)別 ? 來(lái)源:GPU視覺(jué)識(shí)別 ? 作者:GPU視覺(jué)識(shí)別 ? 2023-06-01 15:59 ? 次閱讀

2023年是大語(yǔ)言模型、生成式AI、ChatGPT、AIGC大爆發(fā)的一年。GPU是大規(guī)模深度學(xué)習(xí)、高性能計(jì)算的重要硬件基礎(chǔ),而大語(yǔ)言模型,如生成式AI、ChatGPT等,則借助GPU的計(jì)算能力快速地訓(xùn)練和推理,獲得更高的模型效果和更廣泛的應(yīng)用場(chǎng)景。尤其在游戲開(kāi)發(fā)領(lǐng)域,運(yùn)用大語(yǔ)言模型可以加強(qiáng)游戲的情節(jié)推進(jìn)、人工智能角色表現(xiàn)等方面的體驗(yàn),而加速訓(xùn)練的英偉達(dá)GPU則可以使這些特征更加流暢。由于英偉達(dá)在GPU硬件設(shè)計(jì)和優(yōu)化方面的領(lǐng)先地位,為大型語(yǔ)言模型的快速發(fā)展提供了扎實(shí)的技術(shù)基礎(chǔ)。

目前中國(guó)和美國(guó)研發(fā)的大型AI模型數(shù)量占全球總數(shù)的80%以上,中國(guó)排名全球第二,僅次于美國(guó),其中,已經(jīng)發(fā)布超過(guò)79個(gè)10億參數(shù)規(guī)模以上的大型AI模型。中國(guó)科學(xué)技術(shù)信息研究所所長(zhǎng)、科技部新一代人工智能發(fā)展研究中心主任趙志耘表示,我國(guó)前期在人工智能領(lǐng)域的各項(xiàng)部署,為大模型發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ),并已經(jīng)建立起涵蓋理論方法和軟硬件技術(shù)的體系化研發(fā)能力,形成了緊跟世界前沿的大模型技術(shù)群。

目前,我國(guó)參數(shù)規(guī)模在10億以上的大型AI模型數(shù)量達(dá)到79個(gè),并且地域和領(lǐng)域分布相對(duì)于集中,全國(guó)14個(gè)省市/地區(qū)都在開(kāi)展大模型研發(fā),主要集中在北京和廣東兩地,其中北京28個(gè),廣東22個(gè)。同時(shí),大模型應(yīng)用也在不斷拓展和深化落地。一方面,通用領(lǐng)域大模型如文心一言、通義千問(wèn)、紫東太初、星火認(rèn)知等正在快速發(fā)展,打造跨行業(yè)通用化人工智能能力平臺(tái),其應(yīng)用行業(yè)在辦公、生活、娛樂(lè)向醫(yī)療、工業(yè)、教育等加速滲透;另一方面,針對(duì)生物制藥、遙感、氣象等垂直領(lǐng)域的專(zhuān)用大模型,發(fā)揮其領(lǐng)域縱深優(yōu)勢(shì),提供針對(duì)特定業(yè)務(wù)場(chǎng)景的高質(zhì)量專(zhuān)業(yè)化解決方案。

5月29日,英偉達(dá)在2023臺(tái)北電腦展大會(huì)推出了DGX GH200 AI超級(jí)計(jì)算機(jī),這是配備256顆Grace Hopper超級(jí)芯片和NVIDIA NVLink交換機(jī)系統(tǒng)的尖端系統(tǒng),具有1 exaflop性能和144TB共享內(nèi)存。該超級(jí)計(jì)算機(jī)的推出,在人工智能領(lǐng)域引起了轟動(dòng),標(biāo)志著英偉達(dá)在大型AI模型技術(shù)和硬件設(shè)計(jì)領(lǐng)域的再次領(lǐng)先。其強(qiáng)大的計(jì)算和網(wǎng)絡(luò)技術(shù),為生成式AI、大型語(yǔ)言模型和推薦系統(tǒng)的應(yīng)用和開(kāi)發(fā)帶來(lái)了更廣闊的前景,進(jìn)一步拓展了AI的邊界。此外,DGX GH200還是第一臺(tái)Grace Hopper超級(jí)芯片和NVLink交換機(jī)系統(tǒng)配對(duì)的超級(jí)計(jì)算機(jī),其帶寬較之前顯卡相比多48倍,為人工智能先驅(qū)和云服務(wù)提供商打開(kāi)了探索新領(lǐng)域的大門(mén)。

DGX GH200與生成式AI

英偉達(dá)發(fā)布了一系列面向生成式AI的產(chǎn)品和服務(wù),包括大內(nèi)存生成式AI超級(jí)計(jì)算機(jī)DGX GH200、Grace Hopper超級(jí)芯片GH200的全面投產(chǎn)、全新加速以太網(wǎng)平臺(tái)Spectrum-X、定制化AI模型代工服務(wù)、與WPP合作打造生成式AI內(nèi)容引擎等,多項(xiàng)舉措都為生成式AI的應(yīng)用與發(fā)展提供了更廣闊的前景。

此外,英偉達(dá)還發(fā)布了MGX服務(wù)器規(guī)范,并且已有1600多家生成式AI公司采用了英偉達(dá)技術(shù)。

目前,英偉達(dá)市值已經(jīng)達(dá)到9632億美元,僅差一步之遙即可加入“萬(wàn)億市值俱樂(lè)部”,成為美國(guó)上市公司市值排名第五的企業(yè)和第一家由華人創(chuàng)立的萬(wàn)億美元市值公司。

wKgaomR4T9KAPnBSAAKoZdonWbA062.png

E級(jí)算力,谷歌云、Meta、微軟首批試用

英偉達(dá)日前發(fā)布了一款采用最新GPU和CPU的系統(tǒng)巔峰之作——新型大內(nèi)存AI超級(jí)計(jì)算機(jī)DGX GH200,預(yù)計(jì)于今年年底上市。

該超算旨在支持生成式AI語(yǔ)言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負(fù)載的大型下一代模型。DGX GH200集成了先進(jìn)的加速計(jì)算和網(wǎng)絡(luò)技術(shù),是首款將Grace Hopper超級(jí)芯片與英偉達(dá)NVLink Switch系統(tǒng)搭配的超級(jí)計(jì)算機(jī)。

采用新互連方式,256個(gè)Grace Hopper超級(jí)芯片可以像單個(gè)巨型GPU一樣協(xié)同運(yùn)行,提供了1EFLOPS性能和144TB共享內(nèi)存,比上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。

谷歌云、Meta、微軟等是首批獲得訪問(wèn)權(quán)限的公司,英偉達(dá)打算將DGX GH200設(shè)計(jì)藍(lán)圖提供給其他云服務(wù)商及超大規(guī)模計(jì)算廠商,以便他們進(jìn)一步為其基礎(chǔ)設(shè)施定制DGX GH200。

英偉達(dá)還正在打造自己的基于DGX GH200的大型AI超級(jí)計(jì)算機(jī)NVIDIA Helios,將于今年年底上線。此外,DGX GH200超級(jí)計(jì)算機(jī)包含英偉達(dá)軟件,提供AI工作流管理、企業(yè)級(jí)集群管理、加速計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)基礎(chǔ)設(shè)施庫(kù),以及100多個(gè)框架、預(yù)訓(xùn)練模型和開(kāi)發(fā)工具,以簡(jiǎn)化AI生產(chǎn)的開(kāi)發(fā)和部署。

英偉達(dá)的Base Command軟件可以幫助管理AI工作流程、企業(yè)級(jí)集群、加速計(jì)算和存儲(chǔ)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施等,而AI Enterprise軟件層則提供了許多框架、預(yù)訓(xùn)練模型和開(kāi)發(fā)工具,以簡(jiǎn)化AI生產(chǎn)的開(kāi)發(fā)和部署。DGX GH200超級(jí)計(jì)算機(jī)的推出將有助于推動(dòng)AI技術(shù)的發(fā)展,為各行各業(yè)提供更快、更強(qiáng)大的AI計(jì)算能力,加速AI技術(shù)的應(yīng)用和落地。

GH200芯片全面投產(chǎn)

英偉達(dá)日前宣布,已全面投產(chǎn)GH200 Grace Hopper超級(jí)芯片,將為AI和高性能計(jì)算工作負(fù)載提供動(dòng)力。

基于GH200的系統(tǒng)已經(jīng)被全球制造商采用,提供了超過(guò)400個(gè)配置,這些系統(tǒng)都基于英偉達(dá)的最新Grace Hopper和Ada Lovelace架構(gòu)。

GH200 Grace Hopper超級(jí)芯片采用了NVIDIA NVLink-C2C互連技術(shù),將英偉達(dá)Grace CPU和Hopper GPU架構(gòu)組合在同一封裝中,提供高達(dá)900GB/s的總帶寬,比傳統(tǒng)加速系統(tǒng)中的標(biāo)準(zhǔn)PCIe Gen5通道帶寬高7倍,同時(shí)互連功耗降低到原來(lái)的1/5,能夠滿足苛刻的生成式AI和高性能計(jì)算(HPC)應(yīng)用。預(yù)計(jì)幾家全球超大規(guī)模計(jì)算企業(yè)和超算中心客戶將采用GH200驅(qū)動(dòng)的系統(tǒng),這些系統(tǒng)將于今年晚些時(shí)候上市。

打造數(shù)億美元生成式AI超算

此外,黃仁勛還宣布推出NVIDIA Spectrum-X平臺(tái),旨在提高基于以太網(wǎng)的AI云的性能和效率。

Spectrum-X基于網(wǎng)絡(luò)創(chuàng)新,將英偉達(dá)Spectrum-4交換機(jī)和BlueField-3 DPU緊密耦合,實(shí)現(xiàn)了1.7倍的整體AI性能和能效提升,并通過(guò)性能隔離增強(qiáng)了多租戶功能,保持一致和可預(yù)測(cè)的性能。

Spectrum-X具有高度通用性,能夠用于各種AI應(yīng)用,與基于以太網(wǎng)的堆?;ゲ僮?,支持開(kāi)發(fā)者構(gòu)建軟件定義的云原生AI應(yīng)用程序。全球各大云計(jì)算提供商正在采用Spectrum-X平臺(tái)擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。

NVIDIA正在以色列數(shù)據(jù)中心構(gòu)建一臺(tái)超大規(guī)模生成式AI超級(jí)計(jì)算機(jī)Israel-1作為Spectrum-X參考設(shè)計(jì)的藍(lán)圖和測(cè)試平臺(tái)。該超算將采用戴爾PowerEdge XE9680服務(wù)器、英偉達(dá)HGX H100超級(jí)計(jì)算平臺(tái)、內(nèi)置BlueField-3 DPU和Spectrum-4交換機(jī)的Spectrum-X平臺(tái),預(yù)計(jì)價(jià)值數(shù)億美元。該平臺(tái)支持256個(gè)200Gb/s端口通過(guò)單個(gè)交換機(jī)連接,或在兩層leaf-spine拓?fù)渲刑峁?6000個(gè)端口,以支持AI云的增長(zhǎng)和擴(kuò)展,同時(shí)保持高水平的性能并最大限度地減少網(wǎng)絡(luò)延遲。

全球領(lǐng)先的云計(jì)算提供商正在采用Spectrum-X平臺(tái)擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。

MGX服務(wù)器規(guī)范

模塊化參考架構(gòu)

黃仁勛同時(shí)發(fā)布了NVIDIA MGX服務(wù)器規(guī)范,為系統(tǒng)制造商提供了模塊化參考架構(gòu),以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。

MGX支持英偉達(dá)全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器,以及各種x86及Arm處理器,這使得制造商能夠更有效地滿足每個(gè)客戶的獨(dú)特預(yù)算、電力輸送、熱設(shè)計(jì)和機(jī)械要求。

永擎(ASRock Rack)、華碩(ASUS)、技嘉(GIGABYTE)、和碩(Pegatron)、QCT、超微(Supermicro)等將采用MGX構(gòu)建下一代加速計(jì)算機(jī),可將開(kāi)發(fā)成本削減多達(dá)3/4,并將開(kāi)發(fā)時(shí)間縮短2/3至僅需6個(gè)月。MGX可以從為其服務(wù)器機(jī)箱加速計(jì)算優(yōu)化的基本系統(tǒng)架構(gòu)開(kāi)始,然后選擇GPU、DPU和CPU。同時(shí),MGX提供了英偉達(dá)產(chǎn)品靈活的多代兼容性,以確保制造商可以重用現(xiàn)有設(shè)計(jì)并輕松采用下一代產(chǎn)品。MGX還能輕松集成到云和企業(yè)數(shù)據(jù)中心中。

除了MGX規(guī)范外,黃仁勛還宣布,英偉達(dá)與日本電信巨頭軟銀合作,在日本建立一個(gè)分布式數(shù)據(jù)中心網(wǎng)絡(luò)。該網(wǎng)絡(luò)將在一個(gè)共同的云平臺(tái)上提供5G服務(wù)和生成式AI應(yīng)用。數(shù)據(jù)中心將使用MGX系列(包括Grace Hopper、BlueField-3 DPU和Spectrum以太網(wǎng)交換機(jī))以提供5G協(xié)議所需的高精度定時(shí),并提高頻譜效率以降低成本和能耗。

這些系統(tǒng)有助于探索自動(dòng)駕駛、AI工廠、AR/VR、計(jì)算機(jī)視覺(jué)和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來(lái)的用途可能包括3D視頻會(huì)議和全息通信。這將為這些領(lǐng)域提供更高效、更靈活和更先進(jìn)的解決方案,推動(dòng)技術(shù)和產(chǎn)業(yè)的發(fā)展。

GH200在游戲行業(yè)的應(yīng)用

黃仁勛在宣布推出針對(duì)游戲的Avatar云引擎(ACE)服務(wù),這是一項(xiàng)定制AI模型代工服務(wù),中間件、工具和游戲開(kāi)發(fā)者可以使用它來(lái)構(gòu)建和部署定制的語(yǔ)音、對(duì)話和動(dòng)畫(huà)AI模型。

ACE能賦予非玩家角色(NPC)更智能且不斷進(jìn)化的對(duì)話技能,使其能夠以栩栩如生的個(gè)性來(lái)回答玩家的問(wèn)題。ACE for Games為語(yǔ)音、對(duì)話和角色動(dòng)畫(huà)提供了優(yōu)化的AI基礎(chǔ)模型,包括:英偉達(dá)NeMo,使用專(zhuān)有數(shù)據(jù),構(gòu)建、定制和部署語(yǔ)言模型;英偉達(dá)Riva,用于自動(dòng)語(yǔ)音識(shí)別和文本轉(zhuǎn)語(yǔ)音,以實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音對(duì)話;英偉達(dá)Omniverse Audio2Face,用于即時(shí)創(chuàng)建游戲角色的表情動(dòng)畫(huà),以匹配任何語(yǔ)音軌道。

此外,英偉達(dá)與其子公司Convai合作,展示了如何快速用英偉達(dá)ACE for Games來(lái)構(gòu)建游戲NPU。在名為“Kairos”的演示中,英偉達(dá)展示了一個(gè)與一個(gè)拉面店的供應(yīng)商Jin互動(dòng)的游戲。基于生成式AI,Jin雖是個(gè)NPC,卻能擬真地回答自然語(yǔ)言問(wèn)題,且回答內(nèi)容與敘述的背景故事一致。開(kāi)發(fā)人員可以集成整個(gè)NVIDIA ACE for Games解決方案,也可以只使用他們需要的組件。多家游戲開(kāi)發(fā)商和初創(chuàng)公司已采用英偉達(dá)的生成式AI技術(shù)。

黃仁勛還介紹了英偉達(dá)和微軟如何在生成式AI時(shí)代合作推動(dòng)Windows PC的創(chuàng)新。新的和增強(qiáng)的工具、框架和驅(qū)動(dòng)程序使PC開(kāi)發(fā)者更容易開(kāi)發(fā)和部署AI,例如用于優(yōu)化和部署GPU加速AI模型和新圖形驅(qū)動(dòng)程序的微軟Olive工具鏈將提高帶有英偉達(dá)GPU的Windows PC上的DirectML性能。此次合作將增強(qiáng)和擴(kuò)展搭載RTX GPU的1億臺(tái)PC的安裝基礎(chǔ),可提升400多個(gè)AI加速的Windows應(yīng)用程序和游戲的性能。這將為PC游戲帶來(lái)更高的性能和更好的體驗(yàn),同時(shí)也將推動(dòng)AI在Windows PC上的應(yīng)用和發(fā)展。

總的來(lái)說(shuō),黃仁勛在宣布中介紹了NVIDIA在游戲AI方面的最新進(jìn)展和合作,包括Avatar云引擎(ACE)服務(wù)、微軟合作推動(dòng)Windows PC的創(chuàng)新等。這些技術(shù)和合作將為游戲開(kāi)發(fā)者帶來(lái)更多的AI工具和解決方案,為玩家?guī)?lái)更好的游戲體驗(yàn)。

DGX GH200在數(shù)字廣告中的應(yīng)用

英偉達(dá)的生成式AI技術(shù)也將在數(shù)字廣告行業(yè)帶來(lái)新機(jī)遇?;贜VIDIA AI和Omniverse技術(shù)的引擎將多個(gè)創(chuàng)意3D和AI工具連接在一起,以大規(guī)模革新商業(yè)內(nèi)容和體驗(yàn)。

英國(guó)WPP集團(tuán),全球最大的營(yíng)銷(xiāo)服務(wù)機(jī)構(gòu),正與英偉達(dá)合作,利用Omniverse Cloud構(gòu)建首個(gè)生成式AI內(nèi)容引擎,以更高效和高質(zhì)量的方式為客戶創(chuàng)建商業(yè)內(nèi)容。

新引擎連接了來(lái)自Adobe和Getty Images等工具的3D設(shè)計(jì)、制造和創(chuàng)意供應(yīng)鏈工具的生態(tài)系統(tǒng)。黃仁勛在演講中展示了創(chuàng)意團(tuán)隊(duì)如何將他們的3D設(shè)計(jì)工具連接在一起,并在Omniverse中構(gòu)建客戶產(chǎn)品的數(shù)字孿生。使用負(fù)責(zé)任的數(shù)據(jù)來(lái)源訓(xùn)練生成式AI技術(shù)并結(jié)合英偉達(dá)Picasso一起構(gòu)建,使其能夠快速生成虛擬集。此后,WPP客戶可利用完整的場(chǎng)景生成大量廣告、視頻和3D體驗(yàn),供全球市場(chǎng)和用戶在任何網(wǎng)絡(luò)設(shè)備上使用。

這項(xiàng)合作在數(shù)字廣告領(lǐng)域持續(xù)推動(dòng)著生成式AI技術(shù)的發(fā)展。WPP首席執(zhí)行官馬克·里德表示,生成式AI技術(shù)正在以驚人的速度改變營(yíng)銷(xiāo)世界,合作所提供的獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式,并鞏固WPP在為世界頂級(jí)品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)地位。

DGX GH200在

電子制造商中的應(yīng)用

全球電子制造商正在使用一種全新的綜合參考工作流程,這種工作流程結(jié)合了英偉達(dá)的多種技術(shù),包括生成式AI、3D協(xié)作、仿真和自主機(jī)器,旨在幫助制造商規(guī)劃、構(gòu)建、運(yùn)營(yíng)和優(yōu)化他們的工廠。這些技術(shù)包括英偉達(dá)的Omniverse,它連接了頂級(jí)計(jì)算機(jī)輔助設(shè)計(jì)和生成式AI的API和前沿框架;英偉達(dá)的Isaac Sim應(yīng)用程序,用于模擬和測(cè)試機(jī)器人;英偉達(dá)的Metropolis視覺(jué)AI框架,用于自動(dòng)光學(xué)檢測(cè)。

英偉達(dá)使電子制造商能夠輕松構(gòu)建和運(yùn)營(yíng)虛擬工廠,將其制造和檢驗(yàn)工作流程數(shù)字化,并大大提高質(zhì)量和安全,減少代價(jià)高昂的最后一刻意外和延誤。黃仁勛在現(xiàn)場(chǎng)展示了一個(gè)完全數(shù)字化的智能工廠的演示。

富士康工業(yè)互聯(lián)網(wǎng)、宜鼎國(guó)際、和碩、廣達(dá)和緯創(chuàng)正在使用英偉達(dá)的參考工作流程,以優(yōu)化他們的工作單元和裝配線運(yùn)營(yíng),同時(shí)降低生產(chǎn)成本,具體用例包括電路板質(zhì)保檢測(cè)點(diǎn)自動(dòng)化、光學(xué)檢測(cè)自動(dòng)化、建設(shè)虛擬工廠、模擬協(xié)作機(jī)器人、構(gòu)建及運(yùn)營(yíng)數(shù)字孿生等。

英偉達(dá)正在與幾家領(lǐng)先的制造工具和服務(wù)提供商合作,構(gòu)建一個(gè)全棧、單一的架構(gòu),每個(gè)架構(gòu)都適用于每個(gè)工作流程級(jí)別。

在系統(tǒng)層面,英偉達(dá)IGX Orin提供了一個(gè)一體化的邊緣AI平臺(tái),將工業(yè)級(jí)硬件與企業(yè)級(jí)軟件和支持相結(jié)合。IGX滿足邊緣計(jì)算獨(dú)特的耐用性和低功耗要求,同時(shí)提供開(kāi)發(fā)和運(yùn)行AI應(yīng)用程序所需的高性能。其制造商合作伙伴們正在開(kāi)發(fā)IGX驅(qū)動(dòng)的系統(tǒng),以服務(wù)于工業(yè)和醫(yī)療市場(chǎng)。

在平臺(tái)層面,Omniverse連接了世界領(lǐng)先的3D、模擬和生成式AI提供商,團(tuán)隊(duì)可在他們最喜歡的應(yīng)用程序之間構(gòu)建互操作性,比如來(lái)自Adobe、Autodesk和Siemens的應(yīng)用程序。

這些技術(shù)的整合使得制造商能夠在一個(gè)統(tǒng)一的平臺(tái)上進(jìn)行設(shè)計(jì)、仿真、測(cè)試和生產(chǎn),從而大大提高效率和質(zhì)量。此外,英偉達(dá)還提供了一系列工具和服務(wù),幫助制造商管理和優(yōu)化他們的生產(chǎn)線,包括實(shí)時(shí)監(jiān)控、數(shù)據(jù)分析和預(yù)測(cè)性維護(hù)。

英偉達(dá)的數(shù)字化工廠解決方案不僅適用于電子制造業(yè),還可以應(yīng)用于其他行業(yè),如汽車(chē)制造、航空航天、醫(yī)療設(shè)備等。這些行業(yè)都需要高度自動(dòng)化和數(shù)字化的生產(chǎn)線,以滿足不斷增長(zhǎng)的市場(chǎng)需求和質(zhì)量標(biāo)準(zhǔn)。

GH200產(chǎn)品參數(shù)

GH200是英偉達(dá)推出的最新超級(jí)計(jì)算機(jī),最多可以放置256個(gè)GPU,適用于超大型AI模型的部署。相比之前的DGX服務(wù)器,GH200提供線性拓展方式和更高的GPU共享內(nèi)存編程模型,可通過(guò)NVLink高速訪問(wèn)144TB內(nèi)存,是上一代DGX的500倍。其架構(gòu)提供的NVLink帶寬是上一代的48倍,使得千億或萬(wàn)億參數(shù)以上的大模型能夠在一臺(tái)DGX內(nèi)放置,進(jìn)一步提高模型效率和多模態(tài)模型的開(kāi)發(fā)進(jìn)程。

GPU的統(tǒng)一內(nèi)存編程模型一直是復(fù)雜加速計(jì)算應(yīng)用取得突破的基石。NVIDIA Grace Hopper Superchip與NVLink開(kāi)關(guān)系統(tǒng)配對(duì),在NVIDIA DGX GH200系統(tǒng)中整合了256個(gè)GPU,通過(guò)NVLink高速訪問(wèn)144TB內(nèi)存。與單個(gè)NVIDIA DGX A100 320 GB系統(tǒng)相比,NVIDIA DGX GH200為GPU共享內(nèi)存編程模型提供了近500倍的內(nèi)存,是突破GPU通過(guò)NVLink訪問(wèn)內(nèi)存的100TB障礙的第一臺(tái)超級(jí)計(jì)算機(jī)。NVIDIA Base Command的快速部署和簡(jiǎn)化系統(tǒng)管理使用戶能夠更快地進(jìn)行加速計(jì)算。

wKgZomR4T9mAGu3HAAKOzel7JYI718.png

NVIDIA DGX GH200系統(tǒng)采用了NVIDIA Grace Hopper Superchip和NVLink Switch System作為其構(gòu)建塊。NVIDIA Grace Hopper Superchip將CPU和GPU結(jié)合在一起,使用NVIDIA NVLink-C2C技術(shù)提供一致性內(nèi)存模型,并提供高帶寬和無(wú)縫的多GPU系統(tǒng)。每個(gè)Grace Hopper超級(jí)芯片都擁有480GB的LPDDR5 CPU內(nèi)存和96GB的快速HBM3,提供比PCIe Gen5多7倍的帶寬,與NVLink-C2C互連。

NVLink開(kāi)關(guān)系統(tǒng)使用第四代NVLink技術(shù),將NVLink連接擴(kuò)展到超級(jí)芯片,以創(chuàng)建一個(gè)兩級(jí)、無(wú)阻塞、NVLink結(jié)構(gòu),可完全連接256個(gè)Grace Hopper超級(jí)芯片。這種結(jié)構(gòu)提供900GBps的內(nèi)存訪問(wèn)速度,托管Grace Hopper Superchips的計(jì)算底板使用定制線束連接到第一層NVLink結(jié)構(gòu),并由LinkX電纜擴(kuò)展第二層NVLink結(jié)構(gòu)的連接性。

wKgaomR4T9qAee_VAAV_ZSuKzJI711.png

在DGX GH200系統(tǒng)中,GPU線程可以使用NVLink頁(yè)表來(lái)訪問(wèn)來(lái)自其他Grace Hopper超級(jí)芯片的內(nèi)存,并通過(guò)NVIDIA Magnum IO加速庫(kù)來(lái)優(yōu)化GPU通信以提高效率。該系統(tǒng)擁有128 TBps的對(duì)分帶寬和230.4 TFLOPS的NVIDIA SHARP網(wǎng)內(nèi)計(jì)算,可加速AI常用的集體運(yùn)算,并將NVLink網(wǎng)絡(luò)系統(tǒng)的實(shí)際帶寬提高一倍。每個(gè)Grace Hopper Superchip都配備一個(gè)NVIDIA ConnectX-7網(wǎng)絡(luò)適配器和一個(gè)NVIDIA BlueField-3 NIC,以擴(kuò)展到超過(guò)256個(gè)GPU,可以互連多個(gè)DGX GH200系統(tǒng),并利用BlueField-3 DPU的功能將任何企業(yè)計(jì)算環(huán)境轉(zhuǎn)變?yōu)榘踩壹铀俚奶摂M私有云。

對(duì)于受GPU內(nèi)存大小瓶頸的AI和HPC應(yīng)用程序,GPU內(nèi)存的代際飛躍可以顯著提高性能。對(duì)于許多主流AI和HPC工作負(fù)載,單個(gè)NVIDIA DGX H100的聚合GPU內(nèi)存可以完全支持。對(duì)于其他工作負(fù)載,例如具有TB級(jí)嵌入式表的深度學(xué)習(xí)推薦模型(DLRM)、TB級(jí)圖形神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型或大型數(shù)據(jù)分析工作負(fù)載,使用DGX GH200可實(shí)現(xiàn)4至7倍的加速。這表明DGX GH200是更高級(jí)的AI和HPC模型的更好解決方案,這些模型需要海量?jī)?nèi)存來(lái)進(jìn)行GPU共享內(nèi)存編程。

wKgZomR4T9qAEumkAAKoiJRXjiw185.png

DGX GH200是專(zhuān)為最嚴(yán)苛的工作負(fù)載而設(shè)計(jì)的系統(tǒng),每個(gè)組件都經(jīng)過(guò)精心挑選,以最大限度地減少瓶頸,同時(shí)最大限度地提高關(guān)鍵工作負(fù)載的網(wǎng)絡(luò)性能,并充分利用所有擴(kuò)展硬件功能。這使得該系統(tǒng)具有高度的線性可擴(kuò)展性和海量共享內(nèi)存空間的高利用率。

為了充分利用這個(gè)先進(jìn)的系統(tǒng),NVIDIA還構(gòu)建了一個(gè)極高速的存儲(chǔ)結(jié)構(gòu),以峰值容量運(yùn)行并處理各種數(shù)據(jù)類(lèi)型(文本、表格數(shù)據(jù)、音頻和視頻),并且表現(xiàn)穩(wěn)定且并行。

DGX GH200附帶NVIDIA Base Command,其中包括針對(duì)AI工作負(fù)載優(yōu)化的操作系統(tǒng)、集群管理器、加速計(jì)算的庫(kù)、存儲(chǔ)和網(wǎng)絡(luò)基礎(chǔ)設(shè)施,這些都針對(duì)DGX GH200系統(tǒng)架構(gòu)進(jìn)行了優(yōu)化。此外,DGX GH200還包括NVIDIA AI Enterprise,提供一套經(jīng)過(guò)優(yōu)化的軟件和框架,可簡(jiǎn)化AI開(kāi)發(fā)和部署。這種全堆棧解決方案使客戶能夠?qū)W⒂趧?chuàng)新,而不必?fù)?dān)心管理其IT基礎(chǔ)架構(gòu)。

wKgaomR4T9uAY3W2AAjBZyIcGyc232.png



審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    4978

    瀏覽量

    102987
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268886
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3770

    瀏覽量

    90984
  • 超級(jí)芯片
    +關(guān)注

    關(guān)注

    0

    文章

    34

    瀏覽量

    8876
  • 生成式AI
    +關(guān)注

    關(guān)注

    0

    文章

    502

    瀏覽量

    471
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    NVIDIA 推出高性價(jià)比的生成 AI 超級(jí)計(jì)算機(jī)

    Jetson Orin Nano Super 可將生成 AI 性能提升至1.7 倍,支持科技愛(ài)好者、開(kāi)發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的
    發(fā)表于 12-18 17:01 ?294次閱讀
    <b class='flag-5'>NVIDIA</b> 推出高性價(jià)比的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b>計(jì)算機(jī)

    NVIDIA助力Amdocs打造生成AI智能體

    正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開(kāi)發(fā)和交付基于商用大語(yǔ)言模型(LLM)和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA
    的頭像 發(fā)表于 11-19 14:48 ?327次閱讀

    NVIDIA AI助力SAP生成AI助手Joule加速發(fā)展

    在美國(guó)佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會(huì)上,NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成
    的頭像 發(fā)表于 09-09 09:37 ?426次閱讀

    NVIDIA加速計(jì)算和生成AI領(lǐng)域的創(chuàng)新

    在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開(kāi)篇的一封信中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA加速計(jì)算和生成
    的頭像 發(fā)表于 09-09 09:18 ?544次閱讀

    NVIDIA攜手Meta推出AI服務(wù),企業(yè)提供生成AI服務(wù)

    NVIDIA近日宣布了一項(xiàng)重大舉措,正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM(NVIDIA Inference
    的頭像 發(fā)表于 07-25 16:57 ?532次閱讀

    NVIDIA AI Foundry 全球企業(yè)打造自定義 Llama 3.1 生成 AI 模型

    Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成 AI 模型服務(wù),以便部署自定義 Llama 3.1 NVIDI
    發(fā)表于 07-24 09:39 ?706次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>AI</b> Foundry <b class='flag-5'>為</b>全球企業(yè)打造自定義 Llama 3.1 <b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> 模型

    HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE,加速生成 AI 變革

    by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù),將簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程,加速生成
    的頭像 發(fā)表于 06-21 14:39 ?358次閱讀

    NVIDIA推出NVIDIA AI Computing by HPE加速生成 AI 變革

    簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程,加速生成 AI 的發(fā)展步伐。 NVIDIA
    的頭像 發(fā)表于 06-20 17:36 ?711次閱讀

    NVIDIA宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù)

    采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成 AI 微服務(wù),以
    的頭像 發(fā)表于 06-04 10:18 ?656次閱讀

    NVIDIA發(fā)布數(shù)字人微服務(wù),制作生成AI數(shù)字化身鋪平未來(lái)之路

    ? ? COMPUTEX—2024年6月2日— NVIDIA宣布全面推出NVIDIA ACE生成AI
    發(fā)表于 06-03 17:43 ?176次閱讀

    NVIDIA數(shù)字人技術(shù)加速部署生成AI驅(qū)動(dòng)的游戲角色

    NVIDIA 在 GDC 2024 大會(huì)上宣布,Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開(kāi)發(fā)者,正在使用 NVIDIA 數(shù)字人技術(shù)加速
    的頭像 發(fā)表于 04-09 10:08 ?662次閱讀
    <b class='flag-5'>NVIDIA</b>數(shù)字人技術(shù)<b class='flag-5'>加速</b>部署<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>驅(qū)動(dòng)的游戲角色

    NVIDIA生成AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

    NVIDIA 研究人員使 LATTE3D (一款最新文本轉(zhuǎn) 3D 生成 AI 模型)實(shí)現(xiàn)雙倍加速。
    的頭像 發(fā)表于 03-27 10:28 ?492次閱讀
    <b class='flag-5'>NVIDIA</b><b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>研究實(shí)現(xiàn)在1秒內(nèi)<b class='flag-5'>生成</b>3D形狀

    NVIDIA Isaac將生成AI應(yīng)用于制造業(yè)和物流業(yè)

    NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成 AI 和先進(jìn)的仿真技術(shù),加速 AI 機(jī)器人
    的頭像 發(fā)表于 03-22 10:06 ?528次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac將<b class='flag-5'>生成</b><b class='flag-5'>式</b><b class='flag-5'>AI</b>應(yīng)用于制造業(yè)和物流業(yè)

    SAP與NVIDIA攜手加速生成AI在企業(yè)應(yīng)用中的普及

    SAP SE 和 NVIDIA 宣布深化合作,致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成 AI 的變革力量。
    的頭像 發(fā)表于 03-22 10:02 ?598次閱讀

    NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的生成 AI 超級(jí)計(jì)算

    基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù),可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)
    發(fā)表于 03-19 10:56 ?421次閱讀
    <b class='flag-5'>NVIDIA</b> 推出 Blackwell 架構(gòu) DGX SuperPOD,適用于萬(wàn)億參數(shù)級(jí)的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b>計(jì)算
    RM新时代网站-首页