RM新时代注册,RM新时代专业团队

2023年是大語(yǔ)言模型、生成式AI、ChatGPT、AIGC大爆發(fā)的一年。GPU是大規(guī)模深度學(xué)習(xí)、高性能計(jì)算的重要硬件基礎(chǔ)，而大語(yǔ)言模型，如生成式AI、ChatGPT等，則借助GPU的計(jì)算能力快速地訓(xùn)練和推理，獲得更高的模型效果和更廣泛的應(yīng)用場(chǎng)景。尤其在游戲開(kāi)發(fā)領(lǐng)域，運(yùn)用大語(yǔ)言模型可以加強(qiáng)游戲的情節(jié)推進(jìn)、人工智能角色表現(xiàn)等方面的體驗(yàn)，而加速訓(xùn)練的英偉達(dá)GPU則可以使這些特征更加流暢。由于英偉達(dá)在GPU硬件設(shè)計(jì)和優(yōu)化方面的領(lǐng)先地位，為大型語(yǔ)言模型的快速發(fā)展提供了扎實(shí)的技術(shù)基礎(chǔ)。

目前中國(guó)和美國(guó)研發(fā)的大型AI模型數(shù)量占全球總數(shù)的80%以上，中國(guó)排名全球第二，僅次于美國(guó)，其中，已經(jīng)發(fā)布超過(guò)79個(gè)10億參數(shù)規(guī)模以上的大型AI模型。中國(guó)科學(xué)技術(shù)信息研究所所長(zhǎng)、科技部新一代人工智能發(fā)展研究中心主任趙志耘表示，我國(guó)前期在人工智能領(lǐng)域的各項(xiàng)部署，為大模型發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)，并已經(jīng)建立起涵蓋理論方法和軟硬件技術(shù)的體系化研發(fā)能力，形成了緊跟世界前沿的大模型技術(shù)群。

目前，我國(guó)參數(shù)規(guī)模在10億以上的大型AI模型數(shù)量達(dá)到79個(gè)，并且地域和領(lǐng)域分布相對(duì)于集中，全國(guó)14個(gè)省市/地區(qū)都在開(kāi)展大模型研發(fā)，主要集中在北京和廣東兩地，其中北京28個(gè)，廣東22個(gè)。同時(shí)，大模型應(yīng)用也在不斷拓展和深化落地。一方面，通用領(lǐng)域大模型如文心一言、通義千問(wèn)、紫東太初、星火認(rèn)知等正在快速發(fā)展，打造跨行業(yè)通用化人工智能能力平臺(tái)，其應(yīng)用行業(yè)在辦公、生活、娛樂(lè)向醫(yī)療、工業(yè)、教育等加速滲透；另一方面，針對(duì)生物制藥、遙感、氣象等垂直領(lǐng)域的專(zhuān)用大模型，發(fā)揮其領(lǐng)域縱深優(yōu)勢(shì)，提供針對(duì)特定業(yè)務(wù)場(chǎng)景的高質(zhì)量專(zhuān)業(yè)化解決方案。

5月29日，英偉達(dá)在2023臺(tái)北電腦展大會(huì)推出了DGX GH200 AI超級(jí)計(jì)算機(jī)，這是配備256顆Grace Hopper超級(jí)芯片和NVIDIA NVLink交換機(jī)系統(tǒng)的尖端系統(tǒng)，具有1 exaflop性能和144TB共享內(nèi)存。該超級(jí)計(jì)算機(jī)的推出，在人工智能領(lǐng)域引起了轟動(dòng)，標(biāo)志著英偉達(dá)在大型AI模型技術(shù)和硬件設(shè)計(jì)領(lǐng)域的再次領(lǐng)先。其強(qiáng)大的計(jì)算和網(wǎng)絡(luò)技術(shù)，為生成式AI、大型語(yǔ)言模型和推薦系統(tǒng)的應(yīng)用和開(kāi)發(fā)帶來(lái)了更廣闊的前景，進(jìn)一步拓展了AI的邊界。此外，DGX GH200還是第一臺(tái)Grace Hopper超級(jí)芯片和NVLink交換機(jī)系統(tǒng)配對(duì)的超級(jí)計(jì)算機(jī)，其帶寬較之前顯卡相比多48倍，為人工智能先驅(qū)和云服務(wù)提供商打開(kāi)了探索新領(lǐng)域的大門(mén)。

DGX GH200與生成式AI

英偉達(dá)發(fā)布了一系列面向生成式AI的產(chǎn)品和服務(wù)，包括大內(nèi)存生成式AI超級(jí)計(jì)算機(jī)DGX GH200、Grace Hopper超級(jí)芯片GH200的全面投產(chǎn)、全新加速以太網(wǎng)平臺(tái)Spectrum-X、定制化AI模型代工服務(wù)、與WPP合作打造生成式AI內(nèi)容引擎等，多項(xiàng)舉措都為生成式AI的應(yīng)用與發(fā)展提供了更廣闊的前景。

此外，英偉達(dá)還發(fā)布了MGX服務(wù)器規(guī)范，并且已有1600多家生成式AI公司采用了英偉達(dá)技術(shù)。

目前，英偉達(dá)市值已經(jīng)達(dá)到9632億美元，僅差一步之遙即可加入“萬(wàn)億市值俱樂(lè)部”，成為美國(guó)上市公司市值排名第五的企業(yè)和第一家由華人創(chuàng)立的萬(wàn)億美元市值公司。

E級(jí)算力，谷歌云、Meta、微軟首批試用

英偉達(dá)日前發(fā)布了一款采用最新GPU和CPU的系統(tǒng)巔峰之作——新型大內(nèi)存AI超級(jí)計(jì)算機(jī)DGX GH200，預(yù)計(jì)于今年年底上市。

該超算旨在支持生成式AI語(yǔ)言應(yīng)用、推薦系統(tǒng)和數(shù)據(jù)分析工作負(fù)載的大型下一代模型。DGX GH200集成了先進(jìn)的加速計(jì)算和網(wǎng)絡(luò)技術(shù)，是首款將Grace Hopper超級(jí)芯片與英偉達(dá)NVLink Switch系統(tǒng)搭配的超級(jí)計(jì)算機(jī)。

采用新互連方式，256個(gè)Grace Hopper超級(jí)芯片可以像單個(gè)巨型GPU一樣協(xié)同運(yùn)行，提供了1EFLOPS性能和144TB共享內(nèi)存，比上一代DGX A100 320GB系統(tǒng)的內(nèi)存多出近500倍。

谷歌云、Meta、微軟等是首批獲得訪問(wèn)權(quán)限的公司，英偉達(dá)打算將DGX GH200設(shè)計(jì)藍(lán)圖提供給其他云服務(wù)商及超大規(guī)模計(jì)算廠商，以便他們進(jìn)一步為其基礎(chǔ)設(shè)施定制DGX GH200。

英偉達(dá)還正在打造自己的基于DGX GH200的大型AI超級(jí)計(jì)算機(jī)NVIDIA Helios，將于今年年底上線。此外，DGX GH200超級(jí)計(jì)算機(jī)包含英偉達(dá)軟件，提供AI工作流管理、企業(yè)級(jí)集群管理、加速計(jì)算、存儲(chǔ)和網(wǎng)絡(luò)基礎(chǔ)設(shè)施庫(kù)，以及100多個(gè)框架、預(yù)訓(xùn)練模型和開(kāi)發(fā)工具，以簡(jiǎn)化AI生產(chǎn)的開(kāi)發(fā)和部署。

英偉達(dá)的Base Command軟件可以幫助管理AI工作流程、企業(yè)級(jí)集群、加速計(jì)算和存儲(chǔ)、網(wǎng)絡(luò)基礎(chǔ)設(shè)施等，而AI Enterprise軟件層則提供了許多框架、預(yù)訓(xùn)練模型和開(kāi)發(fā)工具，以簡(jiǎn)化AI生產(chǎn)的開(kāi)發(fā)和部署。DGX GH200超級(jí)計(jì)算機(jī)的推出將有助于推動(dòng)AI技術(shù)的發(fā)展，為各行各業(yè)提供更快、更強(qiáng)大的AI計(jì)算能力，加速AI技術(shù)的應(yīng)用和落地。

GH200芯片全面投產(chǎn)

英偉達(dá)日前宣布，已全面投產(chǎn)GH200 Grace Hopper超級(jí)芯片，將為AI和高性能計(jì)算工作負(fù)載提供動(dòng)力。

基于GH200的系統(tǒng)已經(jīng)被全球制造商采用，提供了超過(guò)400個(gè)配置，這些系統(tǒng)都基于英偉達(dá)的最新Grace Hopper和Ada Lovelace架構(gòu)。

GH200 Grace Hopper超級(jí)芯片采用了NVIDIA NVLink-C2C互連技術(shù)，將英偉達(dá)Grace CPU和Hopper GPU架構(gòu)組合在同一封裝中，提供高達(dá)900GB/s的總帶寬，比傳統(tǒng)加速系統(tǒng)中的標(biāo)準(zhǔn)PCIe Gen5通道帶寬高7倍，同時(shí)互連功耗降低到原來(lái)的1/5，能夠滿足苛刻的生成式AI和高性能計(jì)算（HPC）應(yīng)用。預(yù)計(jì)幾家全球超大規(guī)模計(jì)算企業(yè)和超算中心客戶將采用GH200驅(qū)動(dòng)的系統(tǒng)，這些系統(tǒng)將于今年晚些時(shí)候上市。

打造數(shù)億美元生成式AI超算

此外，黃仁勛還宣布推出NVIDIA Spectrum-X平臺(tái)，旨在提高基于以太網(wǎng)的AI云的性能和效率。

Spectrum-X基于網(wǎng)絡(luò)創(chuàng)新，將英偉達(dá)Spectrum-4交換機(jī)和BlueField-3 DPU緊密耦合，實(shí)現(xiàn)了1.7倍的整體AI性能和能效提升，并通過(guò)性能隔離增強(qiáng)了多租戶功能，保持一致和可預(yù)測(cè)的性能。

Spectrum-X具有高度通用性，能夠用于各種AI應(yīng)用，與基于以太網(wǎng)的堆?；ゲ僮?，支持開(kāi)發(fā)者構(gòu)建軟件定義的云原生AI應(yīng)用程序。全球各大云計(jì)算提供商正在采用Spectrum-X平臺(tái)擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。

NVIDIA正在以色列數(shù)據(jù)中心構(gòu)建一臺(tái)超大規(guī)模生成式AI超級(jí)計(jì)算機(jī)Israel-1作為Spectrum-X參考設(shè)計(jì)的藍(lán)圖和測(cè)試平臺(tái)。該超算將采用戴爾PowerEdge XE9680服務(wù)器、英偉達(dá)HGX H100超級(jí)計(jì)算平臺(tái)、內(nèi)置BlueField-3 DPU和Spectrum-4交換機(jī)的Spectrum-X平臺(tái)，預(yù)計(jì)價(jià)值數(shù)億美元。該平臺(tái)支持256個(gè)200Gb/s端口通過(guò)單個(gè)交換機(jī)連接，或在兩層leaf-spine拓?fù)渲刑峁?6000個(gè)端口，以支持AI云的增長(zhǎng)和擴(kuò)展，同時(shí)保持高水平的性能并最大限度地減少網(wǎng)絡(luò)延遲。

全球領(lǐng)先的云計(jì)算提供商正在采用Spectrum-X平臺(tái)擴(kuò)展生成式AI服務(wù)。Spectrum-X、Spectrum-4交換機(jī)、BlueField-3 DPU等現(xiàn)已在戴爾、聯(lián)想、超微等系統(tǒng)制造商處提供。

MGX服務(wù)器規(guī)范

模塊化參考架構(gòu)

黃仁勛同時(shí)發(fā)布了NVIDIA MGX服務(wù)器規(guī)范，為系統(tǒng)制造商提供了模塊化參考架構(gòu)，以適應(yīng)廣泛的AI、HPC及NVIDIA Omniverse應(yīng)用。

MGX支持英偉達(dá)全系列GPU、CPU、DPU和網(wǎng)絡(luò)適配器，以及各種x86及Arm 處理器，這使得制造商能夠更有效地滿足每個(gè)客戶的獨(dú)特預(yù)算、電力輸送、熱設(shè)計(jì)和機(jī)械要求。

永擎（ASRock Rack）、華碩（ASUS）、技嘉（GIGABYTE）、和碩（Pegatron）、QCT、超微（Supermicro）等將采用MGX構(gòu)建下一代加速計(jì)算機(jī)，可將開(kāi)發(fā)成本削減多達(dá)3/4，并將開(kāi)發(fā)時(shí)間縮短2/3至僅需6個(gè)月。MGX可以從為其服務(wù)器機(jī)箱加速計(jì)算優(yōu)化的基本系統(tǒng)架構(gòu)開(kāi)始，然后選擇GPU、DPU和CPU。同時(shí)，MGX提供了英偉達(dá)產(chǎn)品靈活的多代兼容性，以確保制造商可以重用現(xiàn)有設(shè)計(jì)并輕松采用下一代產(chǎn)品。MGX還能輕松集成到云和企業(yè)數(shù)據(jù)中心中。

除了MGX規(guī)范外，黃仁勛還宣布，英偉達(dá)與日本電信巨頭軟銀合作，在日本建立一個(gè)分布式數(shù)據(jù)中心網(wǎng)絡(luò)。該網(wǎng)絡(luò)將在一個(gè)共同的云平臺(tái)上提供5G服務(wù)和生成式AI應(yīng)用。數(shù)據(jù)中心將使用MGX系列（包括Grace Hopper、BlueField-3 DPU和Spectrum以太網(wǎng)交換機(jī)）以提供5G協(xié)議所需的高精度定時(shí)，并提高頻譜效率以降低成本和能耗。

這些系統(tǒng)有助于探索自動(dòng)駕駛、AI工廠、AR/VR、計(jì)算機(jī)視覺(jué)和數(shù)字孿生等領(lǐng)域的應(yīng)用。未來(lái)的用途可能包括3D視頻會(huì)議和全息通信。這將為這些領(lǐng)域提供更高效、更靈活和更先進(jìn)的解決方案，推動(dòng)技術(shù)和產(chǎn)業(yè)的發(fā)展。

GH200在游戲行業(yè)的應(yīng)用

黃仁勛在宣布推出針對(duì)游戲的Avatar云引擎（ACE）服務(wù)，這是一項(xiàng)定制AI模型代工服務(wù)，中間件、工具和游戲開(kāi)發(fā)者可以使用它來(lái)構(gòu)建和部署定制的語(yǔ)音、對(duì)話和動(dòng)畫(huà)AI模型。

ACE能賦予非玩家角色（NPC）更智能且不斷進(jìn)化的對(duì)話技能，使其能夠以栩栩如生的個(gè)性來(lái)回答玩家的問(wèn)題。ACE for Games為語(yǔ)音、對(duì)話和角色動(dòng)畫(huà)提供了優(yōu)化的AI基礎(chǔ)模型，包括：英偉達(dá)NeMo，使用專(zhuān)有數(shù)據(jù)，構(gòu)建、定制和部署語(yǔ)言模型；英偉達(dá)Riva，用于自動(dòng)語(yǔ)音識(shí)別和文本轉(zhuǎn)語(yǔ)音，以實(shí)現(xiàn)實(shí)時(shí)語(yǔ)音對(duì)話；英偉達(dá)Omniverse Audio2Face，用于即時(shí)創(chuàng)建游戲角色的表情動(dòng)畫(huà)，以匹配任何語(yǔ)音軌道。

此外，英偉達(dá)與其子公司Convai合作，展示了如何快速用英偉達(dá)ACE for Games來(lái)構(gòu)建游戲NPU。在名為“Kairos”的演示中，英偉達(dá)展示了一個(gè)與一個(gè)拉面店的供應(yīng)商Jin互動(dòng)的游戲。基于生成式AI，Jin雖是個(gè)NPC，卻能擬真地回答自然語(yǔ)言問(wèn)題，且回答內(nèi)容與敘述的背景故事一致。開(kāi)發(fā)人員可以集成整個(gè)NVIDIA ACE for Games解決方案，也可以只使用他們需要的組件。多家游戲開(kāi)發(fā)商和初創(chuàng)公司已采用英偉達(dá)的生成式AI技術(shù)。

黃仁勛還介紹了英偉達(dá)和微軟如何在生成式AI時(shí)代合作推動(dòng)Windows PC的創(chuàng)新。新的和增強(qiáng)的工具、框架和驅(qū)動(dòng)程序使PC開(kāi)發(fā)者更容易開(kāi)發(fā)和部署AI，例如用于優(yōu)化和部署GPU加速AI模型和新圖形驅(qū)動(dòng)程序的微軟Olive工具鏈將提高帶有英偉達(dá)GPU的Windows PC上的DirectML性能。此次合作將增強(qiáng)和擴(kuò)展搭載RTX GPU的1億臺(tái)PC的安裝基礎(chǔ)，可提升400多個(gè)AI加速的Windows應(yīng)用程序和游戲的性能。這將為PC游戲帶來(lái)更高的性能和更好的體驗(yàn)，同時(shí)也將推動(dòng)AI在Windows PC上的應(yīng)用和發(fā)展。

總的來(lái)說(shuō)，黃仁勛在宣布中介紹了NVIDIA在游戲AI方面的最新進(jìn)展和合作，包括Avatar云引擎（ACE）服務(wù)、微軟合作推動(dòng)Windows PC的創(chuàng)新等。這些技術(shù)和合作將為游戲開(kāi)發(fā)者帶來(lái)更多的AI工具和解決方案，為玩家?guī)?lái)更好的游戲體驗(yàn)。

DGX GH200在數(shù)字廣告中的應(yīng)用

英偉達(dá)的生成式AI技術(shù)也將在數(shù)字廣告行業(yè)帶來(lái)新機(jī)遇?；贜VIDIA AI和Omniverse技術(shù)的引擎將多個(gè)創(chuàng)意3D和AI工具連接在一起，以大規(guī)模革新商業(yè)內(nèi)容和體驗(yàn)。

英國(guó)WPP集團(tuán)，全球最大的營(yíng)銷(xiāo)服務(wù)機(jī)構(gòu)，正與英偉達(dá)合作，利用Omniverse Cloud構(gòu)建首個(gè)生成式AI內(nèi)容引擎，以更高效和高質(zhì)量的方式為客戶創(chuàng)建商業(yè)內(nèi)容。

新引擎連接了來(lái)自Adobe和Getty Images等工具的3D設(shè)計(jì)、制造和創(chuàng)意供應(yīng)鏈工具的生態(tài)系統(tǒng)。黃仁勛在演講中展示了創(chuàng)意團(tuán)隊(duì)如何將他們的3D設(shè)計(jì)工具連接在一起，并在Omniverse中構(gòu)建客戶產(chǎn)品的數(shù)字孿生。使用負(fù)責(zé)任的數(shù)據(jù)來(lái)源訓(xùn)練生成式AI技術(shù)并結(jié)合英偉達(dá)Picasso一起構(gòu)建，使其能夠快速生成虛擬集。此后，WPP客戶可利用完整的場(chǎng)景生成大量廣告、視頻和3D體驗(yàn)，供全球市場(chǎng)和用戶在任何網(wǎng)絡(luò)設(shè)備上使用。

這項(xiàng)合作在數(shù)字廣告領(lǐng)域持續(xù)推動(dòng)著生成式AI技術(shù)的發(fā)展。WPP首席執(zhí)行官馬克·里德表示，生成式AI技術(shù)正在以驚人的速度改變營(yíng)銷(xiāo)世界，合作所提供的獨(dú)特競(jìng)爭(zhēng)優(yōu)勢(shì)將改變品牌為商業(yè)用途創(chuàng)建內(nèi)容的方式，并鞏固WPP在為世界頂級(jí)品牌創(chuàng)造性應(yīng)用AI方面的行業(yè)領(lǐng)導(dǎo)地位。

DGX GH200在

電子制造商中的應(yīng)用

全球電子制造商正在使用一種全新的綜合參考工作流程，這種工作流程結(jié)合了英偉達(dá)的多種技術(shù)，包括生成式AI、3D協(xié)作、仿真和自主機(jī)器，旨在幫助制造商規(guī)劃、構(gòu)建、運(yùn)營(yíng)和優(yōu)化他們的工廠。這些技術(shù)包括英偉達(dá)的Omniverse，它連接了頂級(jí)計(jì)算機(jī)輔助設(shè)計(jì)和生成式AI的API和前沿框架；英偉達(dá)的Isaac Sim應(yīng)用程序，用于模擬和測(cè)試機(jī)器人；英偉達(dá)的Metropolis視覺(jué)AI框架，用于自動(dòng)光學(xué)檢測(cè)。

英偉達(dá)使電子制造商能夠輕松構(gòu)建和運(yùn)營(yíng)虛擬工廠，將其制造和檢驗(yàn)工作流程數(shù)字化，并大大提高質(zhì)量和安全，減少代價(jià)高昂的最后一刻意外和延誤。黃仁勛在現(xiàn)場(chǎng)展示了一個(gè)完全數(shù)字化的智能工廠的演示。

富士康工業(yè)互聯(lián)網(wǎng)、宜鼎國(guó)際、和碩、廣達(dá)和緯創(chuàng)正在使用英偉達(dá)的參考工作流程，以優(yōu)化他們的工作單元和裝配線運(yùn)營(yíng)，同時(shí)降低生產(chǎn)成本，具體用例包括電路板質(zhì)保檢測(cè)點(diǎn)自動(dòng)化、光學(xué)檢測(cè)自動(dòng)化、建設(shè)虛擬工廠、模擬協(xié)作機(jī)器人、構(gòu)建及運(yùn)營(yíng)數(shù)字孿生等。

英偉達(dá)正在與幾家領(lǐng)先的制造工具和服務(wù)提供商合作，構(gòu)建一個(gè)全棧、單一的架構(gòu)，每個(gè)架構(gòu)都適用于每個(gè)工作流程級(jí)別。

在系統(tǒng)層面，英偉達(dá)IGX Orin提供了一個(gè)一體化的邊緣AI平臺(tái)，將工業(yè)級(jí)硬件與企業(yè)級(jí)軟件和支持相結(jié)合。IGX滿足邊緣計(jì)算獨(dú)特的耐用性和低功耗要求，同時(shí)提供開(kāi)發(fā)和運(yùn)行AI應(yīng)用程序所需的高性能。其制造商合作伙伴們正在開(kāi)發(fā)IGX驅(qū)動(dòng)的系統(tǒng)，以服務(wù)于工業(yè)和醫(yī)療市場(chǎng)。

在平臺(tái)層面，Omniverse連接了世界領(lǐng)先的3D、模擬和生成式AI提供商，團(tuán)隊(duì)可在他們最喜歡的應(yīng)用程序之間構(gòu)建互操作性，比如來(lái)自Adobe、Autodesk和Siemens的應(yīng)用程序。

這些技術(shù)的整合使得制造商能夠在一個(gè)統(tǒng)一的平臺(tái)上進(jìn)行設(shè)計(jì)、仿真、測(cè)試和生產(chǎn)，從而大大提高效率和質(zhì)量。此外，英偉達(dá)還提供了一系列工具和服務(wù)，幫助制造商管理和優(yōu)化他們的生產(chǎn)線，包括實(shí)時(shí)監(jiān)控、數(shù)據(jù)分析和預(yù)測(cè)性維護(hù)。

英偉達(dá)的數(shù)字化工廠解決方案不僅適用于電子制造業(yè)，還可以應(yīng)用于其他行業(yè)，如汽車(chē)制造、航空航天、醫(yī)療設(shè)備等。這些行業(yè)都需要高度自動(dòng)化和數(shù)字化的生產(chǎn)線，以滿足不斷增長(zhǎng)的市場(chǎng)需求和質(zhì)量標(biāo)準(zhǔn)。

GH200產(chǎn)品參數(shù)

GH200是英偉達(dá)推出的最新超級(jí)計(jì)算機(jī)，最多可以放置256個(gè)GPU，適用于超大型AI模型的部署。相比之前的DGX服務(wù)器，GH200提供線性拓展方式和更高的GPU共享內(nèi)存編程模型，可通過(guò)NVLink高速訪問(wèn)144TB內(nèi)存，是上一代DGX的500倍。其架構(gòu)提供的NVLink帶寬是上一代的48倍，使得千億或萬(wàn)億參數(shù)以上的大模型能夠在一臺(tái)DGX內(nèi)放置，進(jìn)一步提高模型效率和多模態(tài)模型的開(kāi)發(fā)進(jìn)程。

GPU的統(tǒng)一內(nèi)存編程模型一直是復(fù)雜加速計(jì)算應(yīng)用取得突破的基石。NVIDIA Grace Hopper Superchip與NVLink開(kāi)關(guān)系統(tǒng)配對(duì)，在NVIDIA DGX GH200系統(tǒng)中整合了256個(gè)GPU，通過(guò)NVLink高速訪問(wèn)144TB內(nèi)存。與單個(gè)NVIDIA DGX A100 320 GB系統(tǒng)相比，NVIDIA DGX GH200為GPU共享內(nèi)存編程模型提供了近500倍的內(nèi)存，是突破GPU通過(guò)NVLink訪問(wèn)內(nèi)存的100TB障礙的第一臺(tái)超級(jí)計(jì)算機(jī)。NVIDIA Base Command的快速部署和簡(jiǎn)化系統(tǒng)管理使用戶能夠更快地進(jìn)行加速計(jì)算。

NVIDIA DGX GH200系統(tǒng)采用了NVIDIA Grace Hopper Superchip和NVLink Switch System作為其構(gòu)建塊。NVIDIA Grace Hopper Superchip將CPU和GPU結(jié)合在一起，使用NVIDIA NVLink-C2C技術(shù)提供一致性內(nèi)存模型，并提供高帶寬和無(wú)縫的多GPU系統(tǒng)。每個(gè)Grace Hopper超級(jí)芯片都擁有480GB的LPDDR5 CPU內(nèi)存和96GB的快速HBM3，提供比PCIe Gen5多7倍的帶寬，與NVLink-C2C互連。

NVLink開(kāi)關(guān)系統(tǒng)使用第四代NVLink技術(shù)，將NVLink連接擴(kuò)展到超級(jí)芯片，以創(chuàng)建一個(gè)兩級(jí)、無(wú)阻塞、NVLink結(jié)構(gòu)，可完全連接256個(gè)Grace Hopper超級(jí)芯片。這種結(jié)構(gòu)提供900GBps的內(nèi)存訪問(wèn)速度，托管Grace Hopper Superchips的計(jì)算底板使用定制線束連接到第一層NVLink結(jié)構(gòu)，并由LinkX電纜擴(kuò)展第二層NVLink結(jié)構(gòu)的連接性。

在DGX GH200系統(tǒng)中，GPU線程可以使用NVLink頁(yè)表來(lái)訪問(wèn)來(lái)自其他Grace Hopper超級(jí)芯片的內(nèi)存，并通過(guò)NVIDIA Magnum IO加速庫(kù)來(lái)優(yōu)化GPU通信以提高效率。該系統(tǒng)擁有128 TBps的對(duì)分帶寬和230.4 TFLOPS的NVIDIA SHARP網(wǎng)內(nèi)計(jì)算，可加速AI常用的集體運(yùn)算，并將NVLink網(wǎng)絡(luò)系統(tǒng)的實(shí)際帶寬提高一倍。每個(gè)Grace Hopper Superchip都配備一個(gè)NVIDIA ConnectX-7網(wǎng)絡(luò)適配器和一個(gè)NVIDIA BlueField-3 NIC，以擴(kuò)展到超過(guò)256個(gè)GPU，可以互連多個(gè)DGX GH200系統(tǒng)，并利用BlueField-3 DPU的功能將任何企業(yè)計(jì)算環(huán)境轉(zhuǎn)變?yōu)榘踩壹铀俚奶摂M私有云。

對(duì)于受GPU內(nèi)存大小瓶頸的AI和HPC應(yīng)用程序，GPU內(nèi)存的代際飛躍可以顯著提高性能。對(duì)于許多主流AI和HPC工作負(fù)載，單個(gè)NVIDIA DGX H100的聚合GPU內(nèi)存可以完全支持。對(duì)于其他工作負(fù)載，例如具有TB級(jí)嵌入式表的深度學(xué)習(xí)推薦模型(DLRM)、TB級(jí)圖形神經(jīng)網(wǎng)絡(luò)訓(xùn)練模型或大型數(shù)據(jù)分析工作負(fù)載，使用DGX GH200可實(shí)現(xiàn)4至7倍的加速。這表明DGX GH200是更高級(jí)的AI和HPC模型的更好解決方案，這些模型需要海量?jī)?nèi)存來(lái)進(jìn)行GPU共享內(nèi)存編程。

DGX GH200是專(zhuān)為最嚴(yán)苛的工作負(fù)載而設(shè)計(jì)的系統(tǒng)，每個(gè)組件都經(jīng)過(guò)精心挑選，以最大限度地減少瓶頸，同時(shí)最大限度地提高關(guān)鍵工作負(fù)載的網(wǎng)絡(luò)性能，并充分利用所有擴(kuò)展硬件功能。這使得該系統(tǒng)具有高度的線性可擴(kuò)展性和海量共享內(nèi)存空間的高利用率。

為了充分利用這個(gè)先進(jìn)的系統(tǒng)，NVIDIA還構(gòu)建了一個(gè)極高速的存儲(chǔ)結(jié)構(gòu)，以峰值容量運(yùn)行并處理各種數(shù)據(jù)類(lèi)型（文本、表格數(shù)據(jù)、音頻和視頻），并且表現(xiàn)穩(wěn)定且并行。

DGX GH200附帶NVIDIA Base Command，其中包括針對(duì)AI工作負(fù)載優(yōu)化的操作系統(tǒng)、集群管理器、加速計(jì)算的庫(kù)、存儲(chǔ)和網(wǎng)絡(luò)基礎(chǔ)設(shè)施，這些都針對(duì)DGX GH200系統(tǒng)架構(gòu)進(jìn)行了優(yōu)化。此外，DGX GH200還包括NVIDIA AI Enterprise，提供一套經(jīng)過(guò)優(yōu)化的軟件和框架，可簡(jiǎn)化AI開(kāi)發(fā)和部署。這種全堆棧解決方案使客戶能夠?qū)Ｗ⒂趧?chuàng)新，而不必?fù)?dān)心管理其IT基礎(chǔ)架構(gòu)。

審核編輯：湯梓紅

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

NVIDIA

NVIDIA

+關(guān)注

關(guān)注
14

文章
4978

瀏覽量
102987
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886
英偉達(dá)

英偉達(dá)

+關(guān)注

關(guān)注
22

文章
3770

瀏覽量
90984
超級(jí)芯片

超級(jí)芯片

+關(guān)注

關(guān)注
0

文章
34

瀏覽量
8876
生成式AI

生成式AI

+關(guān)注

關(guān)注
0

文章
502

瀏覽量
471

評(píng)論

相關(guān)推薦

NVIDIA 推出高性價(jià)比的生成式 AI 超級(jí)計(jì)算機(jī)

Jetson Orin Nano Super 可將生成式 AI 性能提升至1.7 倍，支持科技愛(ài)好者、開(kāi)發(fā)者和學(xué)生使用的主流模型。 ? ? NVIDIA 推出了一款全新的尺寸小巧的

發(fā)表于 12-18 17:01 ?294次閱讀

<b class='flag-5'>NVIDIA</b> 推出高性價(jià)比的<b class='flag-5'>生成</b><b class='flag-5'>式</b> <b class='flag-5'>AI</b> <b class='flag-5'>超級(jí)</b>計(jì)算機(jī)

NVIDIA助力Amdocs打造生成式AI智能體

正在使用NVIDIA DGX Cloud 與 NVIDIA AI Enterprise軟件開(kāi)發(fā)和交付基于商用大語(yǔ)言模型（LLM）和領(lǐng)域適配模型的解決方案。該公司還在使用NVIDIA

發(fā)表于 11-19 14:48 ?327次閱讀

NVIDIA AI助力SAP生成式AI助手Joule加速發(fā)展

在美國(guó)佛羅里達(dá)州奧蘭多舉行的 SAP Sapphire 大會(huì)上，NVIDIA 與這家企業(yè)軟件公司公布了搭載NVIDIA AI Enterprise軟件的生成

發(fā)表于 09-09 09:37 ?426次閱讀

NVIDIA在加速計(jì)算和生成式AI領(lǐng)域的創(chuàng)新

在最新發(fā)布的公司 2024 財(cái)年可持續(xù)發(fā)展報(bào)告開(kāi)篇的一封信中，NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛介紹了 NVIDIA 在加速計(jì)算和生成式

發(fā)表于 09-09 09:18 ?544次閱讀

NVIDIA攜手Meta推出AI服務(wù)，為企業(yè)提供生成式AI服務(wù)

NVIDIA近日宣布了一項(xiàng)重大舉措，正式推出NVIDIA AI Foundry服務(wù)與NVIDIA NIM（NVIDIA Inference

發(fā)表于 07-25 16:57 ?532次閱讀

NVIDIA AI Foundry 為全球企業(yè)打造自定義 Llama 3.1 生成式 AI 模型

Foundry 提供從數(shù)據(jù)策管、合成數(shù)據(jù)生成、微調(diào)、檢索、防護(hù)到評(píng)估的全方位生成式 AI 模型服務(wù)，以便部署自定義 Llama 3.1 NVIDI

發(fā)表于 07-24 09:39 ?706次閱讀

HPE 攜手 NVIDIA 推出 NVIDIA AI Computing by HPE，加速生成式 AI 變革

by HPE 包含了可持續(xù)的加速計(jì)算產(chǎn)品組合以及全生命周期服務(wù)，將簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程，加速生成式

發(fā)表于 06-21 14:39 ?358次閱讀

NVIDIA推出NVIDIA AI Computing by HPE加速生成式 AI 變革

簡(jiǎn)化 AI 創(chuàng)造價(jià)值的過(guò)程，加速生成式 AI 的發(fā)展步伐。 NVIDIA

發(fā)表于 06-20 17:36 ?711次閱讀

NVIDIA宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)

采用 NVIDIA 宣布全面推出 NVIDIA ACE 生成式 AI 微服務(wù)，以

發(fā)表于 06-04 10:18 ?656次閱讀

NVIDIA發(fā)布數(shù)字人微服務(wù)，為制作生成式AI數(shù)字化身鋪平未來(lái)之路

? ? COMPUTEX—2024年6月2日— NVIDIA宣布全面推出NVIDIA ACE生成式AI

發(fā)表于 06-03 17:43 ?176次閱讀

NVIDIA數(shù)字人技術(shù)加速部署生成式AI驅(qū)動(dòng)的游戲角色

NVIDIA 在 GDC 2024 大會(huì)上宣布，Inworld AI 等領(lǐng)先的 AI 應(yīng)用程序開(kāi)發(fā)者，正在使用 NVIDIA 數(shù)字人技術(shù)加速

發(fā)表于 04-09 10:08 ?662次閱讀

NVIDIA生成式AI研究實(shí)現(xiàn)在1秒內(nèi)生成3D形狀

NVIDIA 研究人員使 LATTE3D （一款最新文本轉(zhuǎn) 3D 生成式 AI 模型）實(shí)現(xiàn)雙倍加速。

發(fā)表于 03-27 10:28 ?492次閱讀

NVIDIA Isaac將生成式AI應(yīng)用于制造業(yè)和物流業(yè)

NVIDIA Isaac 機(jī)器人平臺(tái)利用最新的生成式 AI 和先進(jìn)的仿真技術(shù)，加速 AI 機(jī)器人

發(fā)表于 03-22 10:06 ?528次閱讀

SAP與NVIDIA攜手加速生成式AI在企業(yè)應(yīng)用中的普及

SAP SE 和 NVIDIA 宣布深化合作，致力于加速企業(yè)客戶在 SAP 云解決方案和應(yīng)用組合中利用數(shù)據(jù)和生成式 AI 的變革力量。

發(fā)表于 03-22 10:02 ?598次閱讀

NVIDIA 推出 Blackwell 架構(gòu) DGX SuperPOD，適用于萬(wàn)億參數(shù)級(jí)的生成式 AI 超級(jí)計(jì)算

基于先進(jìn)的 NVIDIA 網(wǎng)絡(luò)、NVIDIA 全棧 AI 軟件和存儲(chǔ)技術(shù)，可將集群中 Grace Blackwell 超級(jí)芯片的數(shù)量擴(kuò)展至數(shù)

發(fā)表于 03-19 10:56 ?421次閱讀