電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))從近年來(lái)新發(fā)布的超算機(jī)器和新的HPC AI性能榜單可以看出,AI算力已經(jīng)在超算中成了不可忽視的性能指標(biāo)之一,但也為廠商帶來(lái)了更大的成本挑戰(zhàn)。比如微軟近期就爆出和OpenAI合作,打造一個(gè)千億美元級(jí)別的超算系統(tǒng)。
千億美元打造AI超算
根據(jù)外媒報(bào)道,此次打造的千億美元超算系統(tǒng)名為Stargate,星門(mén)。這一超算系統(tǒng)僅僅只是微軟和OpenAI一系列數(shù)據(jù)中心合作項(xiàng)目之一,但造價(jià)已經(jīng)高到離譜了。從規(guī)模上看,這個(gè)超算的硬件配置已經(jīng)到了遠(yuǎn)超現(xiàn)有系統(tǒng)的程度。據(jù)爆料,星門(mén)將集成百億個(gè)最新的英偉達(dá)GPU,造價(jià)可能會(huì)達(dá)到1150億美元。不過(guò)在互聯(lián)方案上,微軟可能會(huì)跳過(guò)英偉達(dá)的InfiniBand專(zhuān)用方案,而采用更加通用以太網(wǎng)方案。
當(dāng)然了,雖然總成本較高,但微軟并沒(méi)有一次建成的部署策略,而是分拆成五個(gè)階段,整個(gè)項(xiàng)目在2028年成功建成。這樣可以盡早讓該系統(tǒng)投入使用,畢竟對(duì)于新的模型而言,率先發(fā)布才不會(huì)錯(cuò)失市場(chǎng)機(jī)會(huì)。這或許也與微軟采用通用的以太網(wǎng)方案有關(guān),畢竟面對(duì)跨度如此長(zhǎng)的方案而言,專(zhuān)用方案很可能會(huì)面臨被兼容性差和被淘汰的局面。微軟預(yù)計(jì)會(huì)在第四階段,也就是2026年左右,正式啟用這一超算系統(tǒng)。
除此之外,超算的部署地點(diǎn)依然待定,這無(wú)疑與部署地的電網(wǎng)供電能力息息相關(guān),當(dāng)?shù)卣绻芴峁┲С肿匀蛔詈?。不過(guò)從硬件規(guī)模來(lái)看,單系統(tǒng)的耗電已經(jīng)達(dá)到千兆瓦級(jí),無(wú)論是對(duì)美國(guó)哪個(gè)州而言,都是巨大的供電挑戰(zhàn)。也正因如此,微軟正在考慮核能在內(nèi)的其他替代能源方案。
超算部署成本發(fā)生的變化
時(shí)至今日,微軟已經(jīng)在OpenAI上花了130億美元,使用其數(shù)據(jù)中心來(lái)為ChatGPT之類(lèi)的應(yīng)用提供硬件支持。但此次的星門(mén)項(xiàng)目更是規(guī)模浩大,這也說(shuō)明了新模型的訓(xùn)練和推理,仍在對(duì)數(shù)據(jù)中心的硬件提出新的要求,需要用性能更強(qiáng)的AI超算來(lái)解決。
但這并不意味著普遍的超算成本真的有這么夸張的變化,要知道目前TOP500上排名第一的超算Frontier,其成本也只有6億美元。對(duì)于科研專(zhuān)用的單個(gè)超算系統(tǒng)而言,雖然造價(jià)不算低,但在政府的科研經(jīng)費(fèi)支持下,研究機(jī)構(gòu)還是可以負(fù)擔(dān)起的。
不過(guò)值得注意的是,TOP500上的超算都有公開(kāi)的跑分成績(jī),為了實(shí)現(xiàn)這樣的成績(jī),需要一定時(shí)間的優(yōu)化,再運(yùn)行一段時(shí)間的測(cè)試才會(huì)有此成績(jī)。而市面上,尤其是在不少大型互聯(lián)網(wǎng)公司內(nèi)部,也存在并沒(méi)有公開(kāi)提交成績(jī)的超算,因?yàn)檫@類(lèi)系統(tǒng)幾乎是從誕生起就被投入商業(yè)使用了。
所以市面上肯定有超過(guò)6億美元的超算系統(tǒng),比如Meta就在幾個(gè)月前打造了兩套系統(tǒng),分別集成了2萬(wàn)個(gè)H100 GPU,總成本在10億美元以上。其他的互聯(lián)網(wǎng)公司,諸如國(guó)內(nèi)的百度、騰訊等,想必也有龐大的硬件購(gòu)買(mǎi)計(jì)劃。
寫(xiě)在最后
隨著HPC與AI在需求和計(jì)算負(fù)載上的融合,市場(chǎng)趨勢(shì)從前幾年的“帶AI功能的HPC系統(tǒng)”變成了“同樣可以用于HPC的AI系統(tǒng)”。但從其規(guī)模來(lái)看,對(duì)于HPC市場(chǎng)也未嘗不是一件好事,畢竟目前AI超算的商業(yè)價(jià)值更高,能夠吸引到更多的投資和補(bǔ)貼,也有望進(jìn)一步推動(dòng)HPC硬件的革新速度。
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268871 -
HPC
+關(guān)注
關(guān)注
0文章
315瀏覽量
23752 -
超算
+關(guān)注
關(guān)注
1文章
115瀏覽量
9068
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論