專訪 Maury Wood,Vicor 戰(zhàn)略營(yíng)銷副總裁
生成式人工智能(genAI)帶來(lái)的文化革命可能像互聯(lián)網(wǎng)普及一樣對(duì)人類產(chǎn)生深遠(yuǎn)影響。從您的角度來(lái)看,目前情況如何?
過(guò)去 18 個(gè)月以來(lái),我們見(jiàn)證了整個(gè)生成式人工智能生態(tài)系統(tǒng)的飛速創(chuàng)新,涵蓋處理器芯片、專用軟件和超級(jí)計(jì)算機(jī)等多個(gè)領(lǐng)域,這些創(chuàng)新加速了特定領(lǐng)域人工智能應(yīng)用的開(kāi)發(fā),同時(shí),許多企業(yè)紛紛宣布戰(zhàn)略規(guī)劃,這預(yù)示著生成式人工智能將在可預(yù)見(jiàn)的未來(lái)對(duì)全球經(jīng)濟(jì)產(chǎn)生巨大影響。目前,生成式人工智能模型的訓(xùn)練已經(jīng)在計(jì)算性能、存儲(chǔ)容量和網(wǎng)絡(luò)帶寬方面達(dá)到了前所未有的高水平。一些當(dāng)今性能最高的超級(jí)計(jì)算機(jī)(通常以浮點(diǎn)數(shù)學(xué)性能衡量)專門用于生成式人工智能模型訓(xùn)練。生成式人工智能正推動(dòng)半導(dǎo)體、基礎(chǔ)設(shè)施硬件、系統(tǒng)軟件和網(wǎng)絡(luò)邊緣等領(lǐng)域的空前投資,這種投資熱潮有望進(jìn)一步擴(kuò)展到家庭和工作場(chǎng)所的嵌入式人工智能設(shè)備領(lǐng)域。
生成式人工智能的快速普及會(huì)帶來(lái)哪些負(fù)面影響?
除了人們普遍擔(dān)憂的問(wèn)題外,這波創(chuàng)新浪潮的一個(gè)主要成本是云數(shù)據(jù)中心的能耗急劇增加,這些數(shù)據(jù)中心承擔(dān)著生成式人工智能的訓(xùn)練和推理任務(wù),而能耗的預(yù)測(cè)數(shù)據(jù)令人擔(dān)憂。例如,《紐約時(shí)報(bào)》的一項(xiàng)預(yù)測(cè)顯示,到 2027 年,生成式人工智能的用電量將相當(dāng)于阿根廷、荷蘭或瑞典一年的用電量。生成式人工智能模型的訓(xùn)練和推理帶來(lái)日益嚴(yán)重的能耗挑戰(zhàn),與社會(huì)減少能源使用和溫室氣體排放的目標(biāo)背道而馳。
為何生成式人工智能計(jì)算如此耗電?
首先,讓我們區(qū)分兩個(gè)概念。當(dāng)我們個(gè)人使用生成式人工智能工具時(shí),我們是在對(duì)預(yù)訓(xùn)練的大型語(yǔ)言模型(LLM)進(jìn)行查詢,這種所謂的"推理"活動(dòng)并不特別耗電,甚至可以在網(wǎng)絡(luò)邊緣設(shè)備上進(jìn)行。然而,訓(xùn)練生成式人工智能大型語(yǔ)言模型的過(guò)程則需要在我之前提到的超級(jí)計(jì)算機(jī)上進(jìn)行大量計(jì)算(目前這個(gè)過(guò)程通常需要數(shù)月)。這些超級(jí)計(jì)算機(jī)使用成千上萬(wàn)個(gè)基于圖形處理單元(GPU)的專用處理器,每個(gè)處理器包含的晶體管都數(shù)量驚人——通常超過(guò) 1000 億。這些訓(xùn)練處理器采用了最先進(jìn)的半導(dǎo)體工藝技術(shù),如 4 納米 CMOS 工藝,但在運(yùn)行過(guò)程中會(huì)漏電。由于這些晶體管的供電電壓約為 0.7VDD,持續(xù)的電流需求可能高達(dá) 1000 安培或更高,導(dǎo)致持續(xù)功耗(也稱為熱設(shè)計(jì)功耗)達(dá)到 700 瓦特或更高。如果每臺(tái)生成式人工智能超級(jí)計(jì)算機(jī)的數(shù)千個(gè)處理器和全球數(shù)百臺(tái)云端生成式人工智能超級(jí)計(jì)算機(jī)都乘以 700 瓦,總體電力消耗就會(huì)急劇飆升。
舉個(gè)例子,根據(jù)英偉達(dá)(Nvidia)的數(shù)據(jù),OpenAI 的 GPT-3 模型有 1750 億個(gè)參數(shù),整個(gè)訓(xùn)練周期需要約 300 澤字節(jié)浮點(diǎn)運(yùn)算(300 zettaFLOPS,即每秒 1021 次浮點(diǎn)運(yùn)算),相當(dāng)于 3X1023 次數(shù)學(xué)運(yùn)算。而且這些模型的規(guī)模只會(huì)不斷增加,目前正在開(kāi)發(fā)的神經(jīng)網(wǎng)絡(luò)模型參數(shù)已達(dá)到萬(wàn)億級(jí)。
圖 1:生成式人工智能訓(xùn)練處理器的峰值電流需求不斷攀升,似乎沒(méi)有盡頭。
常規(guī)開(kāi)關(guān)模式電源架構(gòu)能否滿足生成式人工智能的供電需求?
直到最近,數(shù)據(jù)中心機(jī)架還在使用 12V 直流配電系統(tǒng)。在過(guò)去十年中,Vicor 等電源系統(tǒng)創(chuàng)新公司一直倡導(dǎo)在數(shù)據(jù)中心機(jī)架中使用 48V 直流電源,因?yàn)楦鶕?jù)歐姆定律,電壓更高可以在具有非零電阻的導(dǎo)體中降低功耗。開(kāi)放計(jì)算項(xiàng)目組織(Open Compute Project)標(biāo)準(zhǔn)化的開(kāi)放機(jī)架規(guī)范大大推動(dòng)了 48V 直流電源在高性能計(jì)算應(yīng)用中的采用。在早期的生成式人工智能配電架構(gòu)中,這種 48V 直流電源在加速模塊上轉(zhuǎn)換為中間母線電壓,然后再通過(guò)跨電感電壓穩(wěn)壓器(TLVR)供電,然而這種方法在可擴(kuò)展性和電流密度方面存在明顯的局限性。
概念性加速模塊(AM),展示基于 GPU 的處理器并支持高帶寬內(nèi)存(HBM),是生成式人工智能的基本構(gòu)建模塊。
為何 TLVR 方法不足以滿足生成式人工智能處理器的供電需求?
在用于生成式人工智能訓(xùn)練處理器的加速模塊上,可用的印刷電路板(PCB)空間非常有限,這意味著這些處理器的供電子系統(tǒng)必須具有超高的功率密度(W/mm2)和電流密度(A/mm2)。傳統(tǒng)電源根本無(wú)法達(dá)到所需的功率和電流密度,既無(wú)法提供足夠的電流,也無(wú)法適應(yīng)有限的 PCB 面積。此外,生成式人工智能訓(xùn)練處理器的電源組件還必須滿足負(fù)載瞬變引起的動(dòng)態(tài)性能需求。同樣,傳統(tǒng)的供電方法并不能很好地滿足這些要求。另外,生成式人工智能供電架構(gòu)中的組件必須具有出色的散熱能力。無(wú)論生成式人工智能系統(tǒng)采用液冷還是風(fēng)冷,電源組件都必須具有高熱導(dǎo)率,其封裝還要能在整個(gè)使用壽命期內(nèi)承受極高水平的熱循環(huán)。最新的生成式人工智能加速模塊采用分級(jí)電源架構(gòu),其負(fù)載點(diǎn)轉(zhuǎn)換器使用電流倍增技術(shù),如 Vicor 公司的創(chuàng)新技術(shù)。
Vicor 的分比式電源架構(gòu)(FPA)在負(fù)載點(diǎn)采用具有出色散熱性能的模塊化電流倍增器(MCM),非常適合生成式人工智能訓(xùn)練應(yīng)用。
Vicor 技術(shù)如何改進(jìn)生成式人工智能的供電?
Vicor 獨(dú)特的電源模塊采用模塑成型,然后使用無(wú)電鍍鎳浸金(ENIG)工藝進(jìn)行電鍍。模壓結(jié)構(gòu)確保機(jī)械剛性,以及在溫度、濕度和振動(dòng)等環(huán)境下的穩(wěn)定性。電鍍外表面有利于高良率的表面貼裝組裝,同時(shí)為使用冷板強(qiáng)制風(fēng)冷或液冷提供了理想的熱傳導(dǎo)條件。Vicor 電源模塊采用專有的正弦振幅轉(zhuǎn)換器(SAC)電路拓?fù)?,使用零電壓開(kāi)關(guān)(ZVS)和零電流開(kāi)關(guān)(ZCS)技術(shù)來(lái)最大限度地減少開(kāi)關(guān)噪聲和雜散輻射,同時(shí)最大化 DC-DC 轉(zhuǎn)換效率。Vicor 還使用高頻 MOSFET 開(kāi)關(guān)來(lái)減小高度集成模塊的物理尺寸。此外,Vicor 為人工智能/高性能計(jì)算應(yīng)用設(shè)計(jì)的負(fù)載點(diǎn)組件非常薄(≤1.7mm),并在一系列與 PCB 兼容的封裝中提供可擴(kuò)展的電流輸出。在可預(yù)見(jiàn)的未來(lái),生成式人工智能無(wú)疑將繼續(xù)是現(xiàn)代計(jì)算世界中最耗電且散熱挑戰(zhàn)最大的應(yīng)用。Vicor 將繼續(xù)創(chuàng)新,滿足這一激動(dòng)人心的新業(yè)務(wù)機(jī)會(huì)不斷攀升的供電需求。
-
處理器
+關(guān)注
關(guān)注
68文章
19259瀏覽量
229651 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4761瀏覽量
72033 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238245
原文標(biāo)題:隨著人工智能(AI)的發(fā)展,電力挑戰(zhàn)也隨之而來(lái)
文章出處:【微信號(hào):Vicor,微信公眾號(hào):Vicor】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論