以ChatGPT為代表的AI大模型應(yīng)用普及將推動(dòng)算力需求快速增長(zhǎng),服務(wù)器產(chǎn)業(yè)鏈?zhǔn)瞧渲兄匾氖芤姝h(huán)節(jié)之一,AI計(jì)算的普及將推動(dòng)服務(wù)器產(chǎn)業(yè)鏈光模塊向800G升級(jí)提速。
算力網(wǎng)絡(luò)驅(qū)動(dòng)下光模塊市場(chǎng)需求預(yù)測(cè)
光模塊是數(shù)據(jù)中心內(nèi)部互連和數(shù)據(jù)中心相互連接的核心部件。100G和400G是主流產(chǎn)品,800G過(guò)去主要用在超算等領(lǐng)域。據(jù)LightCounting預(yù)計(jì),2023年800G全球普及率僅0.62%。而以ChatGPT為代表的AI大模型,對(duì)數(shù)據(jù)中心內(nèi)外的數(shù)據(jù)流量都提出了新要求,有望推動(dòng)光模塊加速向800G升級(jí)。800G光模塊將從2025年底開始主導(dǎo)光模塊市場(chǎng)。
根據(jù)LightCounting的數(shù)據(jù),2016年至2020年,全球光模塊市場(chǎng)規(guī)模從58.6億美元增長(zhǎng)到66.7億美元,預(yù)測(cè)2025年全球光模塊市場(chǎng)將達(dá)到113億美元,為2020年的1.7倍。從結(jié)構(gòu)上看數(shù)通市場(chǎng)占60%,電信市場(chǎng)占40%左右。
AI算力場(chǎng)景光模塊應(yīng)用情況
首先我們以英偉達(dá)的SuperPOD為例測(cè)算單顆GPU與光模塊的比例。測(cè)算僅考慮IB網(wǎng)絡(luò)對(duì)應(yīng)的光模塊需求。以140個(gè)節(jié)點(diǎn)的集群為例,每臺(tái)舉例服務(wù)器需要8顆GPU芯片,共需140×8=1120顆芯片;集群中每20臺(tái)服務(wù)器組成一個(gè)SU(scalable units,可擴(kuò)展單元),共7個(gè)SU。IB網(wǎng)絡(luò)架構(gòu)下實(shí)現(xiàn)了完整的胖樹(Fat-Tree)拓?fù)浣Y(jié)構(gòu),胖樹架構(gòu)在訓(xùn)練場(chǎng)景中最優(yōu)的配置是上下行端口數(shù)一樣,即無(wú)阻塞的網(wǎng)絡(luò),具體來(lái)看:
第一層:每個(gè)SU 中配置8臺(tái)葉交換機(jī),共有56臺(tái)葉交換機(jī);
第二層:每10臺(tái)脊交換機(jī)組成一個(gè)交換機(jī)組Spine Group( SG),每個(gè)SU 的第一個(gè)葉交換機(jī)連接到SG1中的每個(gè)交換機(jī),每個(gè)SU的第二個(gè)葉交換機(jī)連接到SG2中的每個(gè)交換機(jī),共有80個(gè)脊交換機(jī);
第三層:每14臺(tái)核心交換機(jī)組成一個(gè)交換機(jī)組Core Group(CG),對(duì)應(yīng)共28個(gè)核心交換機(jī)。
使用系統(tǒng)的對(duì)應(yīng)計(jì)算側(cè)和存儲(chǔ)側(cè)線纜全部采用AOC有源光纜,因此每個(gè)端口對(duì)應(yīng)一個(gè)光模塊,即每條光纜對(duì)應(yīng)2個(gè)光模塊,因此計(jì)算側(cè)和存儲(chǔ)側(cè)共需要(1120+1124+1120)×2+(280+92+288)×2=8048個(gè)光模塊,即單顆GPU對(duì)應(yīng)所需200G光模塊數(shù)量約為1:7.2
DGX GH200超級(jí)計(jì)算機(jī)搭載256個(gè)超級(jí)芯片,每個(gè)超級(jí)芯片可視為一個(gè)服務(wù)器,通過(guò)交換機(jī)進(jìn)行互聯(lián)。從結(jié)構(gòu)上來(lái)看,超級(jí)計(jì)算機(jī)采用兩層的胖樹拓?fù)浣Y(jié)構(gòu),第一、二層分別使用96個(gè)、36個(gè)交換機(jī),每臺(tái)交換機(jī)擁有32個(gè)速率為800G的端口;此外超級(jí)計(jì)算機(jī)還配備了24個(gè)IB交換機(jī)用于IB網(wǎng)絡(luò)。按照端口進(jìn)行估算,L1層距離較近因此假定使用銅纜進(jìn)行連接不涉及光模塊,L2層36個(gè)交換機(jī)在無(wú)收斂胖樹架構(gòu)下,第二層交換機(jī)端口向下與L1層交換機(jī)上行端口互聯(lián),因此共需要36×32×2=1152個(gè)800G光模塊;IB網(wǎng)絡(luò)架構(gòu)下,24臺(tái)交換機(jī)需要24×32=768個(gè)800G光模塊;則DGX GH200超級(jí)計(jì)算機(jī)共需要1152+768=1920個(gè)800G光模塊,對(duì)應(yīng)每顆芯片12個(gè)800G光模塊。則GPT-3單日完成訓(xùn)練需要8萬(wàn)顆以上200G光模塊,如果考慮到FLOPS的利用率約為20%-30%,則需要光模塊的數(shù)量將約為35萬(wàn)顆。
易飛揚(yáng)應(yīng)用于算力場(chǎng)景的光模塊
AI發(fā)展促進(jìn)了海量光模塊需求,易飛揚(yáng)則已于2023年完成800G/400G AI應(yīng)用光模塊產(chǎn)線建設(shè)任務(wù),新建成的生產(chǎn)線主要用于4×100G PAM4和8×100G PAM4光模塊和有源光纜的生產(chǎn)。
得益于供應(yīng)鏈的支持,易飛揚(yáng)的系列AI光模塊量產(chǎn)順利,公司本身的產(chǎn)品多樣化設(shè)計(jì)能力、訂單能力和供應(yīng)鏈能力形成了較好的匹配關(guān)系??梢詾橹行】蛻籼峁╈`活有效的需求交付和樣品測(cè)試。
審核編輯 黃宇
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268871 -
光模塊
+關(guān)注
關(guān)注
77文章
1261瀏覽量
58990 -
算力
+關(guān)注
關(guān)注
1文章
964瀏覽量
14792
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論