隨著AI計算大量的數(shù)據(jù)訓(xùn)練與推理負(fù)載,我們對于擴(kuò)張和建設(shè)大型數(shù)據(jù)中心瓶頸的認(rèn)知,也早已經(jīng)歷了數(shù)個階段的變化。首先是算力的空缺,接著是內(nèi)存墻,最后我們到了網(wǎng)絡(luò)性能上。多年以來,以太網(wǎng)作為互聯(lián)網(wǎng)的主心骨,為數(shù)據(jù)中心提供了通用高速的網(wǎng)絡(luò)連接。
據(jù)IDC預(yù)測,到2025年全球數(shù)據(jù)中心和云端的流量將突破至175ZB。正因如此,我們開始打造更為復(fù)雜的多機(jī)架系統(tǒng),以及復(fù)雜的網(wǎng)絡(luò)架構(gòu)。與此同時,隨著新標(biāo)準(zhǔn)的開發(fā)和發(fā)布,每一代以太網(wǎng)的數(shù)據(jù)傳輸速率都在翻倍,以數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu)而言,尤其是以AI負(fù)載為主的智算中心,從400G過渡到800G,以及未來走向1.6T,已經(jīng)是大勢所趨。
1.6T以太網(wǎng),打破智算中心的連接限制
從目前數(shù)據(jù)中心的系統(tǒng)能耗變化來看,AI正在慢慢成為增長最快的負(fù)載之一。據(jù)福布斯報道,從2023年到2030年,AI負(fù)載將把數(shù)據(jù)中心的能耗提高80%,而常見的數(shù)據(jù)中心架構(gòu)中,以太網(wǎng)連接相關(guān)的功耗占比高達(dá)60%。
AI不僅消耗了大量的算力資源,也為互聯(lián)網(wǎng)絡(luò)帶來的極大的壓力,不只是服務(wù)器內(nèi)部芯片、加速器之間的互聯(lián),還有服務(wù)器與架頂式交換機(jī)之間的互聯(lián)。對于超大規(guī)模LLM這樣對服務(wù)器要求極高的AI應(yīng)用而言,做到更快的互聯(lián)速度,更低的延遲和更低的功耗,就能更高效地為用戶提供服務(wù)器。
高速網(wǎng)絡(luò)因此成了每個大力發(fā)展智算的數(shù)據(jù)中心研究的重點,AI應(yīng)用開發(fā)商也會將這些指標(biāo)納入考量。作為主要連接方式的以太網(wǎng),也已經(jīng)在探索1.6T網(wǎng)絡(luò)的開發(fā)。要想支持更快的以太網(wǎng)絡(luò),就少不了高速SerDes接口。為了實現(xiàn)800G和1.6T的高速以太網(wǎng),必須用到224GB的SerDes以及PAM-4調(diào)制方式。在給定的波特率下,PAM-4可以實現(xiàn)兩倍于傳統(tǒng)NRZ的比特率。
但采用PAM-4調(diào)制致使眼高有所降低,進(jìn)而使得信噪比降低。因此PAM-4相較NRZ對噪聲更為敏感,誤碼率增高,必須靠FEC(前向糾錯)才能保證其誤碼率,保證其在長距離下接收信號。不過有了FEC的輔助,更高速率的以太網(wǎng)受到的距離限制因素更多,所以其支持的距離往往會隨著速率增加而逐步遞減。
對于1.6T的以太網(wǎng)標(biāo)準(zhǔn)而言,參與制定標(biāo)準(zhǔn)的IEEE 802.3dj工作組預(yù)計會在2026年定稿,但相關(guān)的基礎(chǔ)特性已經(jīng)基本確定確定下來,比如最大支持1.6Tb/s的MAC速率,MAC層最大誤碼率,芯片到模組和芯片到芯片應(yīng)用可選支持16路1.6Tb/s AUI等。
從現(xiàn)在看來,正式的標(biāo)準(zhǔn)離我們尚有一段距離,但不代表著相關(guān)的解決方案沒有成型。面對競爭日益激烈的光模塊、交換機(jī)等市場,對于博通、Marvell之類的設(shè)計廠商而言,他們并不會靜靜等待標(biāo)準(zhǔn)定稿才開始行動。如果想要搶占市場先機(jī),現(xiàn)在就是了解1.6T以太網(wǎng)設(shè)計方案的最佳時機(jī),新思科技作為以太網(wǎng)IP解決方案的領(lǐng)頭羊,早在幾年前就開始部署相關(guān)的解決方案。
高帶寬以太網(wǎng)方案,IP先行
從硬件角度來說,支持以太網(wǎng)數(shù)據(jù)連接的架構(gòu)往往由兩部分組成,一個是控制器,一個是PHY(物理層)。其中控制器在芯片內(nèi)部實現(xiàn)的基礎(chǔ)的以太網(wǎng)協(xié)議特性,由MAC、PCS和PMA組成。PHY負(fù)責(zé)傳輸和接收數(shù)據(jù),由PMA和PMD組成。
新思科技早在800G以太網(wǎng)的萌芽階段,就已經(jīng)開始了1.6T的布局。在2022年的ECOC大會上,新思科技就展示了BER小于1e-6的224G接收器PHY方案。去年的DesignCon上,新思科技在224G接收器PHY的Demo上,展示了5nm 224 PAM-4 PAM-4 TX眼圖。去年的OFC、SC23等會議上,新思科技的224G demo都展示出了優(yōu)異的回路BER性能。
新思科技1.6T以太網(wǎng)解決方案 / 新思科技
今年二月底,新思科技正式發(fā)布了完整的1.6T以太網(wǎng)IP解決方案,包括1.6T以太網(wǎng)控制器IP、224G以太網(wǎng)PHY IP和驗證IP。新思科技稱這一完整的1.6T以太網(wǎng)解決方案可以顯著減少互聯(lián)功耗,相比上一代功耗低至50%。在標(biāo)準(zhǔn)的支持上,該方案支持IEEE 802.3、OIF-224G標(biāo)準(zhǔn)等過個電氣規(guī)范。
相較于目前已有的800G以太網(wǎng)控制器IP方案,新思科技提供的全新多通道/多速率以太網(wǎng)控制器方案除了提供對1.6T速率以太網(wǎng)支持外,憑借PCS提供的RS-FEC架構(gòu),還實現(xiàn)了最高40%的時延改善,設(shè)計占用面積最大減少了50%。
新思科技的224G以太網(wǎng)PHY IP則提供了優(yōu)秀的信號完整度和抖動性能,可以做到0 post-FEC BER。除了傳統(tǒng)的NRZ外,也支持到逐漸成為主流的PAM-4。針對光模塊、AI/ML處理器、NIC等不同硬件的設(shè)計需求,新思科技的以太網(wǎng)PHY IP可以定制化,用于支持芯片到芯片、芯片到模組以及銅線連接等不同的以太網(wǎng)互聯(lián)方案。
除此之外,新思科技提供了業(yè)內(nèi)首個1.6T驗證IP,支持前期RTL驗證、SoC調(diào)試以及系統(tǒng)層級的校驗等,加快設(shè)計者的驗證進(jìn)度。據(jù)了解,新思科技也在關(guān)鍵生態(tài)合作伙伴、芯片廠商、標(biāo)準(zhǔn)制定協(xié)會等合作,未來會繼續(xù)擴(kuò)展對1.6T以太網(wǎng)的支持,包括車載以太網(wǎng)及其他的速度模式等。
值得一提的是,新思科技 224G 以太網(wǎng) PHY IP 已經(jīng)在臺積電的N3E工藝中成功實現(xiàn)流片,所以工程師只需要專注在產(chǎn)品的差異化設(shè)計上。硅驗證的以太網(wǎng)PHY IP、時延優(yōu)化的以太網(wǎng)控制器IP以及首個1.6T驗證IP結(jié)合,已經(jīng)為設(shè)計者鋪好了邁向更高速率以太網(wǎng)絡(luò)的路徑。與行業(yè)主要參與者打通的互操作性,也為多供應(yīng)商設(shè)備兼容做好了保證。
寫在最后
新思科技表示,其完整的1.6T以太網(wǎng)IP解決方案已經(jīng)被多個客戶采用,相信下一代1.6T以太網(wǎng)連接的產(chǎn)品和系統(tǒng)都已經(jīng)在緊鑼密鼓的開發(fā)過程中。與此同時,我們還需要持續(xù)關(guān)注下一代光模塊封裝方式面臨的挑戰(zhàn)。
新思科技的以太網(wǎng)IP已經(jīng)支持可插拔、NPO(近封裝光學(xué))和CPO(共封裝光學(xué))的不同方案,究竟哪一種方案技術(shù)成熟度更高、成本可觀,仍是未來光模塊廠商需要考慮的問題。但可以肯定的是,1.6T以太網(wǎng)勢必會為智算中心帶來新一輪的性能升級。
-
智算中心
+關(guān)注
關(guān)注
0文章
68瀏覽量
1691
發(fā)布評論請先 登錄
相關(guān)推薦
評論