突破傳統(tǒng)基礎設施
從云到邊緣,Arm Neoverse 正憑借出色的性能、效率、設計靈活性和總體擁有成本 (TCO) 優(yōu)勢,革新傳統(tǒng)基礎設施芯片領域。
云和超大規(guī)模服務運營商正不斷增大計算密度。隨著 Microsoft Cobalt、阿里巴巴的倚天 710、AmpereOne等配置 128 核或以上的 CPU 設計進入市場,單個封裝可實現(xiàn)的性能更強,且下一代的目標還將遠高于 128 核。
隨著 CPU 性能逐步提高,市場對人工智能 (AI)、網(wǎng)絡和加密加速器等專用計算的需求也隨之持續(xù)增長。這顯然需要將這些加速器集成在一起,才能更有效地提高性能和效率,與此同時,還需實現(xiàn)模塊化設計,以便將加速器與不同的通用計算引擎進行混合搭配。
基于 Neoverse N3 CPU 的Neoverse CSS N3
圖 1:Neoverse CSS N3 概覽
Arm Neoverse 計算子系統(tǒng) (CSS) 支持在新的工藝節(jié)點上快速開發(fā)先進的系統(tǒng)級芯片 (SoC)。通過在設計中使用預配置、預驗證的 CSS,合作伙伴節(jié)省了 80 人/年的工程師時間,以及相應的機會成本,使其能夠專注于實現(xiàn)助其系統(tǒng)增值的“秘密法寶”。
Neoverse CSS N3 構建在 Neoverse CSS N2 經過市場驗證的優(yōu)良表現(xiàn)之上,能通過新的架構功能提供更高的性能和效率,為數(shù)據(jù)中心市場帶來更優(yōu)越的單芯片性能和單 TCO 性能表現(xiàn)。此外,Neoverse CSS N3 還為邊緣和網(wǎng)絡應用帶來了出色的效率。CSS N3 以 Neoverse S3 系統(tǒng) IP 為基礎,Neoverse S3 系統(tǒng) IP 包括了一致性網(wǎng)狀網(wǎng)絡 CMN S3、系統(tǒng)內存管理單元 MMU S3 和片上網(wǎng)絡 NOC S3。此外,CSS N3 還包含系統(tǒng)管理和本地控制處理器,以及 CPU 和系統(tǒng) IP 協(xié)同設計與共同開發(fā),以優(yōu)化 PPA 和系統(tǒng)級功能的支持。
Neoverse CSS N3 支持 32 顆 Neoverse N3 核心,可在低至 40W 的功率范圍內實現(xiàn)優(yōu)異性能。該產品具備高度可配置性,適用于電信、數(shù)據(jù)處理單元 (DPU) 、網(wǎng)絡和云等多個領域,可以在 8 核至 32 核之間進行擴展配置。
除了性能和效率的大幅提升之外,Neoverse CSS N3 還支持基于芯粒的設計。它支持 UCIe 晶粒間 (die-to-die) 連接標準,結合 Arm 新的 AMBA CHI C2C 協(xié)議,為構建異構加速計算奠定了基礎??梢灶A見的是,Arm Neoverse CSS N3 將在當今專用計算領域蓬勃發(fā)展。
基于 CSS N3 的芯??赏ㄟ^ AMBA CHI C2C 連接到 I/O 一致性加速器,從而將加速器封裝在一起,進一步提高性能和效率,這一方法可用來取代傳統(tǒng)的解決方案。在過往的解決方案中,其加速器是通過 PCIe 進行板級連接,這會導致更高的延遲、軟件復雜性和功耗。
Neoverse N3 CPU優(yōu)異的效率表現(xiàn)
以每瓦性能來衡量的性能效率是 CPU 評估的一大關鍵指標。5G/6G 無線基礎設施要求現(xiàn)代計算解決方案表現(xiàn)出更高的性能,同時功耗預算須保持不變。新一代的 DPU 需要配備功能更強大的 CPU,以便在 PCIe 設備規(guī)范的限制內運行成熟的操作系統(tǒng)、虛擬機、容器及其他數(shù)據(jù)包處理功能。頭部云服務提供商正著手在機架的冷卻能力范圍內,部署核心數(shù)量更多、更密集的 CPU?!澳苄А睅缀跏撬屑毞质袌龅闹饕O計決策要素。Neoverse N3 便是以能效作為其設計核心。
Neoverse N3 CPU 延續(xù)了 Neoverse N2 經過市場驗證的效率表現(xiàn)。經過 Arm CPU 設計團隊的不懈努力,他們強化了分支預測器、預取器的性能,并優(yōu)化了微架構,進而實現(xiàn)了效率的提升。此外,他們還改進了電源管理表現(xiàn),增加了精度更高的每核動態(tài)電壓頻率調整 (DVFS) 功能,以實現(xiàn)更出色的性能效率。這些工作成果使得 N3 在效率表現(xiàn)上比上一代產品提高了 20% 以上。
Neoverse N3 可以滿足多樣的 SoC 設計要求,包括 16 核網(wǎng)絡設計、32 核電信 RAN 或云 DPU 設計,以及 192 核超大規(guī)模和云 CPU 等等。Neoverse N3 還提供了多種電壓和頻率選擇,與 Neoverse N2 相比,其每核性能效率提高了 20% 至近 50%。
圖 1:Arm Neoverse N3 CPU
延續(xù)卓越效率表現(xiàn)
在面積和功耗配置與 Neoverse N2 大致相同,且采用一樣的工藝節(jié)點下,Neoverse N3 在機器學習 (ML) 和數(shù)據(jù)分析工作負載方面的性能約提升了三倍,在 SQL 數(shù)據(jù)庫、選定壓縮應用程序,以及整數(shù)運算性能等方面分別約提升了 1.3 倍、1.2 倍,以及 1.1 倍的性能。
靈活的緩存配置
Neoverse N3 提供多種緩存配置,可滿足不同計算場景的需求。許多橫向擴展的云數(shù)據(jù)分析和數(shù)據(jù)庫應用均能從更靠近核心的較大緩存中受益,因此我們?yōu)檫@一細分領域推出了 2MB L2 緩存選項。此外,1MB L2 緩存選項主要針對 5G/6G 無線基礎設施、企業(yè)網(wǎng)絡、DPU 和智能網(wǎng)卡 (SmartNIC) 以及超大規(guī)模服務器等各種任務中的通用計算,能夠實現(xiàn)性能和面積的良好平衡;而較小的 32KB L1 和 128KB 則適合那些對緩存不敏感,但仍希望能以較小占用空間提供良好算力的工作負載。
總結
Neoverse N3 CPU 的推出實現(xiàn)了 Neoverse N 系列持續(xù)提供出色的每瓦性能的目標。新的 CSS N3 結合了 Neoverse N3 優(yōu)異的性能和效率與 Neoverse S3 系統(tǒng) IP,成為一套定制性更強的計算子系統(tǒng)。與上一代的 CSS 相比,Neoverse CSS N3的每瓦性能可提高 20% 至近 50%。CSS N3 平臺適用于云到邊緣設計,可幫助我們的合作伙伴將 Arm 強大的處理器與加密、網(wǎng)絡或 AI 加速器等等多種專用組件結合在一起,打造更具差異性的新產品。
我們的合作伙伴將有望在 2024 年底推出基于 Neoverse N3 和 CSS N3 的創(chuàng)新芯片設計,讓我們共同翹首以待。
審核編輯:劉清
-
ARM
+關注
關注
134文章
9084瀏覽量
367380 -
加速器
+關注
關注
2文章
796瀏覽量
37838 -
SoC芯片
+關注
關注
1文章
610瀏覽量
34905 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238243
原文標題:Arm Neoverse CSS N3 助力快速實現(xiàn)出色能效
文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論