電子發(fā)燒友網(wǎng)報道(文/吳子鵬)在今年的亞馬遜re:Invent 2024大會上,該公司正式對外發(fā)布了旗下第四代自研Arm芯片——Graviton4。作為目前最強(qiáng)大的Graviton處理器,Graviton4相較于上一代產(chǎn)品帶來了巨大的性能提升。同時,為Graviton4賦能的Arm Neoverse也跟著受到了更多的關(guān)注。
強(qiáng)悍的Graviton4處理器
據(jù)介紹,Graviton4處理器每個核心都能提供比上代強(qiáng)30%的性能,vGPU數(shù)量和內(nèi)存容量也是上一代的3倍,能將處理大型Java應(yīng)用的速度提升45%,可以為企業(yè)提供更低成本和高效的高性能計(jì)算解決方案。
除了內(nèi)核性能的提升,亞馬遜還著重提升了Graviton4處理器的存儲性能,首次創(chuàng)建了雙插槽NUMA內(nèi)存集群。Graviton4處理器配備了高達(dá)1.5 TB的DDR5主內(nèi)存,運(yùn)行頻率為5.6 GHz,提供12個內(nèi)存通道。與之相比,上一代Graviton 3處理器使用了4.8 GHz主頻的DDR5內(nèi)存,只有8個內(nèi)存通道。并且,單個Graviton4處理器的內(nèi)存插槽就可以提供537.6 GB/秒的帶寬,能夠輕松應(yīng)對HPC負(fù)載。
此前,亞馬遜針對Graviton4處理器發(fā)布過一些測試實(shí)例,通過這些實(shí)例體現(xiàn)了這顆處理器強(qiáng)大的性能。比如,基于Graviton4處理器構(gòu)建UE5 Dedicated Server,據(jù)亞馬遜的說法,最新的Graviton 4實(shí)例是迄今為止亞馬遜為各種workload設(shè)計(jì)的最強(qiáng)大并且最高效節(jié)能的CPU。Graviton 4的實(shí)例R8g相較于Graviton 3的實(shí)例R7g有大約30%的性能提升。實(shí)例R8g壓測使用Lyra Starter Game項(xiàng)目,通過增加AI Bot和GameClient的方式來增加Dedicated Server(簡稱DS)的負(fù)載,通過對比不同機(jī)型以及不同參數(shù)編譯出的DS在server full的情況下的CPU使用率和幀率(FPS)來對比性能。
結(jié)果顯示,Graviton 4的實(shí)例在UE Dedicated Server應(yīng)用場景下:
·相較于Graviton 3有約 25+%的性價比提升(均使用優(yōu)化參數(shù)編譯);
·相較于Intel Sapphire Rapids和AMD Genoa有30%~35%的性價比提升;
·使用Graviton針對C/C++的優(yōu)化參數(shù)來編譯Dedicated Server對性能提升約10%~25%。
根據(jù)外媒的測試,在相同的vCPU數(shù)量下,新的Graviton4處理器內(nèi)核大致與Intel Sapphire Rapids性能相當(dāng),同時能夠與AMD EPYC“Genoa”相媲美,并始終表現(xiàn)出極佳的代際提升。這都離不開Arm Neoverse的賦能。
Graviton4 處理器背后的Arm Neoverse
Graviton4 處理器基于Arm?Neoverse?V2平臺,這顆核心發(fā)布于2022年9月。Neoverse V2和Neoverse E2都是Arm公司內(nèi)部代號“Demeter”項(xiàng)目下的產(chǎn)品,Arm?Neoverse?V2平臺涵蓋Armv9架構(gòu)的新特性,包括高性能浮點(diǎn)和向量指令支持,以及SVE/SVE2、Bfloat16和INT8?MatMul等特性。這些特性為AI/機(jī)器學(xué)習(xí)?(ML)?以及高性能計(jì)算?(HPC)?工作負(fù)載提供了卓越性能。
根據(jù)Arm官方的介紹信息,得益于全面增強(qiáng)的核心性能、內(nèi)存帶寬和高達(dá)兩倍的L2緩存大?。亢?MB),Neoverse V2可以在云和ML應(yīng)用程序上提供兩倍于Neoverse V1的性能。根據(jù)Arm工程團(tuán)隊(duì)實(shí)際運(yùn)行EDA工作負(fù)載所得出的結(jié)果,Graviton4?提供的RTL仿真工作負(fù)載性能比Graviton3高出?37%。同時,Neoverse V2具有出色的平臺擴(kuò)展性,當(dāng)與新的CMN-700核心網(wǎng)狀網(wǎng)絡(luò)配對時,Neoverse V2 CPU可以配置多達(dá)256個內(nèi)核和512MB的系統(tǒng)級緩存(SLC)。AMBA CHI C2C使用UCIe、CXL、PCIe或自定義PHY來連接計(jì)算、內(nèi)存和加速器,實(shí)現(xiàn)高效、高速的芯片連接。
看過Graviton4處理器的性能之后,人們對下一代Arm服務(wù)器會更加期待,這些產(chǎn)品將搭載最新的Neoverse V3。2024年2月,Arm宣布推出新一代 Arm Neoverse技術(shù),Neoverse CSS V3則是V系列芯片IP的首款Neoverse CSS產(chǎn)品,單芯片性能可提高50%。官方的資料顯示,全新的Neoverse CCS V3 核心基于64核的Neoverse V3 核心,擁有6個DDR5 內(nèi)存控制器、4個 I/O 控制器和兩個芯片間互連,并支持PCIe Gen5和CXL3.0。通過芯片間互聯(lián),可以升級至128核。相對于此前的 Neoverse CSS N2,其單芯片性能可提高50%。
除了核心的提升,Arm將繼續(xù)投入并進(jìn)一步強(qiáng)化軟件生態(tài)系統(tǒng),從而使開發(fā)者能夠更加輕松地在?Arm平臺上構(gòu)建其應(yīng)用,并充分利用?Arm計(jì)算平臺所提供的卓越性能和效率優(yōu)勢。
結(jié)語
亞馬遜Graviton4處理器是Arm處理器歷史上的一次巨大成功,性能全面對標(biāo)x86處理器當(dāng)前的旗艦產(chǎn)品。在Graviton4處理器背后,Neoverse V2內(nèi)核起到了巨大的賦能作用,這讓產(chǎn)業(yè)界對于下一代基于Neoverse CCS V3 核心的Arm處理器更加期待。
-
處理器
+關(guān)注
關(guān)注
68文章
19259瀏覽量
229647
發(fā)布評論請先 登錄
相關(guān)推薦
評論