1月11日下午,以“芯加速 行至遠”為主題的第四代英特爾至強新品發(fā)布會在北京正大中心盛大舉行。英特爾市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理兼中國區(qū)運營商銷售總經(jīng)理莊秉翰正式介紹了英特爾第四代至強可擴展處理器,英特爾至強CPU Max系列(代號
“Sapphire Rapids HBM”)以及英特爾數(shù)據(jù)中心GPU Max系列(代號“Ponte Vecchio”)。
圖:英特爾市場營銷集團副總裁、中國區(qū)數(shù)據(jù)中心銷售總經(jīng)理
兼中國區(qū)運營商銷售總經(jīng)理 莊秉翰
至強處理器的發(fā)展歷程
作為數(shù)據(jù)中心平臺和解決方案的技術(shù)引領(lǐng)者,英特爾產(chǎn)品為全球的客戶和行業(yè)伙伴提供了堅實的算力基礎(chǔ)。目前,至強處理器的安裝量已超過一億——從運行IT服務(wù)的本地服務(wù)器其中包括全新的即服務(wù)商業(yè)模式,到管理互聯(lián)網(wǎng)流量的網(wǎng)絡(luò)設(shè)備,再到進行邊緣計算的無線基站和云服務(wù)等。
自2017年Intel推出第一款至強和擴展處理器以來,英特爾已經(jīng)向全球客戶交付了超過8,500萬顆的至強可擴展處理器,支持了全世界數(shù)據(jù)中心。在過去2年,第三代至強可擴展處理器已經(jīng)在全球累計出貨1,500萬顆。
圖:英特爾市場營銷集團副總裁兼中國區(qū)總經(jīng)理 王稚聰
英特爾市場營銷集團副總裁兼中國區(qū)總經(jīng)理王稚聰表示:“中國5G網(wǎng)絡(luò)建設(shè)具有重大的意義,使得網(wǎng)絡(luò)和計算逐漸融為一體,使得感知、計算、數(shù)據(jù)、存儲、數(shù)據(jù)中心得以實現(xiàn)無縫連接,由此在中國形成了一個巨大的網(wǎng)絡(luò)。國家提出“東數(shù)西算”,運營商朋友在做算力網(wǎng)絡(luò)的構(gòu)建,都是在中國有非常宏大的構(gòu)想,能夠把遠端的大型數(shù)據(jù)中心,以及算力逐漸蔓延到邊緣,以及網(wǎng)絡(luò)的智能調(diào)度、切片,以及前端的傳感統(tǒng)一調(diào)度起來。
由此之上建立的數(shù)據(jù)流,以及對工作負載平衡的處理,AI的各種加速,提供了一個非常豐富而充滿樂趣和創(chuàng)造力的環(huán)境。第四代英特爾至強可擴展處理器的發(fā)布,就是面對這樣的計算環(huán)境,助力合作伙伴新業(yè)務(wù)需求。”
七大神器助力第四代至強服務(wù)器打造超強能力
莊秉翰指出,第四代至強服務(wù)器芯片采用Intel7的制程工藝制造,具有全新的芯片架構(gòu),通過集成高性能和更多的內(nèi)核數(shù)量,業(yè)內(nèi)高需求的數(shù)據(jù)中心工作負載的相關(guān)加速器,以及業(yè)界領(lǐng)先的DDR5,CXL1.1,PCIe5.0和高帶寬內(nèi)存,以提供高吞吐量、低時延性能,讓加速無所不在。
圖:第四代至強服務(wù)器芯片展示
這些加速體驗體現(xiàn)在全新的至強平臺所提供的七大算力神器。
一、加速深度學(xué)習(xí),實時推理和訓(xùn)練性能提升的IntelAMX加速器;
二、加速處理網(wǎng)絡(luò)數(shù)據(jù)系統(tǒng)及系統(tǒng)性的性能提升的Intel VOD加速器;
三、加速在存儲網(wǎng)絡(luò)工作負載中常見的流數(shù)據(jù)移動的Intel DSA加速器;
四、加速在數(shù)據(jù)分析工作負載中內(nèi)存占用優(yōu)化和查詢吞吐量的Intel IAA加速器;
五、加速在網(wǎng)絡(luò)吞吐量以及壓縮解壓縮功能的IntelQAT加速器;
六、加速平臺安全性能的Intel安全技術(shù)策略組合;
七、提供內(nèi)置高帶寬內(nèi)存的Intel至強CPU Max系列。
與前一代相比,第四代英特爾至強可擴展處理器通過內(nèi)置加速器將目標工作負載的平均每瓦性能提升了2.9倍,在優(yōu)化電源模式下每個CPU節(jié)能高達70瓦,并對性能只產(chǎn)生極低的影響,同時將總體擁有成本降低52%到66%。
可持續(xù)性
第四代英特爾至強可擴展處理器擁有豐富的內(nèi)置加速器,意味著英特爾能夠提供平臺級的功率節(jié)省,并緩解對額外獨立加速方面的需求,幫助客戶實現(xiàn)可持續(xù)發(fā)展目標。此外,新的優(yōu)化電源模式可以為某些工作負載帶來高達20%的插槽節(jié)能,而對性能的影響僅有不到5%。風(fēng)冷和液冷的創(chuàng)新進一步降低了數(shù)據(jù)中心的總能耗,且第四代至強可擴展處理器在英特爾工廠制造時,運用了超過90%的可再生電力,并同時配備了一流的水資源回收設(shè)施。
人工智能
在AI方面,與前一代相比,通過內(nèi)置英特爾高級矩陣擴展(英特爾AMX)加速器,第四代英特爾至強可擴展處理器將PyTorch實時推理和訓(xùn)練性能提升了10倍。第四代英特爾至強還將廣泛的AI工作負載的推理和訓(xùn)練性能提升到新的高度。英特爾至強CPU Max系列在這些功能的基礎(chǔ)上針對自然語言處理進行了擴展,將大型語言模型的處理速度提升多達20倍。借助英特爾的AI軟件套件,開發(fā)者可以使用自己選擇的AI工具,提高生產(chǎn)力并加快AI開發(fā)速度。該套件可以從工作站進行移植,使其可以在云中擴展,并一直擴展到邊緣。同時,該套件已經(jīng)針對400多個機器學(xué)習(xí)和深度學(xué)習(xí)AI模型進行了驗證,涵蓋所有商業(yè)細分領(lǐng)域最常見的AI應(yīng)用場景。
網(wǎng)絡(luò)
第四代英特爾至強包含一系列針對高性能、低時延網(wǎng)絡(luò)和邊緣工作負載進行了特別優(yōu)化的處理器產(chǎn)品。對于如今電信、零售、制造和智慧城市等行業(yè)正在推動更加軟件定義的未來,這些處理器將發(fā)揮關(guān)鍵性基石作用。對于5G核心工作負載,內(nèi)置加速器有助于提高吞吐量和降低時延,而電源管理的升級則提高了平臺的響應(yīng)能力和能效。此外,與前幾代相比,第四代英特爾至強在不增加功耗的情況下提供多達兩倍的虛擬無線接入網(wǎng)(vRAN)容量。這使通信服務(wù)提供商能夠?qū)⒚客咝阅芴岣咭槐?,滿足其關(guān)鍵的性能、擴展和能效需求。
科學(xué)計算
第四代英特爾至強可擴展處理器和英特爾Max系列產(chǎn)品具備可擴展、平衡的架構(gòu),其中整合了CPU、GPU和oneAPI的開放軟件生態(tài)系統(tǒng),適用于科學(xué)計算和AI等領(lǐng)域要求嚴苛的計算工作負載,旨在幫助解決全球最具挑戰(zhàn)性的問題。
第四代英特爾至強內(nèi)置英特爾AMX專屬AI加速器,大幅提升矩陣乘法運算,為人工智能加速提供了全新方式,與上一代(FP32)相比,內(nèi)置英特爾高級矩陣擴展(英特爾AMX)(BF16)的PyTorch實時AI推理和訓(xùn)練性能提高了10倍。結(jié)合通用CPU計算單元,第四代英特爾至強可擴展處理器可以端到端運行任何AI工作負載。
英特爾至強CPU Max系列是集成高帶寬內(nèi)存的x86處理器,能夠在無需變更代碼的情況下為科學(xué)計算工作負載加速。英特爾數(shù)據(jù)中心GPU Max系列提供極高的計算密度,且具有多種產(chǎn)品規(guī)格以滿足不同的客戶需求。
英特爾至強CPU Max系列可提供64GB的高帶寬內(nèi)存(HBM2e),為科學(xué)計算和AI工作負載大幅提高了數(shù)據(jù)吞吐量。與第三代英特爾至強可擴展處理器的高端SKU相比,英特爾至強CPU Max系列可為如能源、地球系統(tǒng)建模等一系列實際應(yīng)用提供高達3.7倍的性能提升。
?
此外,英特爾數(shù)據(jù)中心GPU Max系列在單個產(chǎn)品上整合47個小芯片,集成了超過1000億個晶體管,為諸如物理、金融服務(wù)和生命科學(xué)等極具挑戰(zhàn)性的工作負載帶來更高的吞吐量。相較上一代產(chǎn)品,英特爾數(shù)據(jù)中心GPU Max系列和至強CPU Max系列的結(jié)合,可以使生命與材料科學(xué)領(lǐng)域LAMMPS處理性能提升12.8倍。
合作案例分享
騰訊云星星海實驗室研發(fā)總監(jiān)曾欽杵現(xiàn)場分享一下騰訊云與英特爾的合作狀況。
騰訊云在云服務(wù)器方面,基于英特爾最新的Sapphire Rapids CPU進行了全面升級,推出了騰訊云第七代云服務(wù)器,標準型的S7和內(nèi)存型的M7這樣的云實例,這兩款產(chǎn)品全面應(yīng)用了騰訊云和英特爾的全新軟硬件技術(shù),充分發(fā)揮了目前產(chǎn)品的新特性,在計算、存儲和網(wǎng)絡(luò)多方面都做了全方位的性能提升。
騰訊云星星海自研服務(wù)器,基于Sapphire Rapids CPU可以提供先進的IO處理能力,包括目前最新一代的PCIe Gen 5,以及下一代IO接口標準CXL1.1,內(nèi)存接口部分也從DDR4升級到了最新的DDR5內(nèi)存接口。在存儲領(lǐng)域,可以提供高達100萬IOPS的存儲性能,通過傲騰持久內(nèi)存的助力,我們可以實現(xiàn)端到端的存儲延時,達到40ms的級別,真正意義上達到了10納秒云存儲的新的性能指標。
在網(wǎng)絡(luò)配置方面,星星海自研服務(wù)器通過搭載騰訊自研的“銀杉”智能網(wǎng)卡,網(wǎng)絡(luò)性能可以提供高達5000萬PPS的網(wǎng)絡(luò)性能。面對不同的業(yè)務(wù)場景,Sapphire Rapids提供了多個全新的內(nèi)嵌的加速器。
中國電信5G云網(wǎng)能力提升,Intel第四代至強處理器助陣
隨著5G網(wǎng)絡(luò)的廣泛應(yīng)用,每一年移動數(shù)據(jù)流量增長50%,主要來自各種視頻內(nèi)容的增長,占到了全部流量的66%。要支撐流量增長的要求,運營商需要極大地增加網(wǎng)絡(luò)容量和吞吐能力,加速網(wǎng)絡(luò)工作負載的系統(tǒng)級處理性能。
天翼云云網(wǎng)產(chǎn)品事業(yè)部的楊鑫分享了和英特爾的合作,解決運營商工作負載不斷提升的挑戰(zhàn)。
經(jīng)過十年的發(fā)展,天翼云目前已經(jīng)是全球最大的運營商云和國內(nèi)最大的混合云。據(jù)IDC今年發(fā)布的報告,天翼云在公有云IaaS市場已經(jīng)排名第三,成為國內(nèi)一線云服務(wù)提供商。
中國電信和英特爾一起合作推出天翼云的第八代云主機,基于英特爾第四代英特爾至強可擴展處理器?;谟⑻貭柕男酒軜?gòu),天翼云第八代彈性云主機可以支持128vCPU的大規(guī)格實例,支持8通道的DDR5內(nèi)存,包括單條的內(nèi)存帶寬高達4800MT/S,性能較上一代有大幅度提升。
基于第四代英特爾至強可擴展處理器的英特爾DLB的特性,天翼云有超過200萬的政企客戶,很多政企客戶除了提供普通的互聯(lián)網(wǎng)上云,對政企客戶我們重點提供了云專線、SD-WAN和VPN上云,而這個上云會采用IPSec加密隧道來做處理。傳統(tǒng)的方式對性能有較大的影響,特別是大帶寬的場景下,它是占據(jù)了某顆CPU的轉(zhuǎn)發(fā)能力,影響同CPU的其他業(yè)務(wù)量的傳輸,而造成丟包、擁塞的業(yè)務(wù)質(zhì)量下降。而通過和英特爾的合作,天翼云利用CPU的英特爾DLB硬件加速特性,針對IPSec的大象流處理做了優(yōu)化。相比之前的純軟件方案,英特爾DLB的加速方案穩(wěn)定可靠,帶來了更好的線性擴展,最高可以達到4倍以上的吞吐收益,有效解決了在入云環(huán)節(jié)針對大象流加密處理的業(yè)務(wù)難題。
-
處理器
+關(guān)注
關(guān)注
68文章
19259瀏覽量
229650 -
英特爾
+關(guān)注
關(guān)注
61文章
9949瀏覽量
171692 -
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
4761瀏覽量
72033
發(fā)布評論請先 登錄
相關(guān)推薦
評論