與上一代產(chǎn)品相比:第五代英特爾至強處理器的平均科學計算性能提升高達1.22倍,可以幫助企業(yè)顯著提升基礎設施的價值1;平均每瓦性能提升高達1.08倍,有助于降低成本和碳足跡。其基于硬件的安全功能和可擴展的特性,還可幫助企業(yè)和機構提升系統(tǒng)的正常運行時間以及構建面向未來IT基礎設施。本代處理器還提供面向科學計算與AI融合工作負載的通用CPU平臺,有助于加速價值實現(xiàn)。
雖然傳統(tǒng)的科學計算系統(tǒng)是為單體應用設計的,但它正在向更靈活的方向轉變,以應對更多樣化的需求。同時,這種演變也讓從業(yè)者更加重視開放標準的軟硬件,以促使各類解決方案和工作負載能夠共存,并在共享系統(tǒng)上實現(xiàn)更出色的結果。在未經(jīng)優(yōu)化的硬件上部署AI工作負載,可能無法實現(xiàn)每瓦性能目標。開放式跨架構編程模型可以避免為多種架構和異構加速器重新編碼,其重要性日益凸顯。這些模型還有助于避免專有軟件綁定風險,延長科學應用的壽命,更好地應對未來需求。
第五代英特爾至強處理器依然受英特爾軟硬件生態(tài)系統(tǒng)的支持,能夠助力加速傳統(tǒng)科學計算以及科學計算與AI融合工作負載,更快獲取價值。本代處理器非常適合具有高級遷移學習或調優(yōu)要求的中小型專用模型。針對深度學習和通用工作負載的基于硬件的加速技術可為融合科學計算應用提供實時吞吐量和更低時延。
與第四代英特爾至強處理器相比,第五代英特爾至強處理器每路提供多達64個高性能內核(128條線程),三級緩存容量增加高達3倍3。這些變化可提升諸如電子設計自動化(EDA)和計算流體動力學(CFD)等要求嚴苛且高度并行工作負載的處理器內核利用率。第五代英特爾 至強 處理器提供速率高達5600MT/s的DDR5內存4以及多達80條PCIe5.0通道,I/O功能更強大,可優(yōu)化時延并持續(xù)向內核傳輸數(shù)據(jù)。
第五代英特爾至強處理器與第四代英特爾至強處理器在軟件和引腳上兼容,升級后可以延長IT投資的生命周期并提升回報率。如果是基于更早的英特爾至強處理器進行升級,這些優(yōu)勢將更為顯著。持續(xù)的平臺創(chuàng)新更廣泛地優(yōu)化了數(shù)據(jù)傳輸和處理,同樣有助于科學計算與AI融合的實施。
英特爾加速引擎
第五代英特爾至強 處理器配備英特爾加速引擎,憑借眾多內置加速器,為AI、科學計算、數(shù)據(jù)分析、網(wǎng)絡和存儲等關鍵任務提升吞吐量。由于它們內置于處理器中,與獨立解決方案或在內核上運行的基于軟件的解決方案相比,不會產(chǎn)生從片外訪問PCIe總線上獨立加速器的時延,相應地,就節(jié)省了能耗。因此,英特爾加速引擎能夠幫助企業(yè)和機構實現(xiàn)更好的性能并節(jié)省資本支出(CapEx)和運營支出(OpEx)。
?性能:專用的加速器大幅提升目標工作負載的吞吐量。其中,英特爾高級矩陣擴展(IntelAdvancedMatrixExtensions,英特爾AMX)可加速CPU上的AI工作負載,無需額外的專用硬件即可提高吞吐量。
?運營和系統(tǒng)成本:使用內置加速器可以減少對額外系統(tǒng)投資的需求,而系統(tǒng)占用空間的減少可以節(jié)省大量能源。 基于第五代英特爾至強處理器的科學計算與AI融合解決案采用先進的指令集架構(ISA),旨在加速常見的AI和機器學習任務。例如,英特爾矢量神經(jīng)網(wǎng)絡指令(VNNI)通過將三條指令合并為一條,以完成INT8運算中的乘累加,從而加速推理。支持的新數(shù)據(jù)類型還包括BF16,這種16位浮點格式可以加速推理,同時保持模型準確性。通過使用較低精度并降低計算要求,能夠縮短模型訓練時間(或推理時間)。
可立即部署的科學計算與AI融合工具
在各行各業(yè)以及各科學領域的科學計算工作流程中,AI的應用越來越普遍,有望顯著提高效率。AI與科學計算的融合可能發(fā)生在應用或工作流程層面。在科學計算領域中,可運用AI模型替代傳統(tǒng)模型來完成某些任務,比如從粗網(wǎng)格(coarsemesh)中創(chuàng)建細網(wǎng)格(finemesh)結果。AI模型可能會以更短的時間和更高的精確度完成這項工作。在科學計算工作流程中,AI可用于后處理,以評估結果并為用戶生成洞察,也可用于預處理,以改進科學計算工作負載中使用的輸入數(shù)據(jù)集。
英特爾軟件開發(fā)工具由oneAPI提供支持,包括編譯器、庫、框架和性能工具,用以構建、分析和調整面向英特爾架構優(yōu)化的高質量跨平臺軟件。具體而言,英特爾軟件開發(fā)工具簡化了英特爾加速引擎在解決方案中的應用,有助于提高CPU、GPU以及FPGA等其他硬件的性能和效率。這些工具包括英特爾oneAPI基礎工具套件和英特爾oneAPIHPC工具套件,用于在共享和分布式內存計算系統(tǒng)中構建、分析和擴展應用,以及英特爾AI工具,用于加速端到端數(shù)據(jù)科學和機器學習管線。
此外,英特爾還通過參與開源和將新增值優(yōu)化提交至上游,以及與整個解決方案生態(tài)系統(tǒng)建立合作伙伴關系,堅定地致力于生態(tài)系統(tǒng)的支持。有了這些支持措施,開發(fā)人員就可以用更短的時間和更少的精力與英特爾的技術路線圖保持一致,并能以經(jīng)濟高效的方式提高解決方案的性能、效率和未來就緒性。
更出色的性能和總體擁有成本優(yōu)勢
第五代英特爾至強處理器提高了一系列科學計算基準測試和工作負載的吞吐量。這些優(yōu)勢主要得益于更多的內核數(shù)、更大的三級緩存以及更大的內存帶寬。除了提高系統(tǒng)資本投資的價值外,第五代英特爾至強處理器還有助于減少能源消耗,從而優(yōu)化總體擁有成本(TCO)。
為滿足各種科學計算和AI融合用例,解決方案架構師可以采用額外的配套英特爾硬件技術,而無需移植或重構代碼,從而保持整個環(huán)境的軟件兼容性。為了改善要求嚴苛的內存帶寬敏感型工作負載的性能,英特爾至強CPUMax系列在處理器封裝上集成了高達64GB的HBM2e高帶寬內存,減少了通過內存總線獲取數(shù)據(jù)的需求。 多樣化的英特爾軟硬件技術為科學計算與AI融合從業(yè)者提供了面向未來的創(chuàng)新能力,讓他們能夠更快、更經(jīng)濟高效地解決復雜的計算問題。
注釋:
1. 英特爾銳炫 B580 提供出色的性能與價格平衡,是一款建議零售價在250至300美元之間的顯卡。在1440p超高清的光柵化和光線追蹤設置下測試了40多款游戲。截至2024年11月13日的測試日期,價格與建議零售價相比一直保持穩(wěn)定。詳情請見intel.com/performanceindex。
2. XeSS 2中的XeSS幀生成技術可帶來高達3.9倍的性能提升,這是在1440p超高清分辨率下使用英特爾銳炫 B580運行游戲F1 24,啟用XeSS超高性能模式的測試結果。詳情請見intel.com/performanceindex。
3. 與上一代英特爾銳炫A750限量版相比,基于在1440p超高清分辨率下對各種游戲進行平均測試得出的結果,第二代Xe核心可為英特爾銳炫B系列帶來高達70%的每Xe核心性能提升。詳情請見intel.com/performanceindex。
4. 與上一代英特爾銳炫A750限量版相比,基于在1440p超高清分辨率下對各種游戲進行平均測試得出的結果,第二代Xe核心可為英特爾銳炫B系列帶來高達50%的每瓦特性能提升。詳情請見intel.com/performanceindex。
5. 在1440p超高清設置下的各種游戲中,英特爾銳炫 B580比英特爾銳炫A750限量版快24%,其中選定的游戲啟用XeSS性能模式(如果可用)。詳情請見intel.com/performanceindex。
AI功能可能需要購買軟件、訂閱、由軟件或平臺提供商啟用,可能會有特定的配置或兼容性要求。詳情請見intel.com/AIPC。結果可能會有所不同。
-
處理器
+關注
關注
68文章
19259瀏覽量
229647 -
英特爾
+關注
關注
61文章
9949瀏覽量
171687 -
至強處理器
+關注
關注
0文章
23瀏覽量
9186
原文標題:面向科學計算,第五代英特爾? 至強? 可擴展處理器優(yōu)勢何在?
文章出處:【微信號:英特爾中國,微信公眾號:英特爾中國】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論