RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開箱即用,AISBench測試展示英特爾至強處理器的卓越推理性能

looger123 ? 來源:looger123 ? 作者:looger123 ? 2024-09-06 15:33 ? 次閱讀

近期,第五代英特爾?至強?可擴展處理器通過了中國電子技術(shù)標準化研究院組織的人工智能服務(wù)器系統(tǒng)性能測試(AISBench)。英特爾成為首批通過AISBench大語言模型(LLM)推理性能測試的企業(yè)。

中國電子技術(shù)標準化研究院賽西實驗室依據(jù)國家標準《人工智能服務(wù)器系統(tǒng)性能測試規(guī)范》(征求意見稿)相關(guān)要求,使用AISBench2.0測試工具,完成了第五代英特爾至強可擴展處理器的AI大模型推理性能和精度測試。測試中,第五代英特爾至強在ChatGLM V2-6B(60億參數(shù))以及 Llama2-13B(130億參數(shù))兩個模型上均展現(xiàn)出卓越推理性能,能夠滿足輕量級大語言模型的實時推理要求。

wKgZombasFCAOb28AAQWiisN-UI496.png

測試結(jié)果:此次單機性能測試中,在滿足人類正常閱讀速度要求(生成延遲小于100毫秒)的情況下,在封閉測試場景中構(gòu)造數(shù)據(jù)集,基于第五代英特爾至強的服務(wù)器可實現(xiàn):

?在60億參數(shù)的ChatGLM V2模型通用推理中,當輸入輸出序列為256時可達每秒2493 token的性能,當輸入輸出序列為2048時可達每秒926 token。

?在130億參數(shù)的Llama2模型通用推理中,當輸入輸出為256時可達每秒513 token,當輸入輸出序列為2048時可達每秒132 token1。


作為通用處理器,第五代英特爾至強在人工智能、網(wǎng)絡(luò)、存儲、數(shù)據(jù)庫等關(guān)鍵工作負載均能提供出色性能。AISBench2.0的測試結(jié)果驗證了英特爾至強在運行輕量級大語言模型時展現(xiàn)出的優(yōu)異推理性能,使得客戶可以使用基于至強的服務(wù)器,構(gòu)建一個通用AI系統(tǒng)進行數(shù)據(jù)預(yù)處理、模型推理和部署,從而獲得兼具AI性能、效率、準確性和可擴展性的組合。這也彰顯了英特爾至強可以為企業(yè)提供“開箱即用”的功能,即可以在通用系統(tǒng)上部署一部分AI工作負載,從而為客戶帶來更佳的總體擁有成本(TCO)優(yōu)勢。

軟硬結(jié)合,至強展現(xiàn)AI優(yōu)勢

英特爾至強的內(nèi)置AI加速器使其成為在通用處理器上運行部分AI工作負載的理想解決方案,不僅如此,英特爾還配備了經(jīng)過優(yōu)化的、易于編程的開放軟件,可降低客戶和生態(tài)伙伴在數(shù)據(jù)中心部署從云到智能邊緣各種基于AI的解決方案的門檻。

?第五代英特爾至強可擴展處理器充分發(fā)揮了系統(tǒng)級優(yōu)勢(包括緩存、內(nèi)存等),因此推理速度實現(xiàn)了大幅提升。

?其內(nèi)置的AI加速器——英特爾?高級矩陣擴展(AMX),通過提供專用的矩陣運算加速模塊(TMUL),以及支持INT8和BF16這類低精度數(shù)據(jù)類型,可實現(xiàn)對計算資源的充分利用,從而大幅提升運算效率。

?xFasterTransformer(簡稱xFT)是英特爾提供的在CPU平臺上部署大語言模型的深度優(yōu)化開放解決方案,通過C++Python兩種API接口,更易于用戶使用和將其集成到自有業(yè)務(wù)框架中。

關(guān)于AISBench

AISBench基準是一套應(yīng)用于人工智能計算產(chǎn)品的性能測試基準,由中國電子技術(shù)標準化研究院牽頭研制。與MLPerf等國際先進計算基準類似,該基準用于測試多種人工智能計算產(chǎn)品形態(tài),并支持豐富的測試場景、模式、類型和指標。

產(chǎn)品與性能信息

1.服務(wù)器:在搭載第五代英特爾?至強?處理器的Quanta Cloud Technology 服務(wù)器 QuantaGrid D54Q-2U上測量,CPU:英特爾至強鉑金8592+、64核,超線程開啟、睿頻開啟、NUMA 4,內(nèi)存:1.5 TB、硬盤:Intel P5800X 3.2TB NVME ,、操作系統(tǒng):Ubuntu 22.04、測試軟件:AISBench、深度學(xué)習框架:PyTorch 2.3.1、模型數(shù)據(jù)精度:BF16。英特爾于2024年6月26日至7月26日進行測試。

客戶端:第十一代英特爾?酷睿?i7-1185G7:在戴爾Latitude 7420上測量,內(nèi)存:16.0 GB、硬盤:256 GB、操作系統(tǒng):Microsoft Windows 11Enterprise、測試軟件:MobaXtermPersonalEdition v22.0 Build 4858。英特爾于2024年6月26日至7月26日進行測試。

測試工具:性能測試工具AISBench 2.0。

免責聲明

性能因使用情況、配置和其他因素而異。欲了解更多信息,請訪問性能指數(shù)網(wǎng)站。性能結(jié)果基于截至所示日期的測試,可能無法反映所有公開可用的更新。請參閱備份以了解配置詳情。沒有任何產(chǎn)品或組件是絕對安全的。您的成本和結(jié)果可能會有所不同。英特爾技術(shù)可能需要啟用硬件、軟件或激活服務(wù)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9949

    瀏覽量

    171687
  • 至強處理器
    +關(guān)注

    關(guān)注

    0

    文章

    23

    瀏覽量

    9186
收藏 人收藏

    評論

    相關(guān)推薦

    英特爾至強品牌新戰(zhàn)略發(fā)布

    品牌是企業(yè)使命和發(fā)展的象征,也承載著產(chǎn)品特質(zhì)和市場認可。在英特爾GTC科技體驗中心的英特爾 至強 6 能效核處理器發(fā)布會上,英特爾公司全球副
    的頭像 發(fā)表于 10-12 10:13 ?430次閱讀

    英特爾發(fā)布至強6性能處理器

    近日,英特爾正式推出了其全新的英特爾? 至強? 6性能處理器(代號Granite Rapids),旨在為AI、數(shù)據(jù)分析、科學(xué)計算等計算密集
    的頭像 發(fā)表于 09-30 16:22 ?438次閱讀

    英特爾?至強?可擴展處理器助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    在現(xiàn)代醫(yī)療行業(yè),人工智能(AI)、物聯(lián)網(wǎng)(IoT)和5G網(wǎng)絡(luò)等前沿技術(shù)正在重新定義醫(yī)療服務(wù)的提供方式。英特爾?至強?可擴展處理器通過在醫(yī)院從邊緣到云端的全面部署,構(gòu)建了一個高效的數(shù)字化解決方案,幫助
    發(fā)表于 09-29 11:13 ?6078次閱讀
    <b class='flag-5'>英特爾</b>?<b class='flag-5'>至強</b>?可擴展<b class='flag-5'>處理器</b>助力智慧醫(yī)療的數(shù)字化轉(zhuǎn)型

    128核性能猛獸,劍指云數(shù)據(jù)中心算力升級!英特爾發(fā)布至強6性能處理器

    9月26日,在全國五十多家媒體和多家合作伙伴的見證下,英特爾發(fā)布了英特爾至強6性能處理器(代號Granite Rapids),這是繼今年6
    的頭像 發(fā)表于 09-29 07:53 ?4199次閱讀
    128核<b class='flag-5'>性能</b>猛獸,劍指云數(shù)據(jù)中心算力升級!<b class='flag-5'>英特爾</b>發(fā)布<b class='flag-5'>至強</b>6<b class='flag-5'>性能</b>核<b class='flag-5'>處理器</b>

    英特爾發(fā)布至強6性能處理器,攜手生態(tài)加速數(shù)據(jù)中心算力升級

    9月26日,英特爾正式發(fā)布英特爾? 至強? 6性能處理器(代號Granite Rapids),為AI、數(shù)據(jù)分析、科學(xué)計算等計算密集型業(yè)務(wù)提
    的頭像 發(fā)表于 09-27 10:54 ?3817次閱讀
    <b class='flag-5'>英特爾</b>發(fā)布<b class='flag-5'>至強</b>6<b class='flag-5'>性能</b>核<b class='flag-5'>處理器</b>,攜手生態(tài)加速數(shù)據(jù)中心算力升級

    英特爾發(fā)布至強6處理器產(chǎn)品

    以“綠色向新,釋放新質(zhì)生產(chǎn)力”為主題的英特爾至強6能效核處理器新品發(fā)布會在北京舉行。會上,英特爾重磅推出首款配備能效核的英特爾
    的頭像 發(fā)表于 09-23 15:48 ?359次閱讀

    采用144核,能效提升66%!英特爾至強6處理器震撼上市,加速數(shù)據(jù)中心升級

    6能效核處理器基于Intel 3制程工藝,憑借高核心密度及出色的每瓦性能,可在提供高效算力的同時顯著降低能源成本。英特爾至強6700E采用144核,可以滿足高密度計算需求。令人興奮的是
    的頭像 發(fā)表于 06-11 18:13 ?7254次閱讀
    采用144核,能效提升66%!<b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>6<b class='flag-5'>處理器</b>震撼上市,加速數(shù)據(jù)中心升級

    英特爾首款至強6處理器上市

    在北京這座古都的現(xiàn)代舞臺上,英特爾?舉行了一場別開生面的新品發(fā)布會,主題為“綠色向新,釋放新質(zhì)生產(chǎn)力”。此次盛會聚焦在英特爾至強? 6能效核處理器上,這一劃時代的產(chǎn)品不僅代表著
    的頭像 發(fā)表于 06-11 09:51 ?566次閱讀

    英特爾發(fā)布至強6能效核處理器

    英特爾近日發(fā)布了一款革命性的處理器產(chǎn)品——至強6(代號Sierra Forest)。這款處理器以其獨特的能效核設(shè)計和基于Intel 3制程工藝的技術(shù),在提供
    的頭像 發(fā)表于 06-07 15:55 ?558次閱讀

    浪潮信息元腦?服務(wù)率先支持英特爾?至強?6處理器

    支持最新英特爾?至強?6處理器,具備更出色的性能和能效表現(xiàn),相比第三代至強處理器
    的頭像 發(fā)表于 06-07 15:36 ?392次閱讀
    浪潮信息元腦?服務(wù)<b class='flag-5'>器</b>率先支持<b class='flag-5'>英特爾</b>?<b class='flag-5'>至強</b>?6<b class='flag-5'>處理器</b>

    寧暢B5000 G5多節(jié)點服務(wù)采用第五代英特爾至強可擴展處理器

    “基于第五代英特爾 至強 可擴展處理器的寧暢B5000 G5多節(jié)點服務(wù),可以在滿足大量AI推理場景在吞吐量、時延、容量、并發(fā)能力等方面的需
    的頭像 發(fā)表于 05-27 11:46 ?815次閱讀
    寧暢B5000 G5多節(jié)點服務(wù)<b class='flag-5'>器</b>采用第五代<b class='flag-5'>英特爾</b><b class='flag-5'>至強</b>可擴展<b class='flag-5'>處理器</b>

    英特爾展示下一代至強處理器,助力vRAN性能顯著提升

    里程碑事件不僅凸顯了移動行業(yè)推動vRAN和Open RAN發(fā)展的長期投入,也表明了英特爾正在持續(xù)踐行其以領(lǐng)先的產(chǎn)品路線圖助力行業(yè)發(fā)展的堅定承諾。代號為Granite Rapids–D的下一代至強處理器將于2025年發(fā)布,這款
    的頭像 發(fā)表于 03-01 15:43 ?424次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>展示</b>下一代<b class='flag-5'>至強</b><b class='flag-5'>處理器</b>,助力vRAN<b class='flag-5'>性能</b>顯著提升

    英特爾至強處理器優(yōu)化升級,助力打造未來高能效數(shù)據(jù)中心

    英特爾最新發(fā)布的第五代至強可擴展處理器,擁有多達64個核心,性能提升高達1.4倍。 英特爾于去年12月正式推出了擁有多達64個核心的第五代
    的頭像 發(fā)表于 02-26 17:39 ?704次閱讀

    性能存儲實現(xiàn)新突破的英特爾至強處理器

    基于第四代英特爾 至強 可擴展處理器的 Curve 高性能分布式存儲方案在吞吐、時延、TCO 等方面具備出色優(yōu)勢,能夠為金融、互聯(lián)網(wǎng)、交通、能源等各行業(yè)提供高效的云原生存儲解決方案。
    發(fā)表于 02-26 14:01 ?493次閱讀
    高<b class='flag-5'>性能</b>存儲實現(xiàn)新突破的<b class='flag-5'>英特爾</b><b class='flag-5'>至強</b><b class='flag-5'>處理器</b>

    英特爾專家為您揭秘第五代英特爾? 至強? 可擴展處理器如何為AI加速

    % 1 ,AI 推理性能提升42% 2 。 這一系列性能提升的背后,存在著怎樣的創(chuàng)新與突破?第五代英特爾 至強 可擴展處理器為什么要強調(diào)為A
    的頭像 發(fā)表于 12-23 12:20 ?731次閱讀
    RM新时代网站-首页