RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

智譜推出四個全新端側(cè)模型 攜英特爾按下AI普及加速鍵

looger123 ? 來源:looger123 ? 作者:looger123 ? 2024-12-02 17:13 ? 次閱讀

隨著AI的發(fā)展,端側(cè)AI模型越來越受到廣大客戶及廠商的關(guān)注,業(yè)界領(lǐng)先的大模型公司智譜于近日推出了四個全新的端側(cè)模型,加速AI前沿技術(shù)路徑與創(chuàng)新應(yīng)用場景探索,推動AI大模型普惠化發(fā)展。

四個模型中,GLM-Edge-4B-chat、GLM-Edge-1.5B-chat為端側(cè)大語言模型,GLM-Edge-V-5B、GLM-Edge-V-2B為端側(cè)多模態(tài)模型,這四個模型分別具有4.3B/1.5B/4.8B/2B參數(shù)量。兩個端側(cè)的大語言模型適合意圖理解、智能對話、文本創(chuàng)作、知識庫問答等,兩個端側(cè)的多模態(tài)模型適用于視覺理解、創(chuàng)意描述、本地搜索、圖片問答等。這四個模型即將在Github、Huggingface、模搭等多個開源社區(qū)上發(fā)布。

為了確保這些新模型能夠在實(shí)際應(yīng)用中發(fā)揮卓越性能,英特爾與智譜緊密合作,利用最新的英特爾酷睿Ultra處理器(第二代)硬件平臺和OpenVINOTMAI推理加速軟件對模型的性能進(jìn)行優(yōu)化。通過與英特爾的緊密合作,智譜的新模型在計(jì)算效率、推理速度和能效比等方面得到了顯著提升。

英特爾酷睿Ultra處理器集成了專門的AI加速器,顯著提升AI和機(jī)器學(xué)習(xí)任務(wù)的處理能力。OpenVINOTM是由英特爾發(fā)起的AI推理優(yōu)化部署軟件框架,旨在優(yōu)化和加速深度學(xué)習(xí)模型在各種英特爾硬件上的推理性能,提供高效的模型優(yōu)化和跨平臺部署能力,使得開發(fā)者能夠在CPU、GPU、NPU 等多種硬件上實(shí)現(xiàn)卓越的AI推理性能。

在強(qiáng)大的硬件基礎(chǔ)上,OpenVINO采用多種優(yōu)化策略對智譜模型進(jìn)行優(yōu)化。INT4低精度模型量化;基于kvcache的stateful模型優(yōu)化;基于模型圖融合優(yōu)化,包括SDPA GQA,RoPE fusion等等。

通過這些優(yōu)化,英特爾在基于酷睿Ultra第二代處理器的AIPC上做到了對相關(guān)模型的Day 0(第零日)支持并取得了很好的性能(如下圖):

wKgZPGdNekqAGlFgAADawgzfCAM457.png

在AI PC領(lǐng)域,英特爾正在引領(lǐng)市場前行。英特爾目前已出貨了超過2,000萬臺AIPC設(shè)備,構(gòu)建了擁有超過100家ISV、300多項(xiàng)AI應(yīng)用、500多個AI模型的龐大生態(tài)系統(tǒng)。

產(chǎn)品層面,英特爾也在與OEM廠商密切合作,推出以酷睿Ultra處理器為核心的AIPC??犷ltra同時(shí)實(shí)現(xiàn)了出色的性能和續(xù)航能力,基于強(qiáng)大的x86架構(gòu),通過CPU、GPU算力,酷睿Ultra能夠充分發(fā)揮AI技術(shù)的優(yōu)勢。

未來英特爾會與智譜進(jìn)一步加強(qiáng)在端側(cè)模型上的合作,并利用酷睿Ultra處理器上不斷提升的AI能力,充分賦能更多AIPC上的應(yīng)用,讓用戶在基于英特爾酷睿Ultra的AIPC上有更好的體驗(yàn)。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    9949

    瀏覽量

    171687
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    30728

    瀏覽量

    268874
收藏 人收藏

    評論

    相關(guān)推薦

    發(fā)布智清言英特爾酷睿Ultra專享版

    近日,國內(nèi)頂尖的大模型廠商智譜在官方網(wǎng)站智清言上,正式推出了智清言英特爾酷睿Ultra專享版。這一版本充分利用了
    的頭像 發(fā)表于 12-19 11:37 ?198次閱讀

    清言英特爾酷睿Ultra專享版發(fā)布,離線模型玩轉(zhuǎn)AIPC

    近日,國內(nèi)領(lǐng)先的大模型廠商智譜在智清言的官網(wǎng)發(fā)布了智清言英特爾酷睿Ultra專享版,這個版本可以利用英特爾酷睿Ultra處理器提供的澎湃
    的頭像 發(fā)表于 12-18 11:52 ?152次閱讀

    使用英特爾AI PC為YOLO模型訓(xùn)練加速

    之后,情況有了新的變化,PyTorch2.5正式開始支持英特爾顯卡,也就是說,此后我們能夠借助英特爾 銳炫 顯卡來進(jìn)行模型訓(xùn)練了。
    的頭像 發(fā)表于 12-09 16:14 ?223次閱讀
    使用<b class='flag-5'>英特爾</b><b class='flag-5'>AI</b> PC為YOLO<b class='flag-5'>模型</b>訓(xùn)練<b class='flag-5'>加速</b>

    英特爾推出全新英特爾銳炫B系列顯卡

    備受玩家青睞的價(jià)格提供卓越的性能與價(jià)值1,很好地滿足現(xiàn)代游戲需求,并為AI工作負(fù)載提供加速。其配備的英特爾Xe矩陣計(jì)算引擎(XMX),為新推出的XeSS 2提供強(qiáng)大支持。XeSS 2的
    的頭像 發(fā)表于 12-07 10:16 ?668次閱讀
    <b class='flag-5'>英特爾</b><b class='flag-5'>推出</b><b class='flag-5'>全新</b><b class='flag-5'>英特爾</b>銳炫B系列顯卡

    英特爾發(fā)布全新企業(yè)AI一體化方案

    近日,英特爾正式推出全新的企業(yè)AI一體化方案。該方案以英特爾至強(qiáng)處理器和英特爾Gaudi 2D
    的頭像 發(fā)表于 12-03 11:20 ?208次閱讀

    英特爾發(fā)布全新企業(yè)AI一體化解決方案

    近日,英特爾正式推出了其全新的企業(yè)AI一體化解決方案,這一方案旨在為企業(yè)提供更加開放、可擴(kuò)展且高效的
    的頭像 發(fā)表于 12-02 10:48 ?476次閱讀

    英特爾聚焦AI座艙

    英特爾推出首款銳炫車載獨(dú)立顯卡(dGPU)和第一代英特爾軟件定義車載SoC系列,滿足當(dāng)前消費(fèi)者對汽車內(nèi)部配備更多屏幕、獲得更高清晰度等AI座艙體驗(yàn)需求。
    的頭像 發(fā)表于 10-30 16:26 ?197次閱讀

    Inflection AI攜手英特爾推出企業(yè)級AI系統(tǒng)

    近日,AI初創(chuàng)企業(yè)Inflection AI英特爾聯(lián)合宣布了一項(xiàng)重大合作——推出基于英特爾Gaudi 3
    的頭像 發(fā)表于 10-09 16:40 ?430次閱讀

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈

    英特爾助力京東云用CPU加速AI推理,以大模型構(gòu)建數(shù)智化供應(yīng)鏈
    的頭像 發(fā)表于 05-27 11:50 ?529次閱讀
    <b class='flag-5'>英特爾</b>助力京東云用CPU<b class='flag-5'>加速</b><b class='flag-5'>AI</b>推理,以大<b class='flag-5'>模型</b>構(gòu)建數(shù)智化供應(yīng)鏈

    已有超過500款AI模型英特爾酷睿Ultra處理器上得以優(yōu)化運(yùn)行

    近日,英特爾宣布在全新英特爾 酷睿 Ultra處理器上,有超過500款AI模型得以優(yōu)化運(yùn)行。
    的頭像 發(fā)表于 05-11 09:31 ?708次閱讀

    英特爾酷睿Ultra處理器突破500AI模型優(yōu)化

    英特爾在最新推出英特爾? 酷睿? Ultra處理器上宣布,超過500款AI模型已得到優(yōu)化運(yùn)行。這款處理器無疑是市場上領(lǐng)先的
    的頭像 發(fā)表于 05-09 11:18 ?760次閱讀

    英特爾升級AI PC加速計(jì)劃

    近日,英特爾公司正式推出AI PC加速計(jì)劃”,旨在通過兩大新舉措進(jìn)一步推動人工智能技術(shù)在個人電腦領(lǐng)域的應(yīng)用與發(fā)展。
    的頭像 發(fā)表于 03-28 11:46 ?669次閱讀

    浪潮信息&quot;源2.0&quot;大模型YuanChat支持英特爾最新商用AI PC

    % 。企業(yè)可以在全新英特爾商用客戶AI PC上,使用AI PC大模型效率工具"YuanCha
    的頭像 發(fā)表于 03-27 22:52 ?496次閱讀
    浪潮信息&quot;源2.0&quot;大<b class='flag-5'>模型</b>YuanChat支持<b class='flag-5'>英特爾</b>最新商用<b class='flag-5'>AI</b> PC

    英特爾酷睿Ultra通過全新英特爾vPro平臺將AI PC惠及企業(yè)

    近日,英特爾在2024年世界移動通信大會(MWC 2024)上宣布,全新英特爾?vPro?平臺將AI PC的優(yōu)勢惠及商用客戶。
    的頭像 發(fā)表于 03-18 15:07 ?508次閱讀

    英特爾推出全新vPro平臺,將AI PC的優(yōu)勢延伸至商用領(lǐng)域

    在2024年世界移動通信大會(MWC 2024)上,英特爾宣布了其全新英特爾?vPro?平臺的發(fā)布,旨在將AI PC的先進(jìn)功能帶給商用客戶。這一平臺結(jié)合了內(nèi)置
    的頭像 發(fā)表于 03-03 15:47 ?1160次閱讀
    RM新时代网站-首页