RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

寒武紀(jì)首顆AI訓(xùn)練芯片:7納米制程且算力提升四倍

電子觀察說(shuō) ? 來(lái)源:時(shí)刻頭條 ? 作者:電子觀察說(shuō) ? 2021-01-21 13:52 ? 次閱讀

1月21日,寒武紀(jì)思元290智能芯片及加速卡、玄思1000智能加速器在官網(wǎng)低調(diào)亮相,寒武紀(jì)表示該系列產(chǎn)品已實(shí)現(xiàn)規(guī)模化出貨。去年,寒武紀(jì)招股書(shū)曾簡(jiǎn)單披露了一款訓(xùn)練芯片的“彩蛋”,此后,寒武紀(jì)思元290芯片就一直被業(yè)界廣泛關(guān)注并引發(fā)行業(yè)諸多猜想。如今,隨著新一代訓(xùn)練產(chǎn)品線集中亮相,寒武紀(jì)略顯“神秘”的訓(xùn)練芯片及相應(yīng)的業(yè)務(wù)布局逐漸清晰。

思元290智能芯片是寒武紀(jì)的首顆訓(xùn)練芯片,采用臺(tái)積電7nm先進(jìn)制程工藝,集成460億個(gè)晶體管,支持MLUv02擴(kuò)展架構(gòu),全面支持AI訓(xùn)練、推理或混合型人工智能計(jì)算加速任務(wù)。寒武紀(jì)MLU290-M5智能加速卡搭載思元290智能芯片,采用開(kāi)放加速模塊OAM設(shè)計(jì),具備64個(gè)MLU Core,1.23TB/s內(nèi)存帶寬以及全新MLU-Link?多芯互聯(lián)技術(shù),在350W的最大散熱功耗下提供AI算力高達(dá)1024 TOPS(INT4)。

寒武紀(jì)玄思1000智能加速器,在2U機(jī)箱內(nèi)集成4顆思元290智能芯片,高速本地閃存、Mellanox InfiniBand網(wǎng)絡(luò),對(duì)外提供高速M(fèi)LU-Link?接口,打破智能芯片、服務(wù)器、POD與集群的傳統(tǒng)數(shù)據(jù)中心橫向擴(kuò)展架構(gòu),實(shí)現(xiàn)AI算力在計(jì)算中心級(jí)縱向擴(kuò)展,是AI算力的高集成度平臺(tái)。寒武紀(jì)訓(xùn)練產(chǎn)品線采用自適應(yīng)精度訓(xùn)練方案,面向互聯(lián)網(wǎng)、金融、交通、能源、電力和制造等領(lǐng)域的復(fù)雜AI應(yīng)用場(chǎng)景提供充裕算力,推動(dòng)人工智能賦能產(chǎn)業(yè)升級(jí)。

思元290采用MLUv02擴(kuò)展架構(gòu)

MLUv02架構(gòu)為寒武紀(jì)MLU200全產(chǎn)品線共享,滿足云、邊、端三個(gè)場(chǎng)景的算力需求。云端訓(xùn)練對(duì)AI算力的要求更為苛刻,因此寒武紀(jì)對(duì)思元290的MLUv02架構(gòu)進(jìn)行了多項(xiàng)擴(kuò)展,包括業(yè)內(nèi)領(lǐng)先的MLU-Link?多芯互聯(lián)技術(shù)、高帶寬HBM2內(nèi)存、高速片上總線NOC以及新一代PCIe 4.0接口。相比寒武紀(jì)思元270芯片,思元290芯片實(shí)現(xiàn)峰值算力提升4倍、內(nèi)存帶寬提高12倍、芯片間通訊帶寬提高19倍。新架構(gòu)結(jié)合7nm制程,思元290可提供更優(yōu)性能功耗比,以及多MLU系統(tǒng)的擴(kuò)展能力。

MLU290的MLUv02架構(gòu)進(jìn)行了多項(xiàng)擴(kuò)展

寒武紀(jì)MLU-Link?多芯互聯(lián)技術(shù)

近年來(lái),AI算法模型的復(fù)雜程度高速增長(zhǎng),對(duì)算力和訓(xùn)練速度提出了更高的要求。為了構(gòu)建更強(qiáng)大的計(jì)算平臺(tái),多芯片間的互聯(lián)技術(shù)已成為市場(chǎng)剛需。

寒武紀(jì)推出MLU-Link?多芯互聯(lián)技術(shù),并首次搭載于寒武紀(jì)思元290芯片,每顆思元290的多芯互聯(lián)總帶寬高達(dá)600GB/s。MLU-Link?具備豐富的互聯(lián)特性,突破PCIe帶寬和互聯(lián)的瓶頸,相比思元270芯片通過(guò)PCIe并行的通訊方式,帶寬提高19倍。MLU-Link?多芯互聯(lián)技術(shù)支持多顆思元芯片無(wú)縫互聯(lián),支持跨系統(tǒng)互聯(lián),將縱向擴(kuò)展能力整合到整個(gè)人工智能計(jì)算中心(AIDC),可以端到端加速大型AI模型訓(xùn)練。

寒武紀(jì)vMLU解決方案

不同場(chǎng)景下的AI訓(xùn)練對(duì)計(jì)算和存儲(chǔ)的要求千差萬(wàn)別,如何提供更靈活也更穩(wěn)定的服務(wù),但同時(shí)讓算力得到充分地利用,是AIDC面臨的持續(xù)挑戰(zhàn)。寒武紀(jì)虛擬化技術(shù)vMLU,支持在思元290上實(shí)現(xiàn)4個(gè)相互隔離的AI計(jì)算實(shí)例,每個(gè)實(shí)例獨(dú)占計(jì)算、內(nèi)存和編解碼資源。實(shí)例之間的硬件資源互不干擾,即使在虛擬化環(huán)境下仍可保持90%以上的極高效率,幫助客戶充分利用硬件資源。

vMLU還可以幫助思元290芯片提供最佳的靈活性。通過(guò)熱遷移技術(shù),云管理員可將正在運(yùn)行的AI負(fù)載及其應(yīng)用程序移動(dòng)到另外一臺(tái)主機(jī)上,從而平衡整個(gè)AIDC的負(fù)載,并實(shí)現(xiàn)更好的容災(zāi)功能。

寒武紀(jì)首款訓(xùn)練智能加速卡MLU290-M5

寒武紀(jì)MLU290-M5智能加速卡搭載了思元290智能芯片,采用開(kāi)放加速模塊OAM設(shè)計(jì),具備64個(gè)MLU Core,1.23TB/s 內(nèi)存帶寬以及全新MLU-Link?多芯互聯(lián)技術(shù),在350w的最大散熱功耗下提供AI算力高達(dá)1024 TOPS(INT4)。

寒武紀(jì)首款智能加速器玄思1000

寒武紀(jì)首款智能加速器玄思1000包含4片思元290智能加速卡,最大AI算力超過(guò)4100萬(wàn)億次每秒(4.1 PetaOPS INT4),一臺(tái)玄思1000計(jì)算單元就足以替代一個(gè)小型傳統(tǒng)超級(jí)計(jì)算中心。

玄思1000內(nèi)置高帶寬低延時(shí)的MLU-Link?多芯互聯(lián)技術(shù),實(shí)現(xiàn)內(nèi)部4顆思元290進(jìn)行高速互聯(lián),同時(shí)打破服務(wù)器、緊耦合微集群(POD)與集群的傳統(tǒng)數(shù)據(jù)中心橫向擴(kuò)展架構(gòu),將AIDC構(gòu)建為節(jié)點(diǎn)、POD乃至超大規(guī)?;旌蠑U(kuò)展架構(gòu)(Hybrid Scale-out),實(shí)現(xiàn)AI算力計(jì)算中心級(jí)縱向擴(kuò)展,滿足高性能、高擴(kuò)展性、靈活性、高魯棒性的要求。

重塑AIDC基礎(chǔ)架構(gòu)

算力、算法、數(shù)據(jù)是人工智能發(fā)展的三大要素,隨著這幾年AI的逐步發(fā)展,算力的核心地位更為凸顯。人工智能技術(shù)落地于實(shí)際應(yīng)用中需要芯片和硬件層面強(qiáng)大的算力支撐。算力已成為驅(qū)動(dòng)AI產(chǎn)業(yè)化和產(chǎn)業(yè)AI化發(fā)展的關(guān)鍵要素。

下一代AIDC要求更多智能芯片無(wú)縫協(xié)同、并行運(yùn)行的同時(shí),還能保持高計(jì)算效率,從而提供超級(jí)巨大的算力,以應(yīng)對(duì)超大規(guī)模訓(xùn)練的需要。寒武紀(jì)玄思1000智能加速器重新思考了未來(lái)AIDC的基礎(chǔ)架構(gòu),在內(nèi)部和外部采用統(tǒng)一的MLU-Link?多芯互聯(lián)技術(shù)進(jìn)行通訊,使得思元290智能芯片的互聯(lián)范圍可以從單機(jī)擴(kuò)展到POD乃至整個(gè)計(jì)算中心,重塑了基礎(chǔ)架構(gòu)。

玄思1000配置8個(gè)對(duì)外互聯(lián)的MLU-Link?接口,支持跨系統(tǒng)互聯(lián)構(gòu)建MLU POD。標(biāo)準(zhǔn)配置支持MLU POD 16、24、32。在POD內(nèi)部,所有290芯片均可通過(guò)MLU-Link?多芯互聯(lián)技術(shù)進(jìn)行通訊,在帶寬和延時(shí)方面實(shí)現(xiàn)了突破;POD外部通過(guò)玄思1000內(nèi)置的網(wǎng)卡與其他系統(tǒng)進(jìn)行通訊,實(shí)現(xiàn)了AI訓(xùn)練集群性能、擴(kuò)展性和魯棒性的協(xié)同提升。

o4YBAGAJFpWAC0W4AADP_k_qtac699.jpg

POD內(nèi)所有思元芯片通過(guò)MLU-Link?全互聯(lián)

除了標(biāo)準(zhǔn)配置的POD之外,在計(jì)算中心條件允許的前提下,通過(guò)MLU-Link?多芯互聯(lián)技術(shù),可實(shí)現(xiàn)1024顆或更多思元290互聯(lián),不需要額外的網(wǎng)卡即可實(shí)現(xiàn)無(wú)縫加速。

寒武紀(jì)Neuware?訓(xùn)練軟件棧

寒武紀(jì)Neuware?軟件棧為思元 290 芯片提供完善的軟件及應(yīng)用生態(tài),支持業(yè)界主流的TensorFlow和PyTorch等深度學(xué)習(xí)框架,用戶不需要改變使用習(xí)慣,即可在思元290芯片上實(shí)現(xiàn)圖形圖像、語(yǔ)音、NLP、搜索推薦等多種應(yīng)用的訓(xùn)練和推理。其中,基于Horovod分布式訓(xùn)練框架與MLU-Link?多芯互聯(lián)技術(shù)相互配合,讓思元290在單機(jī)多卡、多機(jī)多卡的場(chǎng)景下達(dá)到業(yè)界領(lǐng)先的訓(xùn)練加速比。寒武紀(jì)Neuware?提供完善的開(kāi)發(fā)工具包和社區(qū)支持,幫助用戶在思元290芯片進(jìn)行方便、靈活的定制開(kāi)發(fā)及部署工作。配合強(qiáng)大的BANG智能編程語(yǔ)言及配套調(diào)試工具,用戶可以為自定義的算法提供最佳性能調(diào)優(yōu)。

2021年1月,IDC發(fā)布了《2020-2021 中國(guó)人工智能計(jì)算力發(fā)展評(píng)估報(bào)告》,該報(bào)告預(yù)計(jì),中國(guó)人工智能市場(chǎng)規(guī)模在2020年達(dá)到62.7億美元,2019-2024年的復(fù)合增長(zhǎng)率為30.4%。IDC的調(diào)研還發(fā)現(xiàn),超過(guò)九成的企業(yè)正在使用或者計(jì)劃在三年內(nèi)使用人工智能,其中74.5%的企業(yè)期望在未來(lái)可以采取具備公用設(shè)施意義的人工智能基礎(chǔ)設(shè)施。

隨著AI算法突飛猛進(jìn)的發(fā)展,越來(lái)越多的模型訓(xùn)練需要巨量的算力支撐才能快速有效地實(shí)施,算力是未來(lái)人工智能應(yīng)用取得突破的決定性因素。值得強(qiáng)調(diào)的是,在巨量的人工智能市場(chǎng)中,云服務(wù)市場(chǎng)表現(xiàn)更為突出。早前,2020年7月,IDC發(fā)布的另一份報(bào)告顯示,2018至2024年,中國(guó)AI云服務(wù)市場(chǎng)年復(fù)合增長(zhǎng)率將達(dá)到93.6%。而目前人工智能芯片仍處于成長(zhǎng)期,未來(lái)三年,人工智能芯片市場(chǎng)將呈現(xiàn)多元化發(fā)展趨勢(shì)。

寒武紀(jì)290產(chǎn)品線,有望在持續(xù)高速增長(zhǎng)的人工智能市場(chǎng)尤其是云服務(wù)市場(chǎng),搶占更多的市場(chǎng)份額,推動(dòng)自身和AI行業(yè)的發(fā)展。據(jù)悉,寒武紀(jì)思元290芯片及加速卡已與部分硬件合作伙伴完成適配,并已實(shí)現(xiàn)規(guī)?;鲐?。

寒武紀(jì)最初布局終端IP場(chǎng)景,連續(xù)迭代推出讓其聲名鵲起的寒武紀(jì)1A、寒武紀(jì)1H、寒武紀(jì)1M系列處理器,而后迅速布局云端智能芯片及加速卡系列產(chǎn)品思元100和思元270,又于2019年推出基于思元220芯片的邊緣智能加速卡。由此建立起覆蓋云邊端、訓(xùn)練、推理的完整產(chǎn)品矩陣,同時(shí)利用平臺(tái)級(jí)基礎(chǔ)系統(tǒng)軟件Cambricon Neuware,連接全線產(chǎn)品,由點(diǎn)及面,實(shí)現(xiàn)了“訓(xùn)推一體、端云融合”。寒武紀(jì)也成為目前國(guó)際上少數(shù)幾家全面系統(tǒng)掌握了通用型智能芯片及其基礎(chǔ)系統(tǒng)軟件研發(fā)和產(chǎn)品化核心技術(shù)的企業(yè)之一。

以寒武紀(jì)一年迭代推出一到兩款新品的研發(fā)速度,我們有理由開(kāi)始期待,寒武紀(jì)的下一個(gè)新品 “彩蛋” 了。

fqj

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片
    +關(guān)注

    關(guān)注

    455

    文章

    50714

    瀏覽量

    423116
  • 寒武紀(jì)
    +關(guān)注

    關(guān)注

    11

    文章

    186

    瀏覽量

    73879
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    臺(tái)積電2納米制程技術(shù)細(xì)節(jié)公布:性能功耗雙提升

    顯著提升,提升幅度高達(dá)15%。同時(shí),在功耗控制方面,N2制程也展現(xiàn)出了卓越的能力,功耗降低了30%,能效得到了大幅提升。 N2制程技術(shù)的卓越
    的頭像 發(fā)表于 12-19 10:28 ?105次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過(guò)互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計(jì)算資源,以滿足其AI應(yīng)用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?468次閱讀

    AI網(wǎng)絡(luò)物理層底座: 大芯片先進(jìn)封裝技術(shù)

    隨著人工智能(AI)技術(shù)的迅猛發(fā)展,我們正站在第次工業(yè)革命的風(fēng)暴中, 這場(chǎng)風(fēng)暴也將席卷我們整個(gè)芯片行業(yè),特別是先進(jìn)封裝領(lǐng)域。Chiplet是實(shí)現(xiàn)單個(gè)芯片
    發(fā)表于 09-11 09:47 ?630次閱讀
    <b class='flag-5'>AI</b>網(wǎng)絡(luò)物理層底座: 大<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>芯片</b>先進(jìn)封裝技術(shù)

    安謀科技異構(gòu)賦能AI計(jì)算,此芯科技AI PC芯片發(fā)布

    7月30日,此芯科技集團(tuán)有限公司(以下簡(jiǎn)稱“此芯科技”)AI PC戰(zhàn)略暨芯片發(fā)布會(huì)在上海舉行,正式推出了其款專為
    發(fā)表于 07-31 14:36 ?1029次閱讀
    安謀科技異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>賦能<b class='flag-5'>AI</b>計(jì)算,此芯科技<b class='flag-5'>首</b>款<b class='flag-5'>AI</b> PC<b class='flag-5'>芯片</b>發(fā)布

    概念股寒武紀(jì)20cm漲停市值重回千億

    大漲。 在AI火爆的背景下,業(yè)界多認(rèn)為AI推動(dòng)需求攀升,相關(guān)企業(yè)有望持續(xù)受益。AI芯片企業(yè)
    的頭像 發(fā)表于 07-17 15:30 ?588次閱讀

    寒武紀(jì)2023年報(bào)出爐:營(yíng)收穩(wěn)健虧損收窄 毛利率達(dá)69.16%

    年報(bào)信息顯示,寒武紀(jì)全年實(shí)現(xiàn)收入7.09億元人民幣,其中毛利率達(dá)到69.16%,比去年提高了3.40個(gè)百分點(diǎn)。在經(jīng)歷過(guò)上年度寛泛虧損之后,本年度盈利情況明顯改善,向股東返還利潤(rùn)407913000元,降幅達(dá)32.47%。
    的頭像 發(fā)表于 04-30 09:39 ?795次閱讀

    Meta自主研發(fā)芯片增強(qiáng)AI服務(wù),減輕對(duì)英偉達(dá)等外部供應(yīng)商依賴

    值得關(guān)注的是,新一代MTIA采用臺(tái)積電(2330-TW)5納米制程技術(shù),性能較上一代提升3。該芯片已部署至數(shù)據(jù)中心,為AI應(yīng)用程序提供支持
    的頭像 發(fā)表于 04-11 09:40 ?312次閱讀

    AMD推出銳龍8000嵌入式處理器,AI高達(dá)39 T

    此款CPU選用4納米制程、AMD基于“Zen 4”架構(gòu)的CPU核心以及使用RDNA 3架構(gòu)GPU和XDNA架構(gòu)NPU,實(shí)現(xiàn)高達(dá)39TOPS的AI,其中NPU
    的頭像 發(fā)表于 04-03 10:39 ?870次閱讀

    AI芯片第一股”,7年虧損近50億!

    下降2.70%。歸母凈利潤(rùn)為-83,561.40 萬(wàn)元,較上年同期虧損收窄33.50%。 雖然,寒武紀(jì)的虧損較往期有所降低,但營(yíng)收依舊趕不上虧損。此外,這也是有著“AI芯片第一股”之稱的寒武紀(jì)
    的頭像 發(fā)表于 03-05 09:24 ?664次閱讀

    AI芯片第一股”寒武紀(jì)發(fā)布2023年度業(yè)績(jī)快報(bào) 虧8.36億元!

    AI芯片第一股”寒武紀(jì)(688256)在2024年2月28日發(fā)布2023年度業(yè)績(jī)快報(bào)。
    的頭像 發(fā)表于 03-04 13:41 ?864次閱讀
    “<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>第一股”<b class='flag-5'>寒武紀(jì)</b>發(fā)布2023年度業(yè)績(jī)快報(bào) 虧8.36億元!

    潞晨科技Colossal-AI + 浪潮信息AIStation,大模型開(kāi)發(fā)效率提升10

    的潞晨科技Colossal-AI系統(tǒng),用戶可實(shí)現(xiàn)在本地平臺(tái)一鍵訓(xùn)練、微調(diào)、推理、部署大模型,將大模型開(kāi)發(fā)效率提升10
    的頭像 發(fā)表于 03-01 09:43 ?483次閱讀
    潞晨科技Colossal-<b class='flag-5'>AI</b> + 浪潮信息AIStation,大模型開(kāi)發(fā)效率<b class='flag-5'>提升</b>10<b class='flag-5'>倍</b>

    英特爾宣布推進(jìn)1.4納米制程

    ,臺(tái)積電和三星已經(jīng)推出3納米制程芯片,而英特爾則剛剛實(shí)現(xiàn)了5納米制程。然而,這一決定表明英特爾有意在制程技術(shù)領(lǐng)域迎頭趕上,計(jì)劃在未來(lái)幾年內(nèi)推出更為先進(jìn)的1.4
    的頭像 發(fā)表于 02-23 11:23 ?485次閱讀

    臺(tái)積電領(lǐng)跑半導(dǎo)體市場(chǎng):2納米制程領(lǐng)先行業(yè),3納米產(chǎn)能飆升

    臺(tái)積電預(yù)期,目前營(yíng)收總額約 70% 是來(lái)自 16 納米以下先進(jìn)制程技術(shù),隨著 3 納米和 2 納米制程技術(shù)的貢獻(xiàn)在未來(lái)幾年漸增,比重將會(huì)繼續(xù)增加,預(yù)估未來(lái)成熟
    的頭像 發(fā)表于 02-21 16:33 ?788次閱讀

    寒武紀(jì)與智象未來(lái)聯(lián)手,推動(dòng)視覺(jué)大模型的技術(shù)創(chuàng)新與應(yīng)用

    在大模型領(lǐng)域,寒武紀(jì)自底層硬件架構(gòu)至基礎(chǔ)軟件更新,皆針對(duì)大模型的實(shí)際應(yīng)用場(chǎng)景進(jìn)行了細(xì)致優(yōu)化。依托高效的推理引擎MagicMind,寒武紀(jì)思元(MLU)系列云端智能加速卡支持輸入輸出變換、提升算子效率以及圖融合等尖端技術(shù),全力賦能
    的頭像 發(fā)表于 01-24 09:59 ?874次閱讀

    寒武紀(jì)與智象未來(lái)達(dá)成戰(zhàn)略合作并完成大模型適配

    1月22日,寒武紀(jì)與智象未來(lái) (HiDream.ai) 在北京簽訂戰(zhàn)略合作協(xié)議,雙方將通過(guò)資源共享、優(yōu)勢(shì)互補(bǔ),依托各自在大模型領(lǐng)域的技術(shù)積累,持續(xù)產(chǎn)品適配,攜手推動(dòng)視覺(jué)大模型的創(chuàng)新與落地。
    的頭像 發(fā)表于 01-23 13:46 ?541次閱讀
    <b class='flag-5'>寒武紀(jì)</b>與智象未來(lái)達(dá)成戰(zhàn)略合作并完成大模型適配
    RM新时代网站-首页