知乎爆料!寒武紀(jì)新一代AI芯片“思元270”遭提前泄露
【新智元導(dǎo)讀】近日,知乎網(wǎng)友提出一個(gè)勁爆問題——如何看待寒武紀(jì)新一代人工智能芯片規(guī)格?問題一出便引發(fā)熱議,疑似寒武紀(jì)下一代產(chǎn)品“思元270”提前被曝光,有望在低精度訓(xùn)練領(lǐng)域?qū)崿F(xiàn)重大突破,性能或超越NVIDIA最新一代芯片!
AI芯片領(lǐng)域又有大爆料!
近日,知乎突然出現(xiàn)了一個(gè)勁爆提問 “如何看待寒武紀(jì)新一代人工智能芯片(疑似思元/MLU270)規(guī)格?”,提問者以匿名方式貼出了疑似寒武紀(jì)下一代云端AI芯片MLU270的相關(guān)信息,包括芯片外觀以及某些具體參數(shù)。
知乎鏈接:
根據(jù)問題和回答記錄中顯示,似乎已有多家廠商接觸到了相關(guān)資料,經(jīng)他人在網(wǎng)上披露信息后,寒武紀(jì)下一代芯片規(guī)格被提前曝光。
在智能芯片領(lǐng)域,寒武紀(jì)被稱為這一行業(yè)的先行者,“先行者”的行蹤被泄露,自然會(huì)吸引眾多從業(yè)者的關(guān)注與討論——“新一代的云端AI芯片規(guī)格到底如何?”。該提問在短時(shí)間內(nèi)就受到了知乎網(wǎng)友的廣泛關(guān)注,閱讀次數(shù)迅速過萬。
獨(dú)家爆料:“思元”年初悄然注冊,數(shù)據(jù)遭泄,性能或超越NVIDIA最新一代芯片
據(jù)泄露照片顯示,寒武紀(jì)的新一代云端AI芯片MLU270已于今年年初研制成功,主要包括如下五點(diǎn)特性:
基于臺(tái)積電16nm工藝打造。
架構(gòu)代號(hào)從上一代的MLUv01升級(jí)到了MLUv02。
內(nèi)建視頻解碼單元(似乎是專門為視頻處理市場配置)。
但按照寒武紀(jì)一直把MLU系列芯片定位為通用智能芯片來看,MLU270應(yīng)該能夠繼續(xù)支持語音和自然語言處理等重要AI任務(wù)。
峰值方面,這顆芯片提供int4 256Tops, int8 128Tops的驚人性能,功耗為75w,與全球AI芯片龍頭NVIDIA的最新一代Tesla T4基本持平。
在圍繞新品的討論中,這款新品是否與國際業(yè)內(nèi)巨頭NVIDIA持平也是知乎網(wǎng)友熱議的一點(diǎn)。
大多數(shù)網(wǎng)友的看法都是持積極態(tài)度。雖然NVIDIA在國際范圍內(nèi)頗有“一家獨(dú)大”的態(tài)勢,但卓越的學(xué)術(shù)成就以及融資優(yōu)勢仍讓很多網(wǎng)友看好寒武紀(jì):對(duì)于前途大好的AI芯片市場,玩家越多,越有意思——“有新的競爭者加入進(jìn)來對(duì)業(yè)內(nèi)每一家都是好事”。
但也有網(wǎng)友認(rèn)為超越NVIDIA絕非易事,峰值高低并不能直接決定市場上的勝負(fù),如何接近核心客戶可能是寒武紀(jì)需要跨過的更高門檻,也是能否與NVIDIA等巨頭一決勝負(fù)的關(guān)鍵。
另外,業(yè)內(nèi)反饋Tesla T4在75w功耗條件下實(shí)測性能距離理論峰值有較大差距,不知寒武紀(jì)能否突破這一瓶頸,未來尚需相關(guān)用戶公布實(shí)測結(jié)果。
值得注意的是,照片中出現(xiàn)的”思元”這個(gè)名字,很可能是寒武紀(jì)云端芯片品牌
MLU(Machine learning unit)的中文名。筆者順藤摸瓜,查了一下國家商標(biāo)局的網(wǎng)站(),發(fā)現(xiàn)寒武紀(jì)已經(jīng)在年初注冊了“思元”商標(biāo)。
有網(wǎng)友在網(wǎng)站回答題主時(shí)反饋,“MLU”這個(gè)名詞有些拗口,平時(shí)和同事交流時(shí)容易和“MCU”混淆。新的“思元”品牌,貌似可以解決這個(gè)小問題,也有利于打開市場知名度。
來自同行的疑惑:“思元270”專注AI推斷任務(wù)還是兼做訓(xùn)練任務(wù)?
耐人尋味的另一點(diǎn)是,照片中只包括了整數(shù)性能的數(shù)據(jù),也沒有交代是這顆芯片是專注人工智能的推斷任務(wù)還是兼做訓(xùn)練任務(wù),令一些同行感到疑惑。
查閱寒武紀(jì)以往公開信息,發(fā)現(xiàn)寒武紀(jì)不存在任何一款代號(hào)是MLU270的芯片產(chǎn)品。寒武紀(jì)的上一代產(chǎn)品MLU100已經(jīng)公布,是專注于推理的AI芯片,而且發(fā)布時(shí)間尚不滿一年,不太可能是同一產(chǎn)品線自相殘殺式的迭代,更有可能是專注于訓(xùn)練的新產(chǎn)品。
照片中僅公布了低精度整數(shù)性能,存在兩種可能性:
一是表格中有意遺漏了浮點(diǎn)數(shù)據(jù);
二是寒武紀(jì)在低精度訓(xùn)練領(lǐng)域?qū)崿F(xiàn)了關(guān)鍵性突破。
而新智元從業(yè)內(nèi)傳聞看更傾向于第二種可能性。
實(shí)際上,低精度訓(xùn)練的需求在業(yè)界由來已久。算法工程師使用GPU做訓(xùn)練,通常使用其浮點(diǎn)運(yùn)算單元,主要是因?yàn)樵谟斜O(jiān)督學(xué)習(xí)的BP算法中,只有精確的浮點(diǎn)運(yùn)算才能記錄訓(xùn)練時(shí)很小的增量。而浮點(diǎn)運(yùn)算單元占用的芯片面積和功耗相比于整數(shù)運(yùn)算器都要大很多倍,導(dǎo)致單位芯片面積的處理能力要差很多。
目前業(yè)界在人工智能的推斷類應(yīng)用上,發(fā)現(xiàn)整數(shù)運(yùn)算可以不影響模型的精度,因此用于推斷的芯片已經(jīng)大量集成了整數(shù)運(yùn)算器或低精度浮點(diǎn)運(yùn)算器。但業(yè)界一直在嘗試是否有機(jī)會(huì)用代價(jià)更低的整數(shù)運(yùn)算器實(shí)現(xiàn)更為復(fù)雜的訓(xùn)練功能,這樣可以在不增加芯片面積和功耗的前提下,大幅提升芯片做訓(xùn)練的運(yùn)算能力。但這個(gè)問題在業(yè)界也還沒有普適的解決方案。
如果寒武紀(jì)真的在低精度訓(xùn)練領(lǐng)域?qū)崿F(xiàn)了突破,那將會(huì)是AI芯片領(lǐng)域的重大消息。新智元在發(fā)稿前嘗試聯(lián)系寒武紀(jì)確認(rèn)該技術(shù)信息,但目前尚未有回復(fù)。
據(jù)了解,寒武紀(jì)在過去三年一直保持每年一代的產(chǎn)品迭代速度。在終端領(lǐng)域:
2016年推出寒武紀(jì)1A處理器IP;
2017年推出雙核的寒武紀(jì)1H;
2018年推出寒武紀(jì)1M。
迄今已經(jīng)服務(wù)于數(shù)千萬臺(tái)終端設(shè)備。
寒武紀(jì)CEO陳天石曾表示,寒武紀(jì)的云端智能芯片產(chǎn)品,迭代速度會(huì)和終端產(chǎn)品一樣快。從這一次的消息泄露來看也確實(shí)如此,從去年初的MLU100到今年的MLU270。能夠以一年一代的速度進(jìn)行研發(fā)的,國內(nèi)也僅有華為海思一家在消費(fèi)類手機(jī)芯片能做到。
在發(fā)稿前,新智元專門回顧了寒武紀(jì)去年發(fā)布會(huì)的新聞,發(fā)現(xiàn)陳天石博士在去年曾提到一款名為“MLU200”的云端芯片。這次泄露的MLU270芯片已經(jīng)研制成功,但是否就是去年發(fā)布會(huì)時(shí)陳天石提到的MLU200,抑或是寒武紀(jì)還另有名為MLU200的產(chǎn)品?
無論如何,大型AI芯片能在一年時(shí)間迭代一代確實(shí)令人意外,但如果寒武紀(jì)能夠同時(shí)研發(fā)多款高復(fù)雜度的芯片,這可能意味著寒武紀(jì)已經(jīng)具備非常完備的芯片研發(fā)能力,在邁向AI芯片新巨頭的道路上又前進(jìn)了一步。
我們今天如何造芯?回望寒武紀(jì)三年AI修行之路
那么,寒武紀(jì)在智能芯片這條路上到底是如何發(fā)展的呢?新智元對(duì)此做了一下梳理:
2016年發(fā)布的寒武紀(jì)1A處理器(Cambricon-1A),是世界首款商用深度學(xué)習(xí)專用處理器。
2017年8月,
寒武紀(jì)科技一億美元的A輪融資消息
傳出,在A輪融資后估值達(dá)到10億美元,成為全球AI芯片領(lǐng)域第一個(gè)獨(dú)角獸初創(chuàng)公司。
2016年發(fā)布的寒武紀(jì)1A處理器(Cambricon-1A)
2017年11月,寒武紀(jì)召開自成立以來的首場發(fā)布會(huì),公布了系列新品及公司未來路線圖——“3年內(nèi)占領(lǐng)10億智能AI終端,占領(lǐng)中國云端高性能芯片1/3市場份額”。發(fā)布會(huì)上,寒武紀(jì)三款全新的智能處理器IP產(chǎn)品亮相:面向低功耗場景視覺應(yīng)用的寒武紀(jì)1H8、擁有更廣泛通用性和更高性能的寒武紀(jì)1H16,以及面向智能駕駛領(lǐng)域的寒武紀(jì)1M。
2017年11月寒武紀(jì)首場發(fā)布會(huì)
2018年5月,寒武紀(jì)發(fā)布第三代IP產(chǎn)品Cambricon 1M,以及最新一代云端AI芯片MLU100和板卡產(chǎn)品。其中,MLU100采用寒武紀(jì)最新的MLUv01架構(gòu)和TSMC 16nm的先進(jìn)工藝,可工作在平衡模式(1GHz主頻)和高性能模式(1.3GHz主頻)下,平衡模式下的等效理論峰值速度達(dá)每秒128萬億次定點(diǎn)運(yùn)算,高性能模式下的等效理論峰值速度更可達(dá)每秒166.4萬億次定點(diǎn)運(yùn)算,但典型板級(jí)功耗僅為80瓦,峰值功耗不超過110瓦。
2018年5月發(fā)布的寒武紀(jì)MLU100
2018年6月,寒武紀(jì)宣布完成數(shù)億美元的B輪融資,投后整體估值達(dá)25億美元,繼續(xù)領(lǐng)跑全球智能芯片創(chuàng)業(yè)公司。
按照寒武紀(jì)慣例,今年上半年應(yīng)該會(huì)有一次發(fā)布會(huì)。在這次發(fā)布會(huì)上是否能夠順利地看到此次遭泄露的“思元270”,又是否真如曝光數(shù)據(jù)所示,峰值高達(dá)256Tops,亦或像網(wǎng)友猜測的那樣,在低精度訓(xùn)練領(lǐng)域中實(shí)現(xiàn)了關(guān)鍵性突破?值得期待。
那么根據(jù)此次曝光的資料,你更傾向于哪種猜測呢?
評(píng)論
查看更多