RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

蘋果A系列SoC可作為新的AI算力范式,成為新的摩爾定律

454398 ? 來源:機器之心 ? 作者: 半導體行業(yè)觀察 ? 2020-10-28 11:54 ? 次閱讀

最近蘋果在發(fā)布會上公開了新的A14 SoC。根據(jù)發(fā)布會,該SoC將用于新的iPad上,而根據(jù)行業(yè)人士的推測該SoC也將會用在新的iPhone系列中。除了常規(guī)的CPUGPU升級之外,A14最引人注目的就是Neural Engine的算力提升。我們認為,蘋果A系列SoC在近幾年內(nèi)Neural Engine的算力增長可以作為一種新的AI算力范式,成為新的摩爾定律。

A14上的新Neural Engine

蘋果公布的A14 SoC使用5nm工藝,而新的Neural Engine則使用16核心設計,其峰值算力可達11 TOPS,遠超上一代的Neural Engine(6TOPS)。在發(fā)布會上,蘋果明確表示該Neural Engine主要支持加速矩陣相乘。此外,蘋果還表示新的Neural Engine結(jié)合CPU上的機器學習加速,可以將實際的AI應用體驗相對于前代提升十倍。

新的Neural Engine的峰值算力大大提升可以說是有些意料之外,但是又是情理之中。意料之外是因為A14的其它關(guān)鍵指標,例如CPU和GPU等相對于前一代A13的提升并不多(發(fā)布會上給出的30%提升對比的是再前一代的A12 SoC,如果直接和上一代A13相比則CPU性能提升是16%而GPU則是10%左右),但是Neural Engine的性能提升則接近100%。而Neural Engine性能提升大大超過SoC其他部分是情理之中則是因為我們認為如果仔細分析SoC性能提升背后的推動力,則可以得出Neural Engine性能大幅提升是非常合理的。一方面,從應用需求側(cè)來說,對應CPU和GPU的相關(guān)應用,例如游戲、網(wǎng)頁瀏覽、視頻等在未來可預見的幾年內(nèi)都沒有快速的需求增長,唯有人工智能有這樣的需求。另一方面,CPU和GPU的性能在給定架構(gòu)下的性能提升也較困難,很大一部分提升必須靠半導體工藝,而事實上半導體工藝的升級在未來幾年內(nèi)可預期將會越來越慢,每代工藝升級更注重于晶體管密度以及功耗,在晶體管性能方面的提升將越來越小。而AI加速器則還有相當大的設計提升空間,相信在未來幾年仍將會有算力快速增長。

Neural Engine算力增長趨勢

我們不妨回顧一下過去幾代A系列SoC中Neural Engine的算力增長。

最早加入Neural Engine的SoC是2017年發(fā)布的A11。該SoC使用10nm工藝,搭載第一代Neural Engine峰值算力為0.6TOPS,Neural Engine的芯片面積為1.83mm2。當時Neural Engine主要針對的應用是iPhone新推出的人臉識別鎖屏FaceID以及人臉關(guān)鍵點追蹤Animoji,且Neural Engine的算力并不對第三方應用開放。

第二代Neural Engine則是在2018年的A12 SoC上。該SoC使用7nm工藝,Neural Engine面積為5.8mm2,而其峰值算力則達到了5TOPS,相比前一代的Neural Engine翻了近10倍。而根據(jù)7nm和10nm工藝的晶體管密度折算則可以估計出Neural Engine的晶體管數(shù)量大約也是增加了6-7倍,基本和算力提升接近。

第三代Neural Engine是2019年的A13,使用第二代N7工藝,其面積相比上一代減少到了4.64mm2,而算力則增加到了6TOPS。我們認為這一代的Neural Engine是上一代的小幅改良版本,并沒有做大幅升級。

最近公布的A14則搭載了最新一代的Neural Engine,使用5nm工藝,Neural Engine的具體面積尚沒有具體數(shù)字,但是其算力則是達到了11TOPS,是上一代的接近兩倍。

從上面的分析可以看出Neural Engine每次主要升級都伴隨著算力的大幅上升,第一次上升了近十倍,而第二次則上升了近兩倍。如果按照目前兩年一次主要升級的節(jié)奏,我們認為在未來數(shù)年內(nèi)Neural Engine乃至于廣義的AI芯片市場都會有每兩年性能提升兩倍的規(guī)律,類似半導體的摩爾定律。我們認為,這樣的規(guī)律可以認為是AI芯片算力的新摩爾定律。

為什么AI芯片算力增長會成為新的摩爾定律

AI芯片算力指數(shù)上升的主要驅(qū)動力還是主流應用對于AI的越來越倚重,以及AI神經(jīng)網(wǎng)絡模型對于算力需求的快速提升。

應用側(cè)對于AI的需求正在越來越強。就拿智能設備為例,2017年蘋果A11中AI的主要應用還是面部關(guān)鍵點識別和追蹤,而到了2018年開始越來越多的應用開始使用AI,包括圖像增強、拍攝虛化效果等,在下一代智能設備中AI則更加普及,首先從人機交互來看,下一代智能設備中常見的人機交互方式手勢追蹤、眼動追蹤、語音輸入等都需要AI,這就大大增加了AI算法的運行頻率以及算力需求。此外,下一代智能設備中有可能會用到的一系列新應用都倚重AI,包括游戲、增強現(xiàn)實等應用中,都需要運行大量的AI模型例如SLAM,關(guān)鍵點識別、物體檢測和追蹤、姿勢識別和追蹤等等。

另一方面,AI對于算力的需求也在快速提升。根據(jù)HOT CHIPS 2020上的特邀演講,AI模型每年對于算力需求的提升在10倍左右,因此可以說AI模型對于硬件加速的需求非常強。

如果我們從另一個角度考慮,這其實就意味著AI加速芯片的算力提升在賦能新的場景和應用——因為總是有新的性能更高的AI模型需要更強的硬件去支持,而一旦支持了這樣的新模型則又能賦能新的應用。從目前主流的計算機視覺相關(guān)的AI,到以BERT為代表的大規(guī)模自然語言處理算法,以及未來可能出現(xiàn)的將BERT和計算機視覺相結(jié)合的視覺高階語義理解等等,我們在未來幾年內(nèi)尚未看到AI模型進步的停止以及可能的新應用場景的出現(xiàn),相反目前的瓶頸是AI加速硬件性能跟不上。這也就意味著,AI加速硬件才是AI模型落地的最終賦能者,這就像當年摩爾定律大躍進的PC時代,當時每一次CPU處理器的進步都意味著PC上能運行更多的應用,因此我們看到了CPU性能在當時的突飛猛進;今天這一幕又重現(xiàn)了,只是今天的主角換成了AI加速芯片。

AI算力增長來自何方?

分析完了AI加速芯片的需求側(cè),我們不妨再來看看供給側(cè)——即目前的技術(shù)還能支持AI芯片多少算力提升。

首先,AI加速器芯片和傳統(tǒng)CPU的一個核心差異在于,CPU要處理的通用程序中往往很大一部分難以并行化,因此即使增加CPU的核心數(shù)量,其性能的增加與核心數(shù)也并非線性關(guān)系;而AI模型的計算通常較為規(guī)整,且很容易就可以做并行化處理,因此其算力提升往往與計算單元數(shù)量呈接近線性的關(guān)系。這在我們之前對比A11和A12 Neural Engine的晶體管數(shù)量和算力提升之間的關(guān)系也有類似的結(jié)論。目前,以Neural Engine為代表的AI加速器占芯片總面積約為5%,未來如果AI加速器的面積能和GPU有類似的面積(20%左右),則AI加速器的計算單元數(shù)量也即算力至少還有4倍的提升空間。此外,如果考慮兩年兩倍的節(jié)奏并考慮未來幾年內(nèi)可能會落地的3nm工藝,則我們認為AI加速器算力兩年兩倍的提升速度從這方面至少還有5-6年的空間可挖。

除了單純增加計算單元數(shù)目之外,另一個AI加速器算力重要的提升空間來自于算法和芯片的協(xié)同設計。從算法層面,目前主流的移動端模型使用的是8-bit計算精度,而在學術(shù)界已經(jīng)有許多對于4-bit甚至1-bit計算的研究都取得了大幅降低計算量和參數(shù)量的同時幾乎不降低模型精度。另外,模型的稀疏化處理也是一個重要的方向,目前許多模型經(jīng)過稀疏化處理可以降低50-70%的等效計算量而不降低精度。因此如果考慮模型和芯片和協(xié)同設計并在加速器中加入相關(guān)的支持(如低精度計算和稀疏化計算),我們預計還能在計算單元之外額外帶來至少10倍等效算力提升。

最后,當峰值算力的潛力已經(jīng)被充分挖掘之后,還有一個潛力方向是針對不同AI模型的專用化設計,也即異構(gòu)設計。AI模型中,常用于機器視覺的卷積神經(jīng)網(wǎng)絡和常用于機器翻譯/語音識別的循環(huán)卷積網(wǎng)絡無論是在計算方法還是內(nèi)存訪問等方面都大相徑庭,因此如果能做專用化設計,則有可能在峰值算力不變的情況下,實際的計算速度仍然取得數(shù)倍的提升。

結(jié)合上面討論的一些方向,我們認為AI加速芯片的算力在未來至少還有數(shù)十倍甚至上百倍的提升空間,再結(jié)合之前討論的應用側(cè)對于算力的強烈需求,我們認為在未來數(shù)年內(nèi)都會看到AI加速芯片的算力一兩年翻倍地指數(shù)上升。在這一領(lǐng)域,事實上中國的半導體行業(yè)有很大的機會。如前所述,AI芯片性能提升主要來自于設計的提升而非工藝提升,而中國無論是在半導體電路設計領(lǐng)域還是AI模型領(lǐng)域都并不落后,因此有機會能抓住這個機會。
編輯;hfy

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    10854

    瀏覽量

    211567
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4729

    瀏覽量

    128887
  • 5nm
    5nm
    +關(guān)注

    關(guān)注

    1

    文章

    342

    瀏覽量

    26076
  • A14處理器
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    2063
收藏 人收藏

    評論

    相關(guān)推薦

    擊碎摩爾定律!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)摩爾定律是由英特爾創(chuàng)始人之一戈登·摩爾提出的經(jīng)驗規(guī)律,描述了集成電路上的晶體管數(shù)量和性能隨時間的增長趨勢。根據(jù)摩爾定律,集成電路上可容納的晶體管數(shù)目約每隔18個月便會
    的頭像 發(fā)表于 06-04 00:06 ?4042次閱讀
    擊碎<b class='flag-5'>摩爾定律</b>!英偉達和AMD將一年一款新品,均提及HBM和先進封裝

    AI時代的存儲墻,哪種存方案才能打破?

    回顧計算行業(yè)幾十年的歷史,芯片提升在幾年前,還在遵循摩爾定律??呻S著如今摩爾定律顯著放緩,
    的頭像 發(fā)表于 04-21 01:36 ?3543次閱讀
    <b class='flag-5'>AI</b>時代的存儲墻,哪種存<b class='flag-5'>算</b>方案才能打破?

    摩爾定律時代,提升集成芯片系統(tǒng)化能力的有效途徑有哪些?

    電子發(fā)燒友網(wǎng)報道(文/吳子鵬)當前,終端市場需求呈現(xiàn)多元化、智能化的發(fā)展趨勢,芯片制造則已經(jīng)進入后摩爾定律時代,這就導致先進的工藝制程雖仍然是芯片性能提升的重要手段,但效果已經(jīng)不如從前,先進封裝
    的頭像 發(fā)表于 12-03 00:13 ?2249次閱讀

    企業(yè)AI租賃是什么

    企業(yè)AI租賃是指企業(yè)通過互聯(lián)網(wǎng)向?qū)I(yè)的提供商租用所需的計算資源,以滿足其AI應用的需求。
    的頭像 發(fā)表于 11-14 09:30 ?466次閱讀

    GPU開發(fā)平臺是什么

    隨著AI技術(shù)的廣泛應用,需求呈現(xiàn)出爆發(fā)式增長。AI租賃
    的頭像 發(fā)表于 10-31 10:31 ?162次閱讀

    AI芯片供電電源測試利器:費思低壓大電流系列電子負載

    AI芯片作為驅(qū)動復雜計算任務的核心引擎,其性能與穩(wěn)定性成為了決定應用成敗的關(guān)鍵因素。而在這背后,供電電源的穩(wěn)定性和高效性則是保障
    的頭像 發(fā)表于 10-25 11:26 ?388次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>芯片供電電源測試利器:費思低壓大電流<b class='flag-5'>系列</b>電子負載

    AI芯片主張“超越摩爾”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    越來越差。在這種情況下,超越摩爾逐漸成為打造高芯片的主流技術(shù)。 ? 超越摩爾是后摩爾定律時代
    的頭像 發(fā)表于 09-04 01:16 ?3257次閱讀
    高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b>芯片主張“超越<b class='flag-5'>摩爾</b>”,Chiplet與先進封裝技術(shù)迎百家爭鳴時代

    “自我實現(xiàn)的預言”摩爾定律,如何繼續(xù)引領(lǐng)創(chuàng)新

    59年前,1965年4月19日,英特爾公司聯(lián)合創(chuàng)始人戈登·摩爾(Gordon Moore)應邀在《電子》雜志上發(fā)表了一篇四頁短文,提出了我們今天熟知的摩爾定律(Moore’s Law)。 就像你為
    的頭像 發(fā)表于 07-05 15:02 ?267次閱讀

    摩爾線程張建中:以國產(chǎn)助力數(shù)智世界,滿足大模型需求

    摩爾線程創(chuàng)始人兼CEO張建中在會上透露,為了滿足國內(nèi)對AI的迫切需求,他們正在積極尋求與國內(nèi)頂尖科研機構(gòu)的深度合作,共同推動更大規(guī)模的AI
    的頭像 發(fā)表于 05-10 16:36 ?949次閱讀

    封裝技術(shù)會成為摩爾定律的未來嗎?

    你可聽說過摩爾定律?在半導體這一領(lǐng)域,摩爾定律幾乎成了預測未來的神話。這條定律,最早是由英特爾聯(lián)合創(chuàng)始人戈登·摩爾于1965年提出,簡單地說就是這樣的:集成電路上可容納的晶體管數(shù)量大約
    的頭像 發(fā)表于 04-19 13:55 ?327次閱讀
    封裝技術(shù)會<b class='flag-5'>成為</b><b class='flag-5'>摩爾定律</b>的未來嗎?

    功能密度定律是否能替代摩爾定律?摩爾定律和功能密度定律比較

    眾所周知,隨著IC工藝的特征尺寸向5nm、3nm邁進,摩爾定律已經(jīng)要走到盡頭了,那么,有什么定律能接替摩爾定律呢?
    的頭像 發(fā)表于 02-21 09:46 ?715次閱讀
    功能密度<b class='flag-5'>定律</b>是否能替代<b class='flag-5'>摩爾定律</b>?<b class='flag-5'>摩爾定律</b>和功能密度<b class='flag-5'>定律</b>比較

    摩爾定律的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    在動態(tài)的半導體技術(shù)領(lǐng)域,圍繞摩爾定律的持續(xù)討論經(jīng)歷了顯著的演變,其中最突出的是 MonolithIC 3D 首席執(zhí)行官Zvi Or-Bach于2014 年的主張。
    的頭像 發(fā)表于 01-25 14:45 ?1125次閱讀
    <b class='flag-5'>摩爾定律</b>的終結(jié):芯片產(chǎn)業(yè)的下一個勝者法則是什么?

    墨芯人工智能CEO王維:需要重新定義和設計AI計算機

    AI時代,我們需要重新定義和設計AI計算機。僅依靠硅基的摩爾定律,2年翻一倍的線性增長的供給遠不能滿足指數(shù)級增長的需求問題。
    的頭像 發(fā)表于 01-12 11:12 ?1080次閱讀

    中國團隊公開“Big Chip”架構(gòu)能終結(jié)摩爾定律

    摩爾定律的終結(jié)——真正的摩爾定律,即晶體管隨著工藝的每次縮小而變得更便宜、更快——正在讓芯片制造商瘋狂。
    的頭像 發(fā)表于 01-09 10:16 ?825次閱讀
    中國團隊公開“Big Chip”架構(gòu)能終結(jié)<b class='flag-5'>摩爾定律</b>?

    英特爾CEO基辛格:摩爾定律仍具生命,且仍在推動創(chuàng)新

    摩爾定律概念最早由英特爾聯(lián)合創(chuàng)始人戈登·摩爾在1970年提出,明確指出芯片晶體管數(shù)量每兩年翻一番。得益于新節(jié)點密度提升及大規(guī)模生產(chǎn)芯片的能力。
    的頭像 發(fā)表于 12-25 14:54 ?615次閱讀
    RM新时代网站-首页