蘋(píng)果秋季新品發(fā)布會(huì)如約而至,但傳聞中的iPhone12卻要等到下個(gè)月才能見(jiàn)到。發(fā)布會(huì)僅上新了兩款智能手表和兩款iPad平板電腦,新品iPad Air 4則搭載了最新的處理器芯片A14 Bionic(仿生)處理器。這幾款新產(chǎn)品香不香另說(shuō),A14 Bionic處理器卻成為了此次發(fā)布會(huì)的最大亮點(diǎn)。
根據(jù)蘋(píng)果的介紹,A14 Bionic處理器是蘋(píng)果首款采用5nm工藝打造移動(dòng)設(shè)備芯片,晶體管數(shù)量相較于A13 Bionic處理器的7nm芯片增加了近40%,晶體管數(shù)量達(dá)到了驚人的118億顆。
僅憑工藝制程的提升,A14在性能和功耗表現(xiàn)上自然會(huì)有一定的提升。官方宣稱(chēng),在性能比較上,CPU提升40%,全新GPU構(gòu)架提升30%。不過(guò),讓外界吐槽的是,這一數(shù)據(jù)是A14跟A12比較得出來(lái)的。這讓A13情何以堪呢?
而根據(jù)蘋(píng)果之前公布的數(shù)據(jù),A13相比A12在CPU和GPU性能上都提高了20%。因此,如果這兩代的處理器性能指標(biāo)測(cè)量標(biāo)準(zhǔn)一致的話(huà),則A14的CUP性能僅比A13快了約16%,GPU性能僅比A13提升了約8.3%??梢哉f(shuō),如果排除掉5nm工藝本身所帶來(lái)的改進(jìn),相對(duì)A13來(lái)說(shuō),A14在CPU和GPU核心本身性能上的提升其實(shí)并不高。
不過(guò),在AI算力上,A14相比A13則有了非常大的提升,從之前的8核NPU直接翻倍提升到16核NPU。根據(jù)蘋(píng)果的測(cè)試,A14的AI運(yùn)算能力也提升到了11.8萬(wàn)億次,機(jī)器學(xué)習(xí)速度提升了70%,機(jī)器學(xué)習(xí)加速器則令運(yùn)算速度快達(dá)10倍,將各種機(jī)器學(xué)習(xí)應(yīng)用的性能表現(xiàn)提升至全新水平。
如果留意就會(huì)發(fā)現(xiàn),蘋(píng)果從A11到A14,每一次在AI運(yùn)算性能上都做了大幅地提升。盡管我們看到蘋(píng)果并不總是以AI芯片或者AI智能終端為噱頭來(lái)做宣傳,但事實(shí)上蘋(píng)果iOS系統(tǒng)上已經(jīng)遍布各種AI應(yīng)用或者功能,對(duì)AI算力增長(zhǎng)提出了超高的需求;與此同時(shí),安卓陣營(yíng)高端芯片廠商在AI芯片上面的頻頻發(fā)力,正在縮短甚至追上與蘋(píng)果的A系列芯片的差距,這些可能都是構(gòu)成蘋(píng)果移動(dòng)終端芯片的AI算力爆發(fā)式增長(zhǎng)的緣由。
從A11到A14,蘋(píng)果的AI算力進(jìn)化
2017年,AI已經(jīng)成為大眾熱議的話(huà)題。此時(shí)沒(méi)有一家終端芯片廠商不是以AI作為產(chǎn)品的新噱頭,但真正能在AI芯片方面拿得出手的廠商也沒(méi)有幾家。這一年華為的麒麟970橫空出世,搶到了首發(fā)。10天后,蘋(píng)果的A11 Bionic也正式發(fā)布,A11采用10nm工藝制程、六核CPU、自研三核心GPU設(shè)計(jì)。
之所以可以稱(chēng)為“AI芯片”,就在于A11首次搭載神經(jīng)網(wǎng)絡(luò)引擎處理器單元(Neural Network Processing Unit,NPU),并且在新的神經(jīng)網(wǎng)絡(luò)引擎上蘋(píng)果發(fā)布了第一代Core ML,運(yùn)用本地化人工智能加速器進(jìn)行機(jī)器學(xué)習(xí)。
A11搭載的NPU采用雙核設(shè)計(jì),每秒運(yùn)算次數(shù)6000億次,主要處理機(jī)器學(xué)習(xí)任務(wù),能夠識(shí)別人物,地點(diǎn)和物體,主要針對(duì)的應(yīng)用是iPhone新推出的人臉識(shí)別鎖屏FaceID以及人臉關(guān)鍵點(diǎn)追蹤Animoji,且NPU算力并不對(duì)第三方應(yīng)用開(kāi)放。
蘋(píng)果A11處理器的標(biāo)志意義,除了成為蘋(píng)果自主研發(fā)程度最高的一代處理器之外,其實(shí)也和華為一起真正地打開(kāi)了移動(dòng)終端的AI時(shí)代。此后幾乎所有手機(jī)廠商都把AI運(yùn)算能力當(dāng)作宣傳賣(mài)點(diǎn)和升級(jí)點(diǎn)。
蘋(píng)果在2018年推出的A12 Bionic,采用了臺(tái)積電當(dāng)時(shí)最新的7nm工藝制程,蘋(píng)果自研的Fusion架構(gòu),而神經(jīng)網(wǎng)絡(luò)引擎從雙核直接升級(jí)到八核,能夠?qū)崿F(xiàn)每秒5萬(wàn)億次計(jì)算,比較上一代有了8.3倍的提升。第二代神經(jīng)網(wǎng)絡(luò)引擎才是在算力和性能上能夠?qū)崿F(xiàn)更多AI功能。另外,A12采用了全新的智能HDR算法以及core ML帶來(lái)的圖像識(shí)別、第三方APP垃圾信息處理等功能,AI應(yīng)用開(kāi)始普及。
2019年發(fā)布的A13 Bionic處理器,CPU、GPU和NPU的核心數(shù)都與A12相同,只是采用了臺(tái)積電升級(jí)版7nm工藝,集成85億個(gè)晶體管,性能、功耗都有了一定提升,而神經(jīng)網(wǎng)絡(luò)引擎的峰值算力提升到每秒6萬(wàn)億次計(jì)算,提升幅度并不顯著,同樣是為面容ID、三攝系統(tǒng)、AR類(lèi)APP等機(jī)器學(xué)習(xí)應(yīng)用提供算力支持。不過(guò)值得一提的是,通過(guò)在CPU中加入2個(gè)機(jī)器學(xué)習(xí)加速器,讓CPU可以達(dá)到每秒1萬(wàn)億次的矩陣數(shù)學(xué)運(yùn)算。同時(shí),Core ML3可以與機(jī)器學(xué)習(xí)控制器配合,自動(dòng)為CPU、GPU和NPU分配任務(wù)。
這次發(fā)布的A14處理器芯片上,神經(jīng)引擎核心數(shù)再次翻倍達(dá)到16個(gè),每秒運(yùn)算次數(shù)達(dá)到了驚人的11.8萬(wàn)億次,機(jī)器學(xué)習(xí)速度提升了70%,機(jī)器學(xué)習(xí)加速器則令運(yùn)算速度快達(dá)10倍,將各種機(jī)器學(xué)習(xí)應(yīng)用的性能表現(xiàn)再次大幅提升。
AI應(yīng)用的“猛虎”,蘋(píng)果AI芯片大規(guī)模升級(jí)的內(nèi)因
根據(jù)資料,早在2014年,蘋(píng)果已經(jīng)在新一代架構(gòu)芯片Soc的開(kāi)發(fā)中加入專(zhuān)門(mén)的AI芯片。而在此之前,蘋(píng)果的AI算力是由“CPU+GPU”實(shí)現(xiàn),其自主開(kāi)發(fā)AI芯片的設(shè)計(jì)思路則是由CPU和GPU處理的AI任務(wù)轉(zhuǎn)向由專(zhuān)門(mén)的AI芯片進(jìn)行處理,最終將芯片集成到終端設(shè)備上。
與此同時(shí),隨著蘋(píng)果移動(dòng)終端在拍照攝影、圖形處理等應(yīng)用上面越來(lái)越需要用到神經(jīng)網(wǎng)絡(luò)和機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的算法運(yùn)算,這些需求使得蘋(píng)果開(kāi)始考慮將AI應(yīng)用的運(yùn)算必須采用神經(jīng)引擎這一專(zhuān)門(mén)定制的處理器單元來(lái)完成這些計(jì)算。
2017年,蘋(píng)果的神經(jīng)引擎處理器正式落地。
不過(guò)讓外界驚訝的是,為何短短三年之中,A系列芯片的AI算力得到了將近20倍的提升,遠(yuǎn)遠(yuǎn)超出Soc芯片其他處理器的性能提升幅度?
一方面是CPU和GPU的性能,在現(xiàn)有的工藝制程進(jìn)化和既定架構(gòu)的約束上提升已經(jīng)非常困難。隨著半導(dǎo)體工藝從7nm向5nm、3nm工藝升級(jí),難度會(huì)越來(lái)越大,而可預(yù)期的提升卻可能并不顯著。反而AI加速器還會(huì)有相當(dāng)大的設(shè)計(jì)提升空間。
另一方面是,終端應(yīng)用對(duì)于動(dòng)用CPU和GPU的需求正在達(dá)到一個(gè)用戶(hù)的使用極限,因此也沒(méi)有快速增長(zhǎng)的需求,但是這些應(yīng)用的AI算力需求則在大幅增長(zhǎng)。
如果對(duì)蘋(píng)果iOS系統(tǒng)中的用到機(jī)器學(xué)習(xí)相關(guān)的功能和應(yīng)用進(jìn)行分析的話(huà),我們看到最新兩代的iPhone和iPad已然是一部各個(gè)部分和細(xì)節(jié)都在使用AI的終端了。
在蘋(píng)果終端的細(xì)節(jié)體驗(yàn),已經(jīng)有大量機(jī)器學(xué)習(xí)算法的加持,但相應(yīng)的體驗(yàn)難以被用戶(hù)察覺(jué)。
比如,機(jī)器學(xué)習(xí)用于幫助iPad的軟件區(qū)分用戶(hù)在使用Apple Pencil繪圖時(shí)到底是不小心將手掌壓在屏幕上還是有意提供輸入的按壓?;蛘呤窃诒O(jiān)控用戶(hù)使用習(xí)慣,以?xún)?yōu)化設(shè)備的電池壽命和充電頻次,既可以改善用戶(hù)在兩次充電之間的時(shí)間,又可以保證電池的使用壽命。
還有像iPhone的拍照,用戶(hù)每次按下快門(mén),設(shè)備會(huì)快速連續(xù)拍攝很多張照片,然后經(jīng)過(guò)機(jī)器學(xué)習(xí)訓(xùn)練的算法會(huì)分析每個(gè)圖像,并將其認(rèn)為是每個(gè)圖像的最佳部分合成為一個(gè)結(jié)果。也就是iPhone拍照的卓越效果很大程度是靠“計(jì)算”出來(lái)的。蘋(píng)果正是通過(guò)iPhone中對(duì)圖像信號(hào)處理器(ISP)和神經(jīng)引擎的協(xié)同處理,才使得照片質(zhì)量獲得大幅提升。
蘋(píng)果在終端本地大幅提升神經(jīng)引擎的運(yùn)算能力,以及配合圖形計(jì)算引擎和AI加速等功能,可以在移動(dòng)終端中執(zhí)行非常高難度的機(jī)器學(xué)習(xí)任務(wù)。比如在iPad Pro上,通過(guò)神經(jīng)引擎的計(jì)算能力,結(jié)合Project Aero 軟件,iPad Pro 能將 PSD 中創(chuàng)作的每一個(gè)圖層以獨(dú)立的 AR 對(duì)象呈現(xiàn)在屏幕上,每個(gè)圖層都分離成一幕栩栩如生的景觀,這對(duì)創(chuàng)作者來(lái)說(shuō)相當(dāng)具有吸引力。
此外,蘋(píng)果已經(jīng)加入的顯著的AI新功能,諸如機(jī)器學(xué)習(xí)在翻譯、內(nèi)置聽(tīng)寫(xiě)、輸入預(yù)測(cè)、健康特性分析與預(yù)測(cè)上面,都需要大量的機(jī)器學(xué)習(xí)參與。
而蘋(píng)果選擇在機(jī)器學(xué)習(xí)任務(wù)的本地化計(jì)算的另一大原因,可能是為了將數(shù)據(jù)留在本地,用以保護(hù)用戶(hù)隱私。我們知道,機(jī)器學(xué)習(xí)的本質(zhì)就是對(duì)海量數(shù)據(jù)進(jìn)行學(xué)習(xí),而數(shù)據(jù)的采集和分析一直是谷歌、facebook這些互聯(lián)網(wǎng)公司的“原罪”,作為承諾嚴(yán)格遵守用戶(hù)隱私數(shù)據(jù)保護(hù)的蘋(píng)果,自然要做出保證,盡量將機(jī)器學(xué)習(xí)算法所需要的用戶(hù)數(shù)據(jù)留在用戶(hù)的移動(dòng)終端當(dāng)中,但與此同時(shí)要保證AI算法的有效,就必須對(duì)終端芯片的AI算力引擎做出大幅提升。
當(dāng)然,蘋(píng)果自身終端系統(tǒng)對(duì)于AI算力升級(jí)的要求,只是一只內(nèi)生的吞噬算力的“猛虎”,在外部競(jìng)爭(zhēng)中,蘋(píng)果還要面對(duì)一群實(shí)力強(qiáng)勁的“追龍”,在AI算力提升上不斷地應(yīng)戰(zhàn)。
安卓陣營(yíng)的“追龍”,蘋(píng)果AI算力快速升級(jí)的外因
蘋(píng)果自研的A系列處理器芯片,一直以來(lái)以創(chuàng)新和高性能著稱(chēng),雖然最近兩年,安卓系的高端芯片,諸如高通的驍龍芯片、聯(lián)發(fā)科Helio芯片、華為海思的麒麟芯片則大有追趕之勢(shì)。
如果拋去綜合性能的討論,但是在AI芯片算力上面,高通的驍龍?zhí)幚砥髟谛阅苌虾蛿?shù)量上都已經(jīng)有超過(guò)蘋(píng)果A系列芯片的可能。
比如在2019年上半年手機(jī)AI芯片排行榜上,排名前十的智能手機(jī)AI芯片,其中前四名分別是高通驍龍855、蘋(píng)果A12 Bionic、聯(lián)發(fā)科Helio P90和海思麒麟980。但值得關(guān)注的是,除了第二、三、四名,這份榜單中的其他位置都被高通驍龍芯片占據(jù)。
與蘋(píng)果采取專(zhuān)用NPU芯片來(lái)提供AI算力不同的是,高通的驍龍?zhí)幚砥鞑捎昧水悩?gòu)計(jì)算的方式,推出了自研的AI引擎,通過(guò)CPU、GPU和DSP(Hexagon處理器)組合相互配合,運(yùn)行神經(jīng)網(wǎng)絡(luò)計(jì)算的效率,根據(jù)不同的應(yīng)用場(chǎng)景來(lái)安排工作負(fù)載。
而預(yù)計(jì)在今年年底發(fā)布的高通驍龍875,同樣采用了5nm制程工藝,與7nm相比邏輯密度提高80%,其基礎(chǔ)性能較上代提升15%,功耗降低30%。非常激進(jìn)的是,高通這次采用了ARM的Cortex X1超大核心設(shè)計(jì),為“1+3+4”八核心三簇設(shè)計(jì)模式,其中1為Cortex X1超大核心,3為大核,采用Cortex A78,4為能效核心。據(jù)業(yè)界的預(yù)測(cè),驍龍875無(wú)論在綜合性能還是在AI算力上都有超越A14的可能。
此外,高通通過(guò)AI引擎的的高、中端芯片布局,與不同的軟硬件企業(yè)一起,從底層框架、硬件核心、軟件等層面,將AI能力應(yīng)用到了海量的移動(dòng)終端和智能設(shè)備上,形成基于AI應(yīng)用的合作生態(tài)。
高通在AI算力上的激進(jìn)演化以及在AI能力上的不斷賦能,已經(jīng)開(kāi)始形成對(duì)于蘋(píng)果的A系列芯片領(lǐng)導(dǎo)力的巨大威脅。在面臨安卓陣營(yíng)這些“追龍”對(duì)手如此“給力”的努力下,蘋(píng)果自然也會(huì)有強(qiáng)大的外部動(dòng)力來(lái)大幅升級(jí)自身的性能優(yōu)勢(shì)。就像驍龍875這樣的性能怪獸的出現(xiàn),始終會(huì)追在蘋(píng)果身后,準(zhǔn)備吊打蘋(píng)果。
反過(guò)來(lái)看蘋(píng)果,其N(xiāo)PU的性能升級(jí)戰(zhàn)略也并未顯露頹勢(shì)。根據(jù)專(zhuān)業(yè)人士的說(shuō)法,目前,蘋(píng)果A系列芯片上NPU占芯片總面積約為5%,未來(lái)NPU的面積能夠達(dá)到類(lèi)似GPU占有的20%的面積的程度,AI算力至少還有4倍的提升空間,此外還有提升算法和芯片之間的協(xié)同設(shè)計(jì),同時(shí)通過(guò)Core ML的進(jìn)化來(lái)加強(qiáng)不同AI模型的異構(gòu)設(shè)計(jì),同樣可以發(fā)揮其他SoC芯片部分的潛在算力。總體來(lái)說(shuō),蘋(píng)果在AI算力的提升上面還有巨大的增長(zhǎng)空間。
我們看到,蘋(píng)果和安卓陣營(yíng)在高端芯片廠商在芯片性能的升級(jí),正在從CPU所引領(lǐng)的摩爾定律的賽場(chǎng)轉(zhuǎn)向以AI算力增長(zhǎng)為代表的新賽道上。而從AI算力的增長(zhǎng)潛力來(lái)看,這一升級(jí)戰(zhàn)在未來(lái)幾年會(huì)更趨激烈。
然而最可惜的是,這場(chǎng)終端芯片AI角逐賽里,未來(lái)會(huì)缺席一位來(lái)自中國(guó)的實(shí)力選手。
-
蘋(píng)果
+關(guān)注
關(guān)注
61文章
24395瀏覽量
198548 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8406瀏覽量
132558 -
麒麟970
+關(guān)注
關(guān)注
10文章
264瀏覽量
63228 -
A14處理器
+關(guān)注
關(guān)注
0文章
15瀏覽量
2063
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論