無芯片不AI,芯片是支撐人工智能的基礎(chǔ)。2019年,云端AI芯片迎來亞馬遜、高通、阿里巴巴、Facebook等新玩家,軟硬一體化趨勢加強(qiáng);終端芯片功耗比競爭加強(qiáng),語音芯片持續(xù)火熱;邊緣AI芯片勢頭初現(xiàn)。2020年,AI芯片將逐漸進(jìn)入洗牌期,機(jī)遇與挑戰(zhàn)并存。
邊緣AI芯片進(jìn)入搶灘戰(zhàn)
AI正在從云端向邊緣端擴(kuò)展,邊緣計(jì)算被視為人工智能的下一個(gè)戰(zhàn)場。寒武紀(jì)副總裁劉道福表示,在邊緣計(jì)算種類中,邊緣往往和各類傳感器相連,而傳感器的數(shù)據(jù)往往是非結(jié)構(gòu)化的,很難直接用于控制和決策,因此需要邊緣人工智能計(jì)算將非結(jié)構(gòu)化的數(shù)據(jù)結(jié)構(gòu)化,從而用于控制和決策。
2019年,圍繞邊緣AI芯片的搶灘布局已經(jīng)開始。一方面,英偉達(dá)、寒武紀(jì)、百度等已經(jīng)在云、端有所積累的廠商,希望以邊緣芯片完善云、邊、端生態(tài),打造一體化的計(jì)算格局。英偉達(dá)發(fā)布了面向嵌入式物聯(lián)網(wǎng)的邊緣計(jì)算設(shè)備Jetson Nano,適用于入門級網(wǎng)絡(luò)硬盤錄像機(jī)、家用機(jī)器人以及具備全面分析功能的智能網(wǎng)關(guān)等應(yīng)用,之后又發(fā)布了邊緣AI超級計(jì)算機(jī)Jetson Xavier NX,能夠在功耗10W的模式下提供最高14TOPS,在功耗15W模式下提供最高21 TOPS的性能。寒武紀(jì)發(fā)布用于深度學(xué)習(xí)的SoC邊緣加速芯片思元220,采用臺積電16nm工藝,最大算力32TOPS(INT4),功耗控制在10W,支持Tensorflow、Caffe、mxnet以及pytorch等主流編程框架。百度聯(lián)合三大運(yùn)營商、中興、愛立信、英特爾等,發(fā)起百度 AI 邊緣計(jì)算行動(dòng)計(jì)劃,旨在利用 AI 推理、函數(shù)計(jì)算、大數(shù)據(jù)處理和產(chǎn)業(yè)模型訓(xùn)練推動(dòng) AI 場景在邊緣計(jì)算的算力支撐和平臺支持。
另一方面,自動(dòng)駕駛等專用邊緣AI芯片勢頭漸顯。地平線宣布量產(chǎn)國內(nèi)首款車規(guī)級AI芯片“征程二代”,采用臺積電28nm工藝,可提供超過4TOPS的等效算力,典型功耗僅2瓦,延遲少于100毫秒,多任務(wù)模式下可以同時(shí)運(yùn)行超過60個(gè)分類任務(wù),每秒鐘識別目標(biāo)數(shù)超過2000個(gè),面向車聯(lián)網(wǎng)對強(qiáng)實(shí)時(shí)響應(yīng)的需求。
多個(gè)新玩家入局云端
云端仍然是AI芯片的主要戰(zhàn)場。2019年,云端芯片迎來多個(gè)新玩家,算力大戰(zhàn)持續(xù)升級。高通推出了面向數(shù)據(jù)中心推理計(jì)算的云端AI芯片Cloud AI 100,峰值性能超過350 TOPS,與其他商用方案相比每瓦特性能提升10倍。云服務(wù)領(lǐng)跑者亞馬遜推出了機(jī)器學(xué)習(xí)推理芯片AWS Inferentia,最高算力為128 TOPS,在AI推理實(shí)例inf1可搭載16個(gè)Inferentia芯片,提供最高2000TOPS算力。阿里巴巴推出號稱全球最高性能AI推理芯片含光800,采用自研芯片架構(gòu)和達(dá)摩院算法,在Resnet50基準(zhǔn)測試中獲得單芯片性能第一。騰訊投資的燧原科技發(fā)布了面向云端數(shù)據(jù)中心的AI加速卡云燧 T10,單卡單精度算力達(dá)到20TFLOPS,支持單精度FP32和半精度BF16的混合精度計(jì)算,并為大中小型數(shù)據(jù)中心提供了單節(jié)點(diǎn)、單機(jī)柜、集群三種模式,在集群模式下通過片間互聯(lián)實(shí)現(xiàn)1024節(jié)點(diǎn)集群。
芯片是AI的載體,而軟件是完成智能操作的核心。隨著異構(gòu)計(jì)算逐漸導(dǎo)入AI芯片,軟硬件協(xié)同成為云端AI的重要趨勢。英特爾推出了面向異構(gòu)計(jì)算的統(tǒng)一軟件平臺One API,以隱藏硬件復(fù)雜性,根據(jù)系統(tǒng)和硬件自動(dòng)適配功耗最低、性能最佳的加速方式,簡化并優(yōu)化編程過程。賽靈思也推出了軟件平臺Vitis AI,向用戶開放易于訪問的軟件接口,可根據(jù)軟件或算法自動(dòng)適配賽靈思硬件架構(gòu)。
功耗比仍是終端側(cè)重點(diǎn)
在終端側(cè),功耗比仍然是角逐焦點(diǎn)。尤其在手機(jī)等對于續(xù)航能力錙銖必較的終端,主力廠商推出的AI引擎都對低功耗有所強(qiáng)調(diào)。麒麟990 5G的NPU采用雙大核+微核的方式,大核負(fù)責(zé)性能,微核擁有超低功耗。據(jù)介紹,微核在人臉檢測的應(yīng)用場景下,能耗比大核工作降低24倍。高通發(fā)布的驍龍865集成了傳感器中樞,讓終端能夠以極低功耗感知周圍情境。三星提出通過較低功耗的NPU實(shí)現(xiàn)終端設(shè)備上的AI處理,實(shí)現(xiàn)在設(shè)備端直接執(zhí)行更復(fù)雜的任務(wù)。
除了手機(jī),終端側(cè)的另一個(gè)當(dāng)紅炸子雞是AI語音芯片。科大訊飛、阿里巴巴、探境科技、清微智能等都發(fā)布了針對智能家居的AI語音芯片,反映了AI芯片在特定領(lǐng)域的專業(yè)化、定制化趨勢。阿里達(dá)摩院公布了首款專用于語音合成算法的 AI FPGA芯片技術(shù)Ouroboros,使用了端上定制硬件加速技術(shù),降低對云端網(wǎng)絡(luò)的依賴,支持實(shí)時(shí)語音合成和AI語音識別,有望在天貓精靈搭載。
2020機(jī)遇挑戰(zhàn)并存
2019-2021年,中國AI芯片市場規(guī)模仍將保持50%以上的增長速度,到2021年,市場規(guī)模將達(dá)到305.7億元。賽迪智庫預(yù)測,2019-2021年,云端訓(xùn)練芯片增速放緩,云端推理芯片、終端推理芯片市場增長速度將持續(xù)呈上升趨勢。預(yù)計(jì)2021年,中國云端訓(xùn)練芯片市場規(guī)模將達(dá)到139.3億元,云端推理芯片市場規(guī)模將達(dá)到82.2億元,終端推理芯片達(dá)到84.1億元。
集邦咨詢分析師姚嘉洋向記者指出,2019年,AI芯片大致已經(jīng)走出一條較為清晰的道路,端、邊、云的芯片規(guī)格相對明確。2020年,各大芯片廠會延續(xù)在2019年的產(chǎn)品發(fā)展路徑,持續(xù)深化芯片的性價(jià)比及功耗比表現(xiàn)。從訓(xùn)練端來看,值得關(guān)注的是HBM(高頻寬存儲器)的整合與相關(guān)的封裝技術(shù)良率,這會牽動(dòng)芯片廠商與存儲器及封測廠商之間合作關(guān)系的變化。推理端的決戰(zhàn)點(diǎn)在INT8領(lǐng)域,重點(diǎn)在于如何進(jìn)一步提升芯片本身的性能及功耗表現(xiàn)。
5G、VR/AR等新技術(shù),也將為AI芯片,尤其是邊緣側(cè)的AI芯片提供更多的發(fā)揮空間。Arm ML事業(yè)群商業(yè)與營銷副總裁Dennis Laudick曾向記者表示,5G通信技術(shù)改變了數(shù)據(jù)處理的方式,讓邊緣AI的工作負(fù)載也有了處理需求。可以說,5G帶來了網(wǎng)絡(luò)邊緣的更多創(chuàng)新。姚嘉洋也表示,AI在5G核心網(wǎng)絡(luò)存在機(jī)會,由于5G帶來了更多元的頻譜組合,AI可以輔助核心網(wǎng)絡(luò)更有效地調(diào)度網(wǎng)絡(luò)資源,將頻寬資源的利用達(dá)到極大化。同時(shí),5G也涵蓋車聯(lián)網(wǎng),AI將在自動(dòng)駕駛將大有機(jī)會。在VR/AR端,AI也在導(dǎo)入,主要聚焦在人眼追蹤或是場景識別等應(yīng)用,有望改善VR/AR的流暢度與實(shí)時(shí)性表現(xiàn)。
清華大學(xué)微電子所所長魏少軍表示,從產(chǎn)業(yè)發(fā)展規(guī)律來看,在2019-2020年,AI芯片將持續(xù)火熱,企業(yè)扎堆進(jìn)入;但是到了2020年前后,則將會出現(xiàn)一批出局者,行業(yè)洗牌開始。由于目前AI算法還在不斷演進(jìn)匯總的過程中,最終的成功與否則將取決于各家技術(shù)路徑的選擇和產(chǎn)品落地的速度。
痛點(diǎn)尚待攻克
近兩年,AI在語音識別、圖像識別等應(yīng)用領(lǐng)域取得突破,但要從單點(diǎn)突破走向全面開花,需要AI領(lǐng)域誕生如同CPU一樣的通用AI計(jì)算芯片。清華大學(xué)微納電子系副教授尹首一等專家指出,AI芯片短期內(nèi)以異構(gòu)計(jì)算為主,中期要發(fā)展自重構(gòu)、自學(xué)習(xí)、自適應(yīng),長期則朝向通用計(jì)算芯片發(fā)展。
具體來說,AI要從應(yīng)用適應(yīng)硬件走向硬件適應(yīng)應(yīng)用,就要求AI芯片具備可編程性、動(dòng)態(tài)可變的計(jì)算架構(gòu),來應(yīng)對層出不窮的新算法和新應(yīng)用。魏少軍表示,AI芯片一要適應(yīng)算法的演進(jìn),二要有適應(yīng)所有應(yīng)用的架構(gòu),這就要求架構(gòu)具備高效的轉(zhuǎn)化能力。在成本敏感的消費(fèi)電子領(lǐng)域,還需關(guān)注AI芯片的計(jì)算效能,達(dá)到低功耗、小體積、開發(fā)簡易,這些都需要探索架構(gòu)上的創(chuàng)新。
全球AI芯片產(chǎn)業(yè)仍處于產(chǎn)業(yè)化早期階段,國產(chǎn)處理器廠商與國際廠商在人工智能這一全新賽場上處在同一起跑線。耐能創(chuàng)始人兼CEO 劉峻誠表示,中國擁有龐大的智能手機(jī)、智能家居、智能安防等市場,對中國的AI公司而言,不僅在服務(wù)國內(nèi)客戶時(shí)具有本土化的優(yōu)勢,還可借助這些客戶的生產(chǎn)制造優(yōu)勢進(jìn)軍海外市場,實(shí)現(xiàn)“立足中國,放眼全球”的商業(yè)布局。
責(zé)任編輯:wv
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238246 -
AI芯片
+關(guān)注
關(guān)注
17文章
1879瀏覽量
34990
發(fā)布評論請先 登錄
相關(guān)推薦
評論