隨著各類大模型和深度神經網絡涌現(xiàn),如何制造出滿足人工智能發(fā)展、兼具大算力和高能效的下一代AI芯片,已成為國際前沿熱點。中國科協(xié)發(fā)布的2023重大科學問題中“如何實現(xiàn)低能耗人工智能”被排在首位。
2023年10月25日,清華大學團隊在超高性能計算芯片領域取得新突破。相關成果以“All-analog photo-electronic chip for high-speed vision tasks”為題發(fā)表在Nature上。這枚芯片基于純模擬光電融合計算架構,在包括ImageNet等智能視覺任務實測中,相同準確率下,比現(xiàn)有高性能GPU算力提升3000倍,能效提升400萬倍。
圖1 相關論文(來源Nature)
未來已來?光為載體的計算芯片
實現(xiàn)算力飛躍并非易事,特別是當前傳統(tǒng)的芯片架構,受限于電子晶體管大小逼近物理極限。全新計算架構成為破局的關鍵。光計算以其超高的并行度和速度,被認為是未來顛覆性計算架構的最有力競爭方案之一。光計算,顧名思義是將計算載體從電變?yōu)楣猓霉庠谛酒械膫鞑ミM行計算。面對以光速計算的誘人前景,數年來海內外知名科研團隊相繼提出多種設計,但要替代現(xiàn)有電子器件實現(xiàn)系統(tǒng)級應用,仍面臨重大瓶頸:一是如何在一枚芯片上集成大規(guī)模的計算單元(可控神經元),且約束誤差累計程度;二是實現(xiàn)高速高效的片上非線性;三是為兼容目前以電子信號為主體的信息社會,如何提供光計算與電子信號計算的高效接口。當前常見的模數轉換功耗,較光計算每步乘加運算高出多個數量級,掩蓋了光計算本身的性能優(yōu)勢,導致光芯片難以在實際應用中體現(xiàn)出優(yōu)越性。
系統(tǒng)級算力和能效,超現(xiàn)有芯片萬倍
為解決這一國際難題,清華大學團隊創(chuàng)造性地提出了模擬電融合模擬光的計算框架,構建可見光下的大規(guī)模多層衍射神經網絡實現(xiàn)視覺特征提取,利用光電流直接進行基于基爾霍夫定律的純模擬電子計算,兩者集成在同一枚芯片框架內,完成了“傳感前 傳感中 近傳感”的新型計算系統(tǒng)。極大地降低了對于高精度ADC的需求,消除傳統(tǒng)計算機視覺處理范式在模數轉換過程中速度、精度與功耗相互制約的物理瓶頸,在一枚芯片上突破大規(guī)模集成、高效非線性、高速光電接口三個關鍵瓶頸。
圖2. 光電計算芯片ACCEL的計算原理和芯片架構(來源Nature)
實測表現(xiàn)下,ACCEL芯片的系統(tǒng)級算力達到現(xiàn)有高性能芯片的數千倍。同時系統(tǒng)級能效達74.8 Peta-OPS/W,較現(xiàn)有的高性能GPU、TPU、光計算和模擬電計算架構,提升了兩千到數百萬倍。
在超低功耗下運行的ACCEL將有助于大幅度改善發(fā)熱問題,對于芯片的未來設計帶來全方位突破,并為超高速物理觀測提供算力基礎。同時對無人系統(tǒng)、自動駕駛等續(xù)航能力要求高的場景帶來重大利好。
表1. ACCEL和現(xiàn)有高性能芯片的系統(tǒng)級實測性能指標對比 (來源:Nature)非相干光直接計算
更進一步,ACCEL芯片還支持非相干光視覺場景的直接計算,如論文中演示的交通場景實驗。顯著拓展了ACCEL的應用領域,有望顛覆目前自動駕駛、機器人視覺、移動設備等領域先將圖片拍攝并保存在內存中后進行計算的思路,避免傳輸和ADC帶寬限制,在傳感過程中完成計算。
圖3. ACCEL可用于電子設備超低功耗人臉喚醒示意動圖(來源:清華大學)
開辟新路徑:顛覆性架構有望真正落地
清華攻關團隊提出的新型計算架構不僅對于光計算技術的應用部署意義重大,對未來其他高效能計算技術與當前電子信息系統(tǒng)的融合,亦深有啟發(fā)。
論文通訊作者之一,清華大學戴瓊海院士介紹道,“采用全新原理研發(fā)出計算系統(tǒng)是一座大山,而將新一代計算架構真正落地到現(xiàn)實生活,解決國計民生的重大需求,是攀過高峰后更重要的攻關?!盢ature雜志特邀在Research Briefing發(fā)表的該研究專題評述也指出,“或許這項工作的出現(xiàn),會讓新一代計算架構,比預想中早得多地進入日常生活(ACCEL might enable these architectures to play a part in our daily life much sooner than expected.)”。
清華大學戴瓊海院士、方璐副教授、喬飛副研究員、吳嘉敏助理教授為本文的共同通訊作者;博士生陳一彤、博士生麥麥提·那扎買提、許晗博士為共同一作;孟瑤博士、周天貺助理研究員、博士生李廣普、范靜濤研究員、魏琦副研究員共同參與了這項研究。
-
晶體管
+關注
關注
77文章
9682瀏覽量
138080 -
人工智能
+關注
關注
1791文章
47183瀏覽量
238247 -
智能視覺
+關注
關注
0文章
100瀏覽量
9205
原文標題:清華開發(fā)出超高性能計算芯片:速度比高端GPU提升3000倍,能效提升400萬倍!
文章出處:【微信號:wc_ysj,微信公眾號:旺材芯片】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論