本文由半導(dǎo)體產(chǎn)業(yè)縱橫(ID:ICVIEWS)編譯自quantamagazine
光學(xué)神經(jīng)網(wǎng)絡(luò)使用光子而不是電子,比傳統(tǒng)系統(tǒng)具有優(yōu)勢(shì)。摩爾定律已經(jīng)相當(dāng)快了。它認(rèn)為,計(jì)算機(jī)芯片每?jī)赡曜笥揖蜁?huì)安裝兩倍數(shù)量的晶體管,從而在速度和效率上產(chǎn)生重大飛躍。但深度學(xué)習(xí)時(shí)代的計(jì)算需求增長(zhǎng)速度甚至更快——這種速度可能不可持續(xù)。國(guó)際能源署預(yù)測(cè),2026年人工智能消耗的電力將是2023年的10倍。計(jì)算硬件公司Lightmatter的創(chuàng)始人兼首席執(zhí)行官尼克·哈里斯 (Nick Harris)表示,人工智能所需的算力每3個(gè)月就會(huì)翻一番,速度遠(yuǎn)遠(yuǎn)快于摩爾定律的預(yù)測(cè)。最有前途的方法之一是不使用可靠的電子來(lái)處理信息,而是使用光子流。最近的結(jié)果表明,對(duì)于現(xiàn)代人工智能的某些基礎(chǔ)計(jì)算任務(wù),基于光的“光學(xué)計(jì)算機(jī)”可能具有優(yōu)勢(shì)。劍橋大學(xué)物理學(xué)家納塔利婭·貝爾洛夫表示,光計(jì)算的發(fā)展“為人工智能等需要高速、高效處理的領(lǐng)域的突破鋪平了道路” 。
理論上,光提供了誘人的潛在好處。其一,光信號(hào)比電信號(hào)可以攜帶更多信息——它們有更多的帶寬。光頻率也比電頻率高得多,因此光系統(tǒng)可以在更短的時(shí)間內(nèi)以更少的延遲運(yùn)行更多的計(jì)算步驟。然后是效率問(wèn)題。除了相對(duì)浪費(fèi)的電子芯片造成的環(huán)境和經(jīng)濟(jì)成本之外,它們的運(yùn)行溫度也非常高,以至于只有一小部分晶體管(所有計(jì)算機(jī)核心的微小開(kāi)關(guān))可以隨時(shí)處于活動(dòng)狀態(tài)。理論上,光學(xué)計(jì)算機(jī)可以同時(shí)進(jìn)行更多操作,在消耗更少能源的同時(shí)處理更多數(shù)據(jù)。斯坦福大學(xué)電氣工程師戈登·韋茨斯坦(Gordon Wetzstein ) 表示,“如果我們能夠利用”這些優(yōu)勢(shì),“這將帶來(lái)許多新的可能性?!笨吹綕撛诘膬?yōu)勢(shì),研究人員長(zhǎng)期以來(lái)一直嘗試將光用于人工智能這個(gè)計(jì)算需求量很大的領(lǐng)域。例如,在 20 世紀(jì) 80 年代和 90 年代,研究人員使用光學(xué)系統(tǒng)構(gòu)建了一些最早的神經(jīng)網(wǎng)絡(luò)。Demetri Psaltis 和加州理工學(xué)院的兩名同事使用這些早期光學(xué)神經(jīng)網(wǎng)絡(luò) (ONN) 之一創(chuàng)建了一個(gè)巧妙的面部識(shí)別系統(tǒng)。他們將一個(gè)受試者(實(shí)際上是研究人員之一)的圖像作為全息圖存儲(chǔ)在光折變晶體中。研究人員使用全息圖來(lái)訓(xùn)練 ONN,然后 ONN 可以識(shí)別研究人員的新圖像并將他與同事區(qū)分開(kāi)來(lái)。但光也有缺點(diǎn),光子通常不會(huì)相互作用,因此一個(gè)輸入信號(hào)很難控制另一個(gè)信號(hào),而這正是普通晶體管的優(yōu)勢(shì)?,F(xiàn)在,它們已被放置在數(shù)十億枚硬幣大小的芯片上,這是數(shù)十年漸進(jìn)式改進(jìn)的產(chǎn)物。
近年來(lái),研究人員發(fā)現(xiàn)了光學(xué)計(jì)算的殺手級(jí)應(yīng)用:矩陣乘法。
一些簡(jiǎn)單的數(shù)學(xué)
矩陣或數(shù)字?jǐn)?shù)組相乘的過(guò)程是大量重型計(jì)算的基礎(chǔ)。具體來(lái)說(shuō),在神經(jīng)網(wǎng)絡(luò)中,矩陣乘法是如何在舊數(shù)據(jù)上訓(xùn)練網(wǎng)絡(luò)以及如何在經(jīng)過(guò)訓(xùn)練的網(wǎng)絡(luò)中處理新數(shù)據(jù)的基本步驟。光可能是比電更好的矩陣乘法媒介。
這種人工智能計(jì)算方法在 2017 年爆發(fā),當(dāng)時(shí)麻省理工學(xué)院的 Dirk Englund 和 Marin Solja?i? 領(lǐng)導(dǎo)的團(tuán)隊(duì)描述了如何在硅芯片上構(gòu)建光學(xué)神經(jīng)網(wǎng)絡(luò)。研究人員將他們想要相乘的各種量編碼成光束,然后將光束發(fā)送通過(guò)一系列改變光束相位(光波振蕩方式)的組件,每個(gè)相位改變代表一個(gè)乘法步驟。通過(guò)反復(fù)分裂光束、改變相位、重新組合,可以使光有效地進(jìn)行矩陣乘法。在芯片的末端,研究人員放置了光電探測(cè)器來(lái)測(cè)量光束并揭示結(jié)果。研究人員教他們的實(shí)驗(yàn)設(shè)備識(shí)別口語(yǔ)元音,這是神經(jīng)網(wǎng)絡(luò)的常見(jiàn)基準(zhǔn)任務(wù)。憑借光的優(yōu)勢(shì),它可以比電子設(shè)備更快、更有效地完成這一任務(wù)。其他研究人員已經(jīng)知道光有利于矩陣乘法;2017 年的論文展示了如何將其付諸實(shí)踐。
康奈爾大學(xué)光子學(xué)專家Peter McMahon表示,這項(xiàng)研究“激起了人們對(duì) ONN 的巨大興趣,那個(gè)人影響力非常大。”
聰明的想法
自 2017 年發(fā)表論文以來(lái),隨著各種研究人員提出了新型光學(xué)計(jì)算機(jī),該領(lǐng)域取得了穩(wěn)步進(jìn)展。Englund 和幾位合作者最近推出了一種名為 HITOP 的新型光網(wǎng)絡(luò),該網(wǎng)絡(luò)結(jié)合了多項(xiàng)先進(jìn)技術(shù)。最重要的是,它的目標(biāo)是隨著時(shí)間、空間和波長(zhǎng)的增加計(jì)算吞吐量。前麻省理工學(xué)院博士后、現(xiàn)任職于南加州大學(xué)的Zaijun Chen表示,這有助于 HITOP 克服光學(xué)神經(jīng)網(wǎng)絡(luò)的缺點(diǎn)之一:將數(shù)據(jù)從電子元件傳輸?shù)焦鈱W(xué)元件需要大量能量,反之亦然。但Zaijun Chen說(shuō),通過(guò)將信息打包到光的三個(gè)維度中,它可以更快地通過(guò) ONN 推送更多數(shù)據(jù),并將能源成本分散到許多計(jì)算中。這降低了每次計(jì)算的成本。研究人員報(bào)告說(shuō),HITOP 可以運(yùn)行比以前基于芯片的 ONN 大 25,000 倍的機(jī)器學(xué)習(xí)模型。
需要明確的是,該系統(tǒng)仍遠(yuǎn)不能與其電子前輩相媲美。Chen表示,HITOP 每秒執(zhí)行約 1 萬(wàn)億次運(yùn)算,而先進(jìn)的 Nvidia 芯片可以處理 300 倍的數(shù)據(jù),他希望擴(kuò)大該技術(shù)的規(guī)模,使其更具競(jìng)爭(zhēng)力。但光學(xué)芯片的效率卻非常引人注目?!斑@里的游戲是我們將能源成本降低了 1,000 倍,”Chen說(shuō)。其他小組已經(jīng)創(chuàng)建了具有不同優(yōu)勢(shì)的光學(xué)計(jì)算機(jī)。去年,賓夕法尼亞大學(xué)的一個(gè)團(tuán)隊(duì)描述了一種新型 ONN,它提供了不同尋常的靈活性。這種基于芯片的系統(tǒng)將激光照射到構(gòu)成電子芯片的半導(dǎo)體部分上,從而改變半導(dǎo)體的光學(xué)特性。激光有效地映射了光信號(hào)的路徑,從而完成了它執(zhí)行的計(jì)算。這使得研究人員可以輕松地重新配置系統(tǒng)的功能。這與大多數(shù)其他基于芯片的系統(tǒng)(光學(xué)和電子系統(tǒng))有著明顯的區(qū)別,在這些系統(tǒng)中,路線是在制造工廠中仔細(xì)制定的,并且很難改變。該研究的主要作者吳天偉說(shuō):“我們所擁有的東西非常簡(jiǎn)單。我們可以重新編程,動(dòng)態(tài)改變激光圖案?!毖芯咳藛T利用該系統(tǒng)設(shè)計(jì)了一個(gè)成功區(qū)分元音的神經(jīng)網(wǎng)絡(luò)。大多數(shù)光子系統(tǒng)在構(gòu)建之前都需要進(jìn)行訓(xùn)練,因?yàn)橛?xùn)練必然涉及重新配置連接。但由于該系統(tǒng)很容易重新配置,研究人員在將模型安裝到半導(dǎo)體上后對(duì)其進(jìn)行了訓(xùn)練。他們現(xiàn)在計(jì)劃增加芯片的尺寸,并用不同顏色的光編碼更多信息,這應(yīng)該會(huì)增加它可以處理的數(shù)據(jù)量。
即使是在 90 年代創(chuàng)建面部識(shí)別系統(tǒng)的 Psaltis 也對(duì)這一進(jìn)步感到印象深刻?!芭c實(shí)際發(fā)生的事情相比,我們 40 年前最瘋狂的夢(mèng)想顯得非常渺小。”
第一縷曙光
雖然光學(xué)計(jì)算在過(guò)去幾年中發(fā)展迅速,但它還遠(yuǎn)未取代實(shí)驗(yàn)室外運(yùn)行神經(jīng)網(wǎng)絡(luò)的電子芯片。論文宣布光子系統(tǒng)比電子系統(tǒng)效果更好,但它們通常使用舊的網(wǎng)絡(luò)設(shè)計(jì)和較小的工作負(fù)載來(lái)運(yùn)行小型模型。安大略省皇后大學(xué)的 Bhavin Shastri 表示,許多關(guān)于光子霸權(quán)的報(bào)道數(shù)據(jù)并沒(méi)有說(shuō)明全部情況?!昂茈y與電子產(chǎn)品進(jìn)行同類比較,”他說(shuō):“例如,當(dāng)他們使用激光時(shí),他們并沒(méi)有真正談?wù)摓榧す?a target="_blank">供電的能量?!?/p>
實(shí)驗(yàn)室系統(tǒng)需要擴(kuò)大規(guī)模才能顯示出競(jìng)爭(zhēng)優(yōu)勢(shì)。Bhavin Shastri 問(wèn)道:“要把它做大到什么程度才能獲勝?”答案是:非常大。這就是為什么沒(méi)有人能與英偉達(dá)制造的芯片相媲美,英偉達(dá)的芯片為當(dāng)今許多最先進(jìn)的人工智能系統(tǒng)提供動(dòng)力。在此過(guò)程中,需要解決大量的工程難題——電子方面已經(jīng)解決了幾十年的問(wèn)題。麥克馬洪說(shuō):“電子領(lǐng)域從一開(kāi)始就具有巨大的優(yōu)勢(shì)?!币恍┭芯咳藛T認(rèn)為,基于 ONN 的人工智能系統(tǒng)將首先在提供獨(dú)特優(yōu)勢(shì)的專業(yè)應(yīng)用中取得成功。Shastri 表示,一種有前途的用途是抵消不同無(wú)線傳輸之間的干擾,例如 5G 蜂窩塔和幫助飛機(jī)導(dǎo)航的雷達(dá)高度計(jì)。今年年初,Shastri 和幾位同事創(chuàng)建了一個(gè) ONN,可以整理不同的傳輸并實(shí)時(shí)挑選出感興趣的信號(hào),處理延遲低于 15 皮秒(15 萬(wàn)億分之一秒)——不到千分之一電子系統(tǒng)所花費(fèi)的時(shí)間,同時(shí)使用不到 1/70 的功率。
但Bhavin Shastri 表示,宏偉的愿景——一種可以超越通用電子系統(tǒng)的光學(xué)神經(jīng)網(wǎng)絡(luò)——仍然值得追求。去年,他的團(tuán)隊(duì)進(jìn)行的模擬顯示,十年內(nèi),足夠大的光學(xué)系統(tǒng)可以使某些人工智能模型的效率比未來(lái)電子系統(tǒng)的效率提高 1000 倍以上?!艾F(xiàn)在很多公司都在努力爭(zhēng)取1.5倍的收益。一千倍的好處,那就太神奇了?!彼f(shuō):“如果成功的話,這可能是一個(gè)為期 10 年的項(xiàng)目。”
-
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238239 -
光芯片
+關(guān)注
關(guān)注
3文章
95瀏覽量
10887 -
計(jì)算機(jī)芯片
+關(guān)注
關(guān)注
0文章
42瀏覽量
3506
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論