本文經(jīng)機(jī)器之心(微信公眾號(hào):almosthuman2014)授權(quán)轉(zhuǎn)載,禁止二次轉(zhuǎn)載
作者:澤南、蛋醬、小舟
NeurIPS 接收論文中,29% 的作者有中國(guó)大學(xué)的本科學(xué)位,但他們?cè)诋厴I(yè)后有 54% 會(huì)去美國(guó)攻讀研究生博士,這其中又有 90% 選擇留美工作。劍橋大學(xué)的 2020 版《AI 全景報(bào)告》寫出了 AI 領(lǐng)域哪些值得關(guān)注的新觀察?
人工智能是基礎(chǔ)科學(xué)與工程實(shí)踐結(jié)合的技術(shù)領(lǐng)域,近年來已經(jīng)融合了越來越多的其他方向。在數(shù)字化逐漸成型的今天,AI 將為技術(shù)進(jìn)步產(chǎn)生推動(dòng)作用。
近日,劍橋大學(xué)的 2020 版《AI 全景報(bào)告》終于出爐,這是該年度報(bào)告的第三期。和往年一樣,該報(bào)告援引的數(shù)據(jù)來自知名科技公司和研究小組。新版 AI 全景報(bào)告以幾個(gè)方面分別介紹了人工智能領(lǐng)域最近一段時(shí)間的發(fā)展趨勢(shì):研究、人才、業(yè)界、政策和未來展望。
該調(diào)查的兩位主要作者 Nathan Benaich 與 Ian Hogarth 均來自劍橋大學(xué)。
一、人工智能研究進(jìn)展
人工智能領(lǐng)域的發(fā)展雖然伴隨著開源的框架和活躍的社區(qū),但在今年報(bào)告的開頭,我們還是需要以數(shù)據(jù)說話,首先明確一點(diǎn):AI 研究的開放性并沒有我們想象的那么高。
在深度學(xué)習(xí)框架上,正如我們最近所感受到的,在各個(gè) AI 頂會(huì)的論文中,研究人員已經(jīng)廣泛使用了 PyTorch,其搶占了大部分原來 TensorFlow 的位置。
在 GitHub 上,PyTorch 相比 TensorFlow 也有更多的新研究實(shí)現(xiàn):據(jù)統(tǒng)計(jì)現(xiàn)在約有 47% 的實(shí)現(xiàn)是基于 PyTorch 的,而 TensorFlow 的大約為 18%。
另一方面,大尺寸模型正在推動(dòng)著 NLP 領(lǐng)域的技術(shù)進(jìn)步,OpenAI 的 GPT-3 等新研究已經(jīng)把深度學(xué)習(xí)模型的參數(shù)數(shù)量推到了千億。根據(jù)目前的云服務(wù)算力價(jià)格,訓(xùn)練每 1000 參數(shù)的模型平均需要 1 美元,擁有 1750 億參數(shù)的 GPT-3 可能需要花費(fèi)百萬美元級(jí)別的費(fèi)用,有專家認(rèn)為這一數(shù)字超過了 1000 萬美元。高昂的訓(xùn)練費(fèi)用,讓研究人員們?cè)谔剿餍路较驎r(shí)遭遇了挑戰(zhàn)。
在 AI 模型訓(xùn)練需求越來越多算力的同時(shí),傳統(tǒng)計(jì)算機(jī)架構(gòu)卻在逐漸接近摩爾定律的終點(diǎn)。MIT 等大學(xué)的研究稱,科學(xué)家如果希望將 ImageNet 數(shù)據(jù)集圖像分類任務(wù)的錯(cuò)誤率從 11.5% 降到 1%,可能需要數(shù)百億美元的投入。
不過,人們也在研究提高模型效率的方法,OpenAI 的統(tǒng)計(jì)表明:自 2012 年起,訓(xùn)練深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)進(jìn)行 ImageNet 圖像分類要想達(dá)到特定的水平,其所需的算力每 16 個(gè)月減半。
毋庸置疑的是,GPT-3、BERT 等模型已經(jīng)讓 NLP 領(lǐng)域的研究進(jìn)入了新的階段?,F(xiàn)在甚至出現(xiàn)了自動(dòng)翻譯編程語(yǔ)言的無監(jiān)督機(jī)器翻譯工具。在 GitHub 上把 C++ 函數(shù)翻譯至 Java 準(zhǔn)確率達(dá)到 90%。
技術(shù)的快速發(fā)展源于人工智能領(lǐng)域的高研究力度。據(jù)統(tǒng)計(jì),全球有關(guān) AI 方法(深度學(xué)習(xí)、NLP、計(jì)算機(jī)視覺、強(qiáng)化學(xué)習(xí)等)的論文數(shù)量自 2017 年起每年增長(zhǎng) 50%,在 2020 年,我們可能將會(huì)看到超過 21000 篇 AI 領(lǐng)域的新論文。
不過,當(dāng)前的大多數(shù)機(jī)器學(xué)習(xí)應(yīng)用是通過統(tǒng)計(jì)來實(shí)現(xiàn)功能的,其忽略了人類學(xué)習(xí)知識(shí)的重要方法——因果推理。在為患者尋找診療方案等任務(wù)中,因果推理是更好的方式。Judea Pearl、Yoshua Bengio 等人工智能先驅(qū)者都認(rèn)為,因果推理是使得機(jī)器學(xué)習(xí)系統(tǒng)更好地泛化,更強(qiáng)大穩(wěn)健,并為決策作出更大貢獻(xiàn)的新方向。
二、AI 人才:美國(guó)占主導(dǎo)
人工智能領(lǐng)域研究者的分布情況近幾年呈現(xiàn)出幾種新的趨勢(shì)。
人才流動(dòng)
首先,學(xué)術(shù)界面臨人才外流的情況,美國(guó)許多研究教授離開大學(xué),前往科技公司任職。從 2004 年至 2018 年,谷歌、DeepMind、亞馬遜、微軟已經(jīng)從美國(guó)大學(xué)聘請(qǐng)了 52 位終身教授。卡內(nèi)基梅隆大學(xué)、華盛頓大學(xué)和伯克利大學(xué)在同一時(shí)期失去了 38 名教授。值得注意的是,僅 2018 年一年就有 41 位 AI 教授離開。
從 AI 頂會(huì)的角度看,在中國(guó)有過教育經(jīng)歷的研究者近幾年為 AI 領(lǐng)域的研究做出了突出貢獻(xiàn)。以人工智能國(guó)際頂會(huì) NeurIPS 2019 為例,接收論文的作者中有 29% 都曾在中國(guó)獲得本科學(xué)位。
但是從國(guó)內(nèi)的大學(xué)畢業(yè)后,繼續(xù)在 NeurIPS 上發(fā)表論文的畢業(yè)生中有 54% 都去了美國(guó)。
在人工智能領(lǐng)域里,美國(guó)仍然是國(guó)際研究的中心,有 90% 在美國(guó)畢業(yè)的留學(xué)博士都會(huì)留美繼續(xù)工作。
而非美國(guó)籍的 AI 博士畢業(yè)生畢業(yè)之后很有可能到大型科技公司就職,而美國(guó)籍的博士畢業(yè)生更有可能去初創(chuàng)公司就職或加入學(xué)術(shù)界的研究行列。
與此同時(shí),許多 AI 領(lǐng)域的美國(guó)博士畢業(yè)生畢業(yè)之后會(huì)前往英國(guó)和中國(guó)就職。
接下來我們?cè)購(gòu)难芯繖C(jī)構(gòu)的角度分析一下 AI 領(lǐng)域的概況。
以 NeurIPS 2019 為例,谷歌、斯坦福、卡內(nèi)基梅隆大學(xué)、MIT 和微軟發(fā)表的論文數(shù)量位居前五。
人才供不應(yīng)求
作為當(dāng)下最熱門的研究領(lǐng)域之一,AI 領(lǐng)域的人才需求不斷增長(zhǎng)。許多一流大學(xué)也在擴(kuò)大 AI 專業(yè)的招生規(guī)模。以斯坦福為例,最近幾年斯坦福 AI 領(lǐng)域的學(xué)生是 1999-2004 年的十倍之多,與 2012-2014 年相比 AI 領(lǐng)域?qū)W生數(shù)量也是翻了一倍。盡管如此,來自 Indeed 的數(shù)據(jù)顯示,招聘職位的數(shù)量仍約為求職者數(shù)量的三倍。
但不可避免的是,2020 年人工智能領(lǐng)域的人才市場(chǎng)受到了新冠疫情的嚴(yán)重影響。根據(jù)領(lǐng)英發(fā)布的數(shù)據(jù),2020 年機(jī)器學(xué)習(xí)領(lǐng)域職位原本強(qiáng)勁的增長(zhǎng)趨勢(shì)在 2 月受到打擊,開始下滑。
三、業(yè)界快速發(fā)展
人工智能設(shè)計(jì)的藥物,在日本已經(jīng)開始了一期臨床試驗(yàn)。在人工智能醫(yī)療領(lǐng)域,眾多創(chuàng)業(yè)公司收集了巨額資金,實(shí)現(xiàn)了「平臺(tái)戰(zhàn)略」。
在新冠疫情期間,眾多科技公司也快速將 AI 醫(yī)療影像識(shí)別技術(shù)投入了實(shí)用化。最近一段時(shí)間里,美國(guó)醫(yī)療保險(xiǎn)和醫(yī)療補(bǔ)助服務(wù)中心提出了基于深度學(xué)習(xí)的醫(yī)療成像產(chǎn)品費(fèi)用標(biāo)準(zhǔn)。AI 系統(tǒng)可以快速掃描胸透等多種醫(yī)療影像,并將篩查結(jié)果提交給人類專家,排除非敏感因素。
說到人工智能最引人關(guān)注的自動(dòng)駕駛。自 2018 年以來,在加利福尼亞州擁有自動(dòng)駕駛汽車測(cè)試許可的 66 家公司中,只有 3 家被允許在沒有安全駕駛員的情況下進(jìn)行測(cè)試,其分別為 Waymo(谷歌)、Nuro 和 AutoX。
即使在政策最為開放的加州,迄今為止自動(dòng)駕駛汽車的行駛里程相比人類也是微不足道——自動(dòng)駕駛汽車公司在 2019 年的自動(dòng)駕駛里程比 2018 年增加了 42%。但這僅相當(dāng)于 2019 年有駕照加州駕駛員行駛里程的 0.000737%。
使用每次人工干涉之前,汽車自動(dòng)駕駛的行駛里程作為評(píng)判標(biāo)準(zhǔn),其實(shí)不一定是最客觀的。在美國(guó)一些州,駕駛員雙手完全脫離方向盤的行駛里程并沒有記錄。
不過最近,我們看到了這項(xiàng)數(shù)據(jù)的新變化。百度的自動(dòng)駕駛已經(jīng)達(dá)到了人工每次干涉之間 18,050 英里,超過了 Waymo(谷歌)的 13,219 英里。對(duì)于不斷加強(qiáng) AI 投入的百度來說,最近的投入已經(jīng)開始得到回報(bào)。
自動(dòng)駕駛領(lǐng)域的公司,必須要有強(qiáng)大的資金支持。13 億美元被亞馬遜收購(gòu)的 Zoox,其自 2015 年以來收獲的融資已超過了 9.55 億美元,Zoox 最新的估值約為 32 億美元。交易文件顯示,Zoox 在 2020 年初每個(gè)月要燒掉 3000 萬美元。
國(guó)內(nèi)的出行公司滴滴最近也把自動(dòng)駕駛業(yè)務(wù)剝離,并從軟銀遠(yuǎn)景基金等機(jī)構(gòu)籌集了 5 億美元。今年 7 月,滴滴在上海推出了自動(dòng)駕駛汽車服務(wù)。
目前,自動(dòng)駕駛系統(tǒng)中的大多數(shù)機(jī)器學(xué)習(xí)算法只專注于車輛周圍的事物,并基于工程量巨大的手寫規(guī)則。研究人員正在開發(fā)類似于 AlphaGo,學(xué)習(xí)大量人類駕駛經(jīng)驗(yàn)進(jìn)行訓(xùn)練的新算法。最近,Waymo、Uber 和 Lyft 都展示了模仿學(xué)習(xí)和逆強(qiáng)化學(xué)習(xí)的新技術(shù)。
自動(dòng)駕駛等領(lǐng)域的發(fā)展也需求大量算力,Graphcore、英偉達(dá)等公司今年推出的新一代芯片成為了人們的希望。
政策變化
除了 AI 研究方向之外,人工智能應(yīng)用的快速落地也引起了人們對(duì)于隱私和倫理的擔(dān)憂。
人臉識(shí)別技術(shù)正面臨著前所未有的爭(zhēng)議
目前,世界上 50% 的地方都允許使用人臉識(shí)別技術(shù),只有 3 個(gè)國(guó)家 (比利時(shí)、盧森堡、摩洛哥) 部分禁止該技術(shù),只允許在特定情況下使用。
那些頭部科技公司,對(duì)于人臉識(shí)別技術(shù)的使用也更加謹(jǐn)慎:
微軟刪除了其 1000 萬張人臉的數(shù)據(jù)庫(kù)——這是目前可用的最大數(shù)據(jù)庫(kù)。數(shù)據(jù)庫(kù)中的人臉是從網(wǎng)絡(luò)上抓取的,并未取得當(dāng)事人的許可。
亞馬遜宣布一年內(nèi)暫停警方使用其面部識(shí)別工具 Rekognition,以便「國(guó)會(huì)有足夠時(shí)間制定適當(dāng)?shù)囊?guī)定」。
IBM 宣布放棄其人臉識(shí)別產(chǎn)品及技術(shù)。
紐約大都會(huì)運(yùn)輸署 (MTA) 要求蘋果允許乘客戴口罩時(shí)啟用 FaceID,以防止新冠病毒擴(kuò)散。
這一年以來,人臉識(shí)別技術(shù)所面臨的爭(zhēng)議比以往都要洶涌。
美國(guó)繼續(xù)在軍用 AI 系統(tǒng)上投入大量資金
隨著機(jī)器學(xué)習(xí)技術(shù)的落地,軍方在該方面的探索也越來越多,盡管我們尚不清楚這一趨勢(shì)對(duì)現(xiàn)實(shí)世界的影響程度。
美國(guó)總務(wù)管理局和美國(guó)國(guó)防部聯(lián)合人工智能中心授予博思艾倫咨詢公司一份為期 5 年、總共 8 億多美元的訂單,內(nèi)容簡(jiǎn)介中包括「數(shù)據(jù)標(biāo)簽、數(shù)據(jù)管理、人工智能產(chǎn)品開發(fā)」等關(guān)鍵詞。
在國(guó)防層面,還有更多與此相關(guān)的 AI 公司正在獲得豐厚的政府合同和風(fēng)險(xiǎn)投資。戴爾旗下 Pivotal 軟件公司獲得了美國(guó)國(guó)防部 1.21 億美元的合同,還有一些從事無人機(jī)、高分辨率衛(wèi)星地圖、信息管理等業(yè)務(wù)的公司獲得了大量風(fēng)險(xiǎn)投資,例如 Anduril、Rebellion、Skydio。
美國(guó)國(guó)防部高級(jí)研究計(jì)劃局(DARPA)組織了一場(chǎng)虛擬空戰(zhàn)大賽,一眾 AI 系統(tǒng)相互競(jìng)爭(zhēng),最終勝出的「選手」、蒼鷺系統(tǒng)公司開發(fā)的頂級(jí) AI 以 5:0 的成績(jī)擊敗了人類飛行員。
從 AlphaGo、AlphaStar 到 AlphaDogfight,借助深度強(qiáng)化學(xué)習(xí)技術(shù),人工智能正在更多的領(lǐng)域擊敗頂尖人類選手。這也充分說明,在游戲?qū)?zhàn)環(huán)境中所訓(xùn)練的取勝技術(shù),可以迅速遷移到軍事環(huán)境中。被擊敗的飛行員表示:「作為戰(zhàn)斗機(jī)飛行員,我們往常的標(biāo)準(zhǔn)操作方法已經(jīng)不起作用了?!?/p>
美國(guó)國(guó)防部長(zhǎng) Mark T. Esper 表示,這些在模擬戰(zhàn)斗環(huán)境中訓(xùn)練的算法,將在 2024 年應(yīng)用于真實(shí)世界的戰(zhàn)爭(zhēng)中,包括全尺寸戰(zhàn)術(shù)飛機(jī)。機(jī)器學(xué)習(xí)將對(duì)未來世界的戰(zhàn)爭(zhēng)產(chǎn)生結(jié)構(gòu)性影響,他指出:「那些率先利用最新迭代技術(shù)的人,往往會(huì)在未來戰(zhàn)場(chǎng)上占據(jù)決定性優(yōu)勢(shì)。」
兩大 AI 頂會(huì)采用全新的道德規(guī)范
NeurIPS 和 ICLR 都提出了新的倫理規(guī)范,但并未強(qiáng)制代碼和數(shù)據(jù)共享。以人工智能領(lǐng)域最頂級(jí)會(huì)議 NeurIPS 為例:
NeurIPS 將創(chuàng)建一個(gè)專門的子團(tuán)隊(duì),由機(jī)器學(xué)習(xí)和倫理學(xué)交叉領(lǐng)域的專家組成。
NeurIPS 現(xiàn)在要求論文作者提交關(guān)于「該工作可能產(chǎn)生的更廣泛的影響,包括道德方面以及未來的社會(huì)影響」。
鑒于 Facebook 和谷歌等公司在 NeurIPS 中的影響力日益增強(qiáng),因此「作者必須提供明確披露資金來源以及競(jìng)爭(zhēng)利益點(diǎn)」。
NeurIPS「強(qiáng)烈鼓勵(lì)」共享數(shù)據(jù)和模型,但沒有強(qiáng)制性規(guī)定。
在這方面,機(jī)器學(xué)習(xí)領(lǐng)域落后于生命科學(xué)領(lǐng)域,例如在 Nature 期刊上發(fā)表論文的條件之一是,作者必須「及時(shí)向讀者提供材料、數(shù)據(jù)、代碼和相關(guān)協(xié)議」。
華為在智能手機(jī)領(lǐng)域的主導(dǎo)性增強(qiáng),并在機(jī)器學(xué)習(xí)技術(shù)上大量投資
這也是 9 年來第一次由蘋果和三星之外的公司占據(jù)了市場(chǎng)領(lǐng)先地位,但到了 2020 年 9 月中旬,由于美國(guó)的制裁,華為面臨著芯片供應(yīng)的困境。
使用美國(guó)芯片制造設(shè)備的外國(guó)公司必需獲得美國(guó)政府的許可,才能向華為提供某些芯片。華為消費(fèi)者業(yè)務(wù) CEO 余承東在中國(guó)信息化百人會(huì) 2020 年峰會(huì)上表示:「我們手機(jī)業(yè)務(wù)現(xiàn)在很困難,芯片供應(yīng)困難,很缺貨?!?/p>
華為的麒麟 AI 芯片由臺(tái)積電代工,受到美國(guó)制裁政策影響,臺(tái)積電接受的最后一筆訂單是在 2020 年 5 月 15 日。目前,華為正嘗試向中芯國(guó)際(SMIC)尋求芯片制造方面的支持。
但臺(tái)積電在研發(fā)支出和半導(dǎo)體制造方面仍占據(jù)業(yè)內(nèi)主導(dǎo)地位。臺(tái)積電的研發(fā)費(fèi)用與中芯國(guó)際的收入相當(dāng),前者是目前唯一商用 5nm 制造工藝 (N5) 的制造商,目前正致力于 3 納米制造工藝 ,其功率效率比 7 納米高出 2 倍,性能比 7 納米高出 33% 。不久之前,中芯國(guó)際也表示,2020 年會(huì)將資本支出增至 67 億美元(高于原定目標(biāo) 31 億美元)。
未來展望:8 個(gè)趨勢(shì)
在最后一部分,劍橋 2020 年度 AI 全景報(bào)告給出了關(guān)于未來 12 個(gè)月的 8 項(xiàng)趨勢(shì)預(yù)測(cè)。
原文標(biāo)題:劍橋大學(xué):PyTorch 已 碾 壓 TensorFlow
文章出處:【微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
責(zé)任編輯:haq
-
微軟
+關(guān)注
關(guān)注
4文章
6590瀏覽量
104024 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268882 -
人工智能
+關(guān)注
關(guān)注
1791文章
47183瀏覽量
238241 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8406瀏覽量
132558
原文標(biāo)題:劍橋大學(xué):PyTorch 已 碾 壓 TensorFlow
文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論