在谷歌位于硅谷的園區(qū)里,一座被命名為 1965 的低矮的辦公樓坐落在離 101 高速路出口最近的區(qū)域。單從地圖上看,想驅車前往這座不起眼的建筑并不方便。過去幾十年里,每天穿梭在這條高速上的山景城居民早已經(jīng)對硅谷發(fā)生的那些「改變世界」的公司和產(chǎn)品故事習以為常,這座矮樓當然也常常被習慣性的忽略。
但這里是谷歌大腦的所在地?,F(xiàn)在,當人們對未來充滿恐懼、談論起人工智能是否會取代人類、機器和人的關系該是如何時,至少該先看看發(fā)生在這里的近況——作為當下一輪機器學習和神經(jīng)網(wǎng)絡熱潮的第一批擁躉,谷歌大腦已經(jīng)取得了一些標志性的成就。
谷歌正在圍繞著 AI 重建公司,機器學習現(xiàn)在則成為了這家巨頭包括廣告、無人駕駛等重要項目的主要技術驅動力。而無論從谷歌一貫打造開放平臺的「傳統(tǒng)」來說,還是從商業(yè)化上的考量,將機器學習的成果開放給更多開發(fā)者,幾乎和用這些成果改造自家產(chǎn)品是同樣重要的問題——這一步?jīng)Q定了谷歌能不能在這個近乎處于蠻荒狀態(tài)的 AI 時代盡早建立生態(tài)。從一定程度上來說,2015 年谷歌發(fā)布的機器學習開發(fā)平臺 TensorFlow 擔負了這樣的使命。
2015 年,在將 TensorFlow 正式開源時,Google CEO Sundar Pichai 曾經(jīng)在公開 blog 里寫到:「我們內(nèi)部已經(jīng)看到這個工具能夠提供非常強的能力,并且希望把機器學習的能力開放給更多的企業(yè)和個人開發(fā)者?!箖赡旰?,TensorFlow 已經(jīng)成為 GitHub 上最受開發(fā)者歡迎的工具。遠超由微軟、Facebook 等公司提供的計算框架。
谷歌大腦的工程師們很愿意把 TensorFlow 的故事與安卓的誕生和意義做類比,并且津津樂道。后者是幫助 Google 完成桌面時代向移動時代轉型的關鍵一躍。
TensorFlow 能輸出谷歌的 AI 服務,并且?guī)椭雀柙偻瓿梢淮巍干鷳B(tài)建立」的使命么?
這對正走向 AI first 的 Google,將是一個關鍵問題。
搶占高地
TensorFlow 的誕生和開源的過程,既符合 Google 一貫堅持開源、消除信息死角的傳統(tǒng)和使命,又代表著這家公司在下一個十年的野心。
2011 年,四位 Google Fellow 之一、MapReduce 和 BigTable 的發(fā)明者 Jeff Dean 和當時的斯坦福計算機科學家吳恩達共同創(chuàng)辦了 Google Brain,專注于用神經(jīng)網(wǎng)絡的方法研究人工智能。一年之后,這個最初建立在 Google X 中的項目脫穎而出,成為更高一個層級的研究機構。
(Google Brain的領軍人物Jeff Dean,他曾經(jīng)發(fā)明 MapReduce 和 BigTable)
在 Google Brain,每一個工程師都能對這個部門的使命脫口而出:讓機器更智能,以提升人類生活質量。利用深度學習技術,計算機將一定程度上模擬人類大腦神經(jīng)元的工作模式,建立學習機制。這也意味著這項技術發(fā)展到一定程度上,人們不再需要依據(jù)規(guī)則的系統(tǒng)進行人工智能在各個領域的開發(fā),機器也不再需要提取語音、文字、圖像等各個領域的特征,它可以自己通過訓練達到目標。
而就是在基于神經(jīng)網(wǎng)絡的深度學習開發(fā)過程中,研發(fā)團隊開發(fā)了一個名為 DistBelief 的深度學習技術框架,這個名稱是「disbelieve“的諧音,代表著這是一個在技術和潛力上都「簡直不可思議」的計算框架。但當時的 DistBelief 要在 16000 臺計算機的計算基礎上才能運行,過程非常復雜。Google Brain 團隊對這個框架進行了簡化,讓它變得非常靈活,能夠輕松運行在個人計算機或者單個或多個 CPU 和 GPU,甚至移動設備上——這成為了如今我們所熟知的 TensorFlow。
在 2015 年,Google 正式開源了 TensorFlow。這是擅長從事長期研究的 Google Brain 成立幾年以來,唯一一個對外發(fā)布的產(chǎn)品。事實上,最初發(fā)布的版本也并不完美。但 Google 的工程師們顯然有著更長遠的考慮。
一方面,Google Brain 團隊在最近幾年已經(jīng)強烈意識到,有時產(chǎn)品落地比發(fā)表更多的論文更加重要。更何況,Google 曾經(jīng)也經(jīng)歷過「為他人做嫁衣」的教訓。2003 年,Google 公布了關于 GFS、MapReduce 和 BigTable 三篇技術論文,它們成為云計算發(fā)展的「三駕馬車」,Google 內(nèi)部曾經(jīng)為此歡欣鼓舞。但幾年后,MapReduce 則由 Apache 基金會率先開發(fā)成分布式系統(tǒng)的基礎構架 Hadoop,并開給外界使用并且獲得廣泛應用,自那以后,在開發(fā)者的認知中,Hadoop 竟然成為了 MapReduce 的「發(fā)明者」。
此事曾讓 Google 的工程師們十分受挫。所以這一次,Google Brain 不再只把相關成果以論文方式發(fā)表在學術起開上,同時決定把相關源代碼以 TensorFlow 的方式「一步到位」的開放給工業(yè)界。
另一方面,盡管 TensorFlow 本身沒有任何商業(yè)盈利的計劃,但它可以成為 Google Cloud 在商業(yè)推廣上的重要推動力。在 2015 年,在開源 TensorFlow 以后,Google 很快公布了 GoogleCloud ML 服務。這意味著,基于 TensorFlow 生態(tài)鏈的、服務多個大規(guī)模計算領域的神經(jīng)網(wǎng)絡(比如 Alpha Go)就會成為 Google cloud 推行「AI 即服務」的殺手锏。
或許就是來源于技術方面的自信,Google 云平臺業(yè)務的負責人黛安·格林在今年曾經(jīng)非常樂觀的預測,因為有來自人工智能方面的加持,Google cloud 的市場份額將在五年后躍居市場第一。
一個人工智能時代的安卓生態(tài)?
就連在 GoogleBrain 工作的工程師都認為,從路徑和目標來看,TensorFlow 的開源有著安卓生態(tài)故事的影子。
在 Google,一直都有著非常濃厚的開源基因。目前它旗下已經(jīng)有超過 60 個開源的項目。開源甚至成為了這家公司商業(yè)模式的重要組成部分,而安卓的成功讓它對這一點更加認同。
進入移動互聯(lián)網(wǎng)時代后,Google 在 iPhone 大賣后立刻加速了安卓的發(fā)布,并且在接下來的時間里不斷更新版本,讓這個系統(tǒng)在低價手機和高端手機上都能實現(xiàn)完好的適配。這一步基本幫助不擅長硬件的 Google 完成了移動優(yōu)先的戰(zhàn)略轉型,防御甚至反擊了蘋果 iOS 在移動時代的強勢進攻。到現(xiàn)在,安卓已然成為 Google 的一個標準平臺。
時至今日,Android 身影幾乎無所不在。但安卓系統(tǒng)的演進也經(jīng)歷了先求有、再求優(yōu)的過程。而也正是因為開源,才讓谷歌吸引了大量第三方合作伙伴和人才的參與,才建立起了在移動時代的生態(tài)系統(tǒng)。
(安卓生態(tài)的成功,讓Google更加相信開源的力量)
Google 一直堅信,能夠獲得用戶的信息和長效依賴,這比用戶一時的消費有價值多了。所以在 Google 喊出 AI first 的口號后,開源一個促進機器學習研究和企業(yè)應用產(chǎn)品對接的平臺,意義不言自明:它有望幫助 Google 構建機器學習領域的產(chǎn)業(yè)標準,也能大大降低深度學習在各個行業(yè)中的應用難度。使用 TensorFlow 進進行機器學習領域的研究和應用的人越多,就越容易讓谷歌在人工智能領域獲的主導權。
但結合軟件和硬件等方式將 AI 能力開放并輸出,這已經(jīng)是屬于科技巨頭的兵家必爭之地。包括微軟、百度和 Facebook 都開放了提供基礎路線圖的深度學習工具,甚至在 9 月 11 日,F(xiàn)acebook 和微軟決定聯(lián)手開發(fā)一個允許人工智能開發(fā)者在 Caffe2、Cognitive Toolkit 和 PyTorch 框架下自由互通的格式,該項目被稱為 ONNX。
這一步棋,被人們視為 Facebook 和微軟兩家巨頭聯(lián)手對抗 TensorFlow 而為之。
但單從人工智能服務的輸出布局上來看,Google 幾乎完全不用擔心:在深度學習的生態(tài)方面,Google 結合從云到 TPU 再到 TensorFlow 的整體服務矩陣的組合邏輯似乎已經(jīng)更加完整:TensorFlow 的基礎框架和 TPU 的計算能力現(xiàn)在都可以通過 Google cloud 向外輸出;在這背后,則是 Google Brain 一刻也不會停歇的基礎研究和正在研發(fā)中的量子計算。
如果人們曾經(jīng)認為軟件會吞噬世界,那么現(xiàn)在,Google 有了更大的胃口。從這個角度上來說,TensorFlow 和它背后這套 Google 的人工智能「組合拳」,似乎在為一個比移動時代更有「張力」的未來做準備。
AI 即服務:這是未來的方向么?
不過,TensorFlow 本質上還是一個比較底層的框架,它更適合大規(guī)模的調(diào)度,但也因此常常被工業(yè)界吐槽不能滿足很多個性化需求,導致不少運行在 TensorFlow 上的具體項目在商業(yè)化落地過程過于緩慢。
在知乎上,出門問問 NLP 工程師李理就撰文分析過:「TensorFlow 有意義,但又不是神乎其神的東西……因為在工程界里,若要完成一整件事,如識別語音,TensorFlow 這種通用深度學習框架的存在更多是錦上添花,而非決定根本?!?/p>
就拿 TensorFlow 和百度推出的深度學習框架 PaddlePaddle 相比來看,后者似乎更加「務實」,它不僅將源代碼開放,而且直接為開發(fā)者提供了很多整體解決方案,為開發(fā)者提供了快速實現(xiàn)商業(yè)化落地的路徑。對于這個開放社區(qū)來說,百度介入的更深,也表現(xiàn)的更加心急。
不過這本質上指向的是一個關鍵問題:在技術越來越走向開源的今天,國內(nèi)科技巨頭們正在推崇的「AI as a service」是否是個真正成立的商業(yè)命題?
(越來越多的科技巨頭,喊出了「AI 即服務」的口號)
例如,目前騰訊云搭建的卷積神經(jīng)網(wǎng)絡模型, 已經(jīng)可以讓開發(fā)者利用 TensorFlow 實現(xiàn)基于 CNN 數(shù)字識別的代碼;而阿里云推出的 GN5i 也可以一鍵部署 TensorFlow、caffe 等主流深度學習框架,并且在這個基礎上對接了更多開發(fā)者的具體需求。
選擇這些服務當然會讓開發(fā)者更加「省心」,即便不能滿足開發(fā)者 100% 的需求,也能讓他們在 90% 的基礎上繼續(xù)開發(fā)。但另一方面,選擇某一家云計算的服務,也就意味著需要在前期與巨頭的設備進行綁定。對中小型創(chuàng)業(yè)公司來說可以減少成本,但對不少「有野心」的創(chuàng)業(yè)公司來說,這算不上是一個簡單的決定。
同時,從另一個角度來說,在未來當 AI 成為一種「普惠」、「民主」的基礎能力后,出售 AI 服務的商業(yè)價值和想象力還有多大?
當我們把這個問題拋給 Google 時,Google 的工程師們坦承的表示,在 Google Brain 內(nèi)部對這個問題也有過爭論。但目前 TensorFlow 依然采取了比較「保守」的戰(zhàn)略:提供更多個性化服務當然可以讓平臺離商業(yè)化更近一步,但當下,依然是不斷完善這個社區(qū)的基礎能力,并且期待開發(fā)者能為它帶來更多突破——更何況,就連 Dean 自己也預言,想要實現(xiàn)通用型人工智能,大概還需要至少 15 到 50 年的時間。
所以目前 TensorFlow 選擇只開源代碼,并在運營社區(qū)時把更多時間花在了和開發(fā)者溝通并且教授專業(yè)知識的工作上,以便更多的 Google 員工和 Google 外部人員可以幫助到這個社區(qū)。
但包括谷歌在內(nèi)的許多工程師還在向著通用人工智能這個遠大的方向進行長時間的研究。而那些利用開放框架運行的項目和大量數(shù)據(jù)也能反哺和加速這個過程。
目前 Google Brain 已經(jīng)把機器翻譯、圖像分析、醫(yī)療、機器人等幾個領域作為深度學習重點研究的方向,并且尋找通用的解決方案。比如在醫(yī)療影像中,深度學習已經(jīng)可以使用視網(wǎng)膜影像進行糖尿病的診斷。不過張坤也坦言,這些領域或許不是最「火」的,但卻在 Google 的能力范圍內(nèi)。Google的工程師向我們表示:「接下來更近要的是看業(yè)界將如何利用 Google 開放的這些能力,也許他們會給整個人工智能在解決實際問題的過程中帶來驚喜。」
TensorFlow 已經(jīng)擁有了超過 500 位代碼貢獻者,從發(fā)布至今,一共有超過 12000 次的代碼提交和超過 100 萬次的代碼庫下載?!肝覀兒苄疫\有機會能與這么多的外部開發(fā)人員進行互動,希望對其中的一些人產(chǎn)生積極的影響,并且?guī)椭麄儎?chuàng)造基于機器學習的新應用程序?!笹oogleBrain 的一位工程師頗有自信的說,「現(xiàn)在我們只需要把事情做好,那么很多數(shù)據(jù)自然會聚集過來?!?/p>
那么,TensorFlow 會成為 AI 時代的新安卓系統(tǒng)么?或許從現(xiàn)在 TensorFlow 業(yè)務設置的架構和影響力上,我們還很難給出這樣的定義。但這個帶有些許「公益」性質的開源工具需要依托更多人和數(shù)據(jù)的參與才能繼續(xù)延伸能力,它為 Google 未來在 AI 布局上帶來的基礎優(yōu)勢還是顯而易見的。
更何況,跳出業(yè)務和商業(yè)計劃,這個機器學習時代更具有普適性的「工具」體現(xiàn)的,仍然是 Google 堅持多年「持續(xù)開放」、「消除信息死角」的價值觀,和它最終期待建立的「AI 民主化」未來。
-
Google
+關注
關注
5文章
1762瀏覽量
57505 -
AI
+關注
關注
87文章
30728瀏覽量
268886 -
安卓
+關注
關注
5文章
2126瀏覽量
57145 -
tensorflow
+關注
關注
13文章
329瀏覽量
60527
發(fā)布評論請先 登錄
相關推薦
評論