人形機(jī)器人在2023年吸足了業(yè)界的眼球,資本對(duì)它們的青睞也顯而易見(jiàn)。但由于迄今為止,還沒(méi)有一個(gè)真正落地,甚至能正常運(yùn)行展示的產(chǎn)品出現(xiàn),大批廠商并沒(méi)有輕易入局,而是在觀望先鋒企業(yè)是否能做出落地產(chǎn)品,再隨后跟上。因此人形機(jī)器人與其說(shuō)掀起了一波浪潮,不如說(shuō)是雷聲大,雨點(diǎn)小。
在年末回望,真正稱得上今年業(yè)界的最大風(fēng)口的,無(wú)疑是人工智能。
從資本的風(fēng)向來(lái)看,人工智能可以說(shuō)是2023年幾乎唯一的亮點(diǎn)。由于全球經(jīng)濟(jì)形勢(shì)并不景氣,疊加地緣政治的因素影響,資本進(jìn)入了寒冬期。
知名投融資分析機(jī)構(gòu)PitchBook的數(shù)據(jù)顯示,2023年上半年全球風(fēng)投資金總額只有1739億美元,同比下降48%,融資次數(shù)也下降19%。到了第三季度,情況并沒(méi)有改善,全球融資額同比下降了31%。
而人工智能卻逆勢(shì)上升,第三季度全球人工智能企業(yè)融資額同比增長(zhǎng)27%,達(dá)到了179億美元,甚至超過(guò)了其他硬科技賽道的融資總額。
這也難怪某資本行業(yè)從業(yè)者說(shuō):“今年科技賽道只有兩條,AI和其他。”
從產(chǎn)業(yè)端來(lái)看,盡管以Chatgpt為代表的AI大模型風(fēng)頭無(wú)兩,但落地場(chǎng)景成謎,由于目前大模型在文字、圖像生成領(lǐng)域表現(xiàn)出色,許多人認(rèn)為這一波AI更可能首先在服務(wù)或設(shè)計(jì)行業(yè)落地。
但實(shí)際上,高工移動(dòng)機(jī)器人發(fā)現(xiàn),許多移動(dòng)機(jī)器人企業(yè)認(rèn)為人工智能是助推工業(yè)移動(dòng)機(jī)器人爆發(fā)的關(guān)鍵技術(shù),目前正在將人工智能的最新進(jìn)展接入到他們的產(chǎn)品體系中,而且其中數(shù)家企業(yè)強(qiáng)調(diào)“這絕對(duì)不是噱頭”。
有業(yè)內(nèi)人士就表示:“你說(shuō)今年行業(yè)沒(méi)有亮點(diǎn),我是不同意的。年初開始,AI對(duì)我們啟發(fā)非常大,我覺(jué)得這個(gè)是行業(yè)進(jìn)化的機(jī)會(huì),是能夠真正促使移動(dòng)機(jī)器人爆發(fā)的變革?!?/p>
或許這波人工智能革命,首先落地的行業(yè),將會(huì)是工業(yè)移動(dòng)機(jī)器人。
0****1
大模型如何賦能工業(yè)機(jī)器人?
在年初被大模型革命性的能力震撼過(guò)后,業(yè)界人士目前已經(jīng)回歸理性,AI大模型的具體落地場(chǎng)景,能夠帶來(lái)多少收益,成為行業(yè)關(guān)心的核心。
據(jù)高工移動(dòng)機(jī)器人走訪,人工智能目前主要在三個(gè)領(lǐng)域加持工業(yè)機(jī)器人:
1、人機(jī)交互。一直以來(lái),機(jī)器人的控制、調(diào)度與排障都需要熟悉相關(guān)知識(shí)的專業(yè)人員,這意味著高企的人力成本。由于大模型在自然語(yǔ)言處理與生成、語(yǔ)音識(shí)別等面向領(lǐng)域的算法驚人進(jìn)展,在人工智能的加持下,現(xiàn)場(chǎng)工作人員能直接用自然語(yǔ)言,讓大模型生成代碼操控機(jī)器人,因此與機(jī)器人的交互能夠?qū)崿F(xiàn)低代碼,甚至無(wú)代碼的人機(jī)協(xié)作。
同時(shí),與傳統(tǒng)的人機(jī)交互方式不同,操作者能夠輸入多模態(tài)指令(比如圖片、文字與語(yǔ)言),并且通過(guò)多輪命令修正機(jī)器人的行動(dòng)。
實(shí)際上,這也是科技巨頭試圖落地大模型的主要途徑之一。谷歌在3月時(shí),推出的PaLM-E著重用自然語(yǔ)言指揮機(jī)器人抓取米餅;阿里在4月時(shí)就透露,正在實(shí)驗(yàn)將千問(wèn)大模型接入工業(yè)機(jī)器人,用自然語(yǔ)言遠(yuǎn)程指揮機(jī)器人工作,并且放出了工程師實(shí)際操作的視頻。
**2、視覺(jué)檢測(cè)。**業(yè)內(nèi)人士表示,盡管圖像識(shí)別是人工智能最主要的應(yīng)用領(lǐng)域之一,但直到今年,AI+在機(jī)器視覺(jué)領(lǐng)域的應(yīng)用有了革命性的進(jìn)展。據(jù)其介紹,過(guò)去應(yīng)用人工智能,他們需要大量的圖片標(biāo)注,各種各樣的瑕疵樣本,但還是會(huì)有從未見(jiàn)過(guò)的新瑕疵出現(xiàn),無(wú)論是訓(xùn)練的算力、部署的時(shí)間或是需要的人力成本都非常高。
現(xiàn)在由于大模型的出現(xiàn),他們只需要提供良品樣本,就能在消耗極小的算力下,在更短的時(shí)間完成在產(chǎn)線上的部署。與此同理,相比目前普遍運(yùn)用的技術(shù),移動(dòng)機(jī)器人在例如強(qiáng)光等室內(nèi)外復(fù)雜場(chǎng)景下,識(shí)別周邊環(huán)境以及避障能力也得到了提升。
3、具身智能。由于大模型的發(fā)展,機(jī)器人理解與處理多模態(tài)信息的能力也得到了空前提高。機(jī)器人作為一個(gè)多傳感的集成設(shè)備,能夠同時(shí)通過(guò)視覺(jué)、觸覺(jué)等方式獲取信息,因此在視覺(jué)識(shí)別出某個(gè)原料后,就能根據(jù)材質(zhì)調(diào)整夾取的力度或者加工的動(dòng)作。
值得一提的是,如果冷靜地觀察人工智能以及機(jī)器人行業(yè)的發(fā)展,其實(shí)會(huì)發(fā)現(xiàn),工業(yè)機(jī)器人與人工智能的融合,已經(jīng)有相當(dāng)長(zhǎng)的歷程,許多企業(yè)也摸索出了多條落地的路徑。
某家老牌機(jī)器人企業(yè)的負(fù)責(zé)人告訴高工移動(dòng)機(jī)器人,他們?cè)缭?017年前后,就開始探索人工智能在移動(dòng)機(jī)器人上的應(yīng)用,那個(gè)時(shí)候做的還是比較簡(jiǎn)單的語(yǔ)言識(shí)別的人機(jī)交互,可以用自然語(yǔ)言命令某個(gè)機(jī)器人移動(dòng)到某個(gè)地點(diǎn),進(jìn)行某個(gè)動(dòng)作。
今年以來(lái)Chatgpt領(lǐng)銜的大模型狂潮,與其說(shuō)是徹底改變了工業(yè)界應(yīng)用人工智能的路徑,不如說(shuō)是讓企業(yè)探索這些路徑的速度更快,想象空間更大。
當(dāng)然,這并不意味著大模型是個(gè)噱頭,它確實(shí)革命性地提高了人工智能的部署、迭代與進(jìn)化速度。
某機(jī)器人企業(yè)產(chǎn)品線負(fù)責(zé)人就表示:“舉個(gè)例子,大模型讓機(jī)器人具備意圖分析的能力,這相比之前就有巨大的差距。以前,你要很精確地告訴它,它要具體做ABCD的動(dòng)作。但現(xiàn)在的話,它能夠識(shí)別意圖,你告訴它AB它就會(huì)主要詢問(wèn)你是否要做CD動(dòng)作。當(dāng)能夠識(shí)別操作者的意圖后,就意味著我們能夠用更少的關(guān)鍵詞錄入,更短的訓(xùn)練時(shí)間,機(jī)器人自己就能進(jìn)行關(guān)聯(lián)和分析,讓人工智能自主來(lái)處理?!?/p>
過(guò)去多年的研發(fā)與實(shí)踐經(jīng)驗(yàn)積累,以及保障人工智能運(yùn)作的數(shù)字基礎(chǔ)設(shè)施的持續(xù)建設(shè)(例如邊緣計(jì)算技術(shù)、數(shù)據(jù)庫(kù)、大數(shù)據(jù)平臺(tái)等)讓工業(yè)界能夠在大模型的崛起后,迅速擁抱新興技術(shù),或許可能成為人工智能大模型率先落地并獲得收益的行業(yè)。
0****2
AI+工業(yè)時(shí)代為何還未到來(lái)?
盡管未來(lái)前景很美好,但大模型在工業(yè)界的落地之旅其實(shí)還是崎嶇難行。
這主要出于三方面的原因:
1、目前大模型的研制還處于初步階段,大部分企業(yè)無(wú)力進(jìn)行探索。高工移動(dòng)機(jī)器人發(fā)現(xiàn),許多企業(yè)都認(rèn)為大模型肯定在工業(yè)領(lǐng)域大有可為,也已經(jīng)投入了人力物力進(jìn)行研究,但他們都表示需要的成本太高,因此只能是巨頭們的游戲,以目前中國(guó)機(jī)器人企業(yè)的實(shí)力,從底層開始構(gòu)筑基礎(chǔ)模型近乎不可能?!拔覀兪遣幌敫銌??不是啊,我們太弱太小了,沒(méi)辦法啊!”
2、**訓(xùn)練數(shù)據(jù)缺乏。**眾所周知,人工智能大模型需要大量數(shù)據(jù)訓(xùn)練,但在工業(yè)領(lǐng)域,許多企業(yè)的數(shù)字化改造還是非常初步的階段,無(wú)法提供足夠訓(xùn)練人工智能的數(shù)據(jù)。況且,工業(yè)界的數(shù)據(jù)是各個(gè)廠商非常核心的資源,不可能共享出來(lái),更不可能開放供外部的大模型訓(xùn)練使用,因此人工智能無(wú)法發(fā)揮它的全部實(shí)力。
另一方面,**制造業(yè)中的細(xì)分場(chǎng)景紛繁復(fù)雜也讓企業(yè)難以提供足夠的訓(xùn)練數(shù)據(jù)。**即使是同一個(gè)細(xì)分賽道中,同一生產(chǎn)鏈條上也會(huì)有相差甚遠(yuǎn)的場(chǎng)景,它們產(chǎn)生的數(shù)據(jù)與對(duì)人工智能的需求也各不相同。
有企業(yè)負(fù)責(zé)人就曾說(shuō)過(guò):**“制造業(yè)遠(yuǎn)看是個(gè)萬(wàn)億級(jí)的市場(chǎng),近看就是一萬(wàn)個(gè)億級(jí)的賽道?!?*這也意味著,要么針對(duì)不同的場(chǎng)景收集不同的數(shù)據(jù),要么就在不同場(chǎng)景使用同一個(gè)通用的大模型。但前者的成本太高,也不一定有足夠的數(shù)據(jù);后者則很難適配相差甚遠(yuǎn)的不同場(chǎng)景。
3、**成本依然居高不下。**工業(yè)領(lǐng)域?qū)γ宽?xiàng)技術(shù)的首要衡量標(biāo)準(zhǔn)就是投入產(chǎn)出比,對(duì)成本的核算非常仔細(xì)。
拋去雇傭訓(xùn)練大模型所需要的工程師團(tuán)隊(duì)的人力成本,而大模型目前的訓(xùn)練成本依然很高,人工智能需要進(jìn)行計(jì)算,那么就需要相應(yīng)的硬件成本,每日維持還需要高額的算力成本,盡管沒(méi)有一個(gè)精確的數(shù)字,但這是大部分企業(yè)無(wú)法承擔(dān)的費(fèi)用。以O(shè)penai為例,僅在Chatgpt上,他們每日就要燒70萬(wàn)美元維護(hù),因此需要包括微軟在內(nèi)的巨頭提供源源不斷的融資輸血,這是絕大部分企業(yè)無(wú)法做到的。
此外,目前業(yè)界對(duì)它的使用還處于初步階段,大模型還沒(méi)有表現(xiàn)出它在降本增效方面的能力。在大模型高昂的成本之下,產(chǎn)出卻依然成謎。**直白而言,人機(jī)交互、具身智能這些功能,到底能為企業(yè)節(jié)約多少錢?提高多少效率?**目前來(lái)看,企業(yè)其實(shí)很難算清楚,因此,目前工業(yè)界對(duì)大模型的普遍態(tài)度,還是認(rèn)為需要時(shí)間探索。
每一個(gè)使用過(guò)Chatgpt的人,都不會(huì)懷疑人工智能將引發(fā)下一波科技浪潮;每一個(gè)了解機(jī)器人的人,也必然相信工業(yè)界的終極形態(tài)應(yīng)該是全自動(dòng)的智能工廠。AI與機(jī)器人的共同點(diǎn)就在此,大家都相信它們是科技發(fā)展的彼岸,但如何跨過(guò)中間的鴻溝,還要多久才能跨越?這些都猶未可知。
但或許,我們離未來(lái)只有一步之遙。
審核編輯:劉清
評(píng)論
查看更多