2023年初AI大模型火爆全球,當(dāng)時(shí)就有人說(shuō),這項(xiàng)技術(shù)走向大眾的最佳方式就是手機(jī)。
不管消費(fèi)者怎么想這句話,苦于銷(xiāo)量連年下降的手機(jī)廠商們肯定是把它聽(tīng)進(jìn)去了。
于是,從2023年下半年開(kāi)始,所有手機(jī)新品都在標(biāo)榜AI能力,都宣稱自己是AI手機(jī)。這場(chǎng)盛宴持續(xù)上演到今天,即使是相對(duì)保守的蘋(píng)果也發(fā)布了“Apple Intelligence”,而那些原本被認(rèn)為已經(jīng)被擠壓到缺少生存空間的二線手機(jī)品牌,也頑強(qiáng)地依靠“All in AI”留在了牌桌上。
一時(shí)間,AI在手機(jī)市場(chǎng)是鑼鼓喧天,紅旗招展,人山人海……不對(duì),人山人海可能還不一定。
對(duì)于用戶來(lái)說(shuō),面對(duì)鋪天蓋地的AI手機(jī),華美無(wú)比的發(fā)布會(huì)PPT,可能有點(diǎn)小迷惑:AI到底能給我?guī)?lái)什么?這么多AI手機(jī)之間有什么不同?我設(shè)想的AI是科幻電影里那種,手機(jī)能給我嗎?
事實(shí)上,從2017年深度學(xué)習(xí)火熱起來(lái)之后,手機(jī)與AI的結(jié)合一直都在持續(xù)。幾年來(lái),我們經(jīng)歷了端側(cè)AI算力、AI攝影、端側(cè)大模型,到系統(tǒng)級(jí)AI能力的變遷。假如手機(jī)是一片果園,AI這棵果樹(shù)在里面已經(jīng)長(zhǎng)了很多年。
那么,到2024年,AI手機(jī)無(wú)限風(fēng)光之時(shí),這顆果子它保熟了嗎?
讓我們穿越紛繁復(fù)雜的概念,看看AI手機(jī)究竟帶來(lái)了什么。
提起AI手機(jī),我們總會(huì)有一種很空洞的感覺(jué),甚至不知道廠商和專家到底在激動(dòng)個(gè)什么。
這種虛妄感來(lái)源于業(yè)界并不存在對(duì)AI手機(jī)的標(biāo)準(zhǔn)化認(rèn)定。于是每個(gè)廠商,甚至每個(gè)人都可以對(duì)其進(jìn)行獨(dú)立闡釋。這些闡釋有共識(shí),有差異,還有大量似是而非與文字游戲。這些聲音交織在一起,就變成了一種概念游戲。
因此,想要了解AI手機(jī),首先要避免被概念游戲干擾。就像要摘果子,首先要把枝葉撥開(kāi)。如何實(shí)現(xiàn)這種免打擾呢?一個(gè)簡(jiǎn)單的方法,叫作“AI手機(jī),我有三不看”。
首先,廠商的“AI大帽子”不用看。
不久之前,AI手機(jī)領(lǐng)域姍姍來(lái)遲地發(fā)布了此前承諾的Apple Intelligence。但這個(gè)“蘋(píng)果智能”卻沒(méi)有激起多大的市場(chǎng)水花。原因在于,蘋(píng)果智能更像是眾多AI功能的升級(jí)打包,而非某種新能力、新思路。
這種給眾多AI小功能起個(gè)大名字的玩法,在今天的手機(jī)界比較普遍。用戶以為得到了新東西,其實(shí)不過(guò)是新瓶裝舊酒,散裝改零售。類(lèi)似的說(shuō)法,經(jīng)常還包括某某智能、某某GPT、某某原生,大差不差都是一個(gè)意思。甚至很多時(shí)候這根本不是一個(gè)研發(fā)系統(tǒng)主導(dǎo)的項(xiàng)目,而是市場(chǎng)部歸攏收集一下各個(gè)部門(mén)都有哪些AI能力,最后編個(gè)名字給寫(xiě)進(jìn)PPT里而已。
其次,是缺乏標(biāo)準(zhǔn)的技術(shù)名詞不用看。
任何技術(shù)在受到重視之后,都會(huì)經(jīng)歷一個(gè)造詞階段。這些新造的詞有些會(huì)最終留下來(lái),變成約定俗成、相對(duì)標(biāo)準(zhǔn)化的說(shuō)法。但絕大部分都會(huì)悄然流逝在歷史記憶里。在AI手機(jī)領(lǐng)域,我們經(jīng)常會(huì)看見(jiàn)大量類(lèi)似的新詞。它們或多或少都有所指,但作為普通消費(fèi)者大可不必去探尋每個(gè)詞的來(lái)龍去脈,也不用被它們迷惑了判斷。
諸如智能框架、意圖識(shí)別、主動(dòng)服務(wù)、全局智能等高大上的AI手機(jī)詞匯,在今天都沒(méi)有統(tǒng)一標(biāo)準(zhǔn),愛(ài)好者可以研究研究,大多數(shù)消費(fèi)者不妨敬而遠(yuǎn)之。
再次,大模型參數(shù)以及其他AI參數(shù)不用看。
從2018年預(yù)訓(xùn)練大模型開(kāi)始出現(xiàn),就產(chǎn)生了一種頭部廠商說(shuō)效果,其他廠商拼參數(shù)的現(xiàn)象。在核心能力上很難構(gòu)建差異化的廠商,往往會(huì)宣傳自己模型參數(shù)更大,跑分效果更好。這一點(diǎn)來(lái)到AI手機(jī)階段,就變成了宣傳端側(cè)大模型的參數(shù)大、數(shù)量多。但AI模型不是CPU等硬件,參數(shù)高并不意味著性能好。模型效果還取決于壓縮方案、調(diào)優(yōu)效果等一系列條件,所以不必將廠商宣傳的模型參數(shù)等同于產(chǎn)品價(jià)值。
蒸餾掉這些之后還能留下的東西,才是AI在手機(jī)里結(jié)出的果。
很多人都在說(shuō),AI沒(méi)有應(yīng)用可怎么辦。但問(wèn)題是,ChatGPT本身就是一種應(yīng)用。在應(yīng)用端再誕生更強(qiáng)的超級(jí)應(yīng)用固然前景美好,但大模型本身的應(yīng)用價(jià)值本身就有跟手機(jī)結(jié)合的空間。
AI手機(jī)的第一步,就是要把類(lèi)ChatGPT的大模型能力帶到手機(jī)的第一方功能里。比如iOS18.1,重點(diǎn)引入的AI功能,就包括AI寫(xiě)作、郵件推薦與回復(fù)、消息摘要等。換個(gè)角度想想,我們會(huì)發(fā)現(xiàn)這些都是ChatGPT就能做到的事。
這種思路并沒(méi)有什么不好,而且也必須由手機(jī)廠商第一方來(lái)主導(dǎo)。因?yàn)槿缃?a href="http://hljzzgx.com/v/tag/11230/" target="_blank">智能手機(jī)提供的第一方功能非常多,而其中又有大量可以加入語(yǔ)義理解、內(nèi)容生成等大模型能力的地方。因此,大語(yǔ)言模型與手機(jī)第一方功能的點(diǎn)對(duì)點(diǎn)結(jié)合,是AI在手機(jī)里結(jié)出最多的果。
對(duì)于類(lèi)似功能的選擇,建議是根據(jù)自身需求來(lái)挑選實(shí)用的功能,或者功能群組。比如去年11月,OPPO就發(fā)布了一鍵生成AI通話摘要。這個(gè)功能可以在通話結(jié)束后,智能識(shí)別通話內(nèi)容并生成重點(diǎn)信息摘要。再比如Find X8 Pro可以長(zhǎng)按電源鍵呼出問(wèn)屏功能,AI根據(jù)屏幕顯示來(lái)回答文章內(nèi)容、圖片信息等。小米在澎湃OS 2當(dāng)中,也推出了一系列諸如AI寫(xiě)作、AI識(shí)音、AI妙畫(huà)的智能功能。
但對(duì)于手機(jī)廠商來(lái)說(shuō),大模型功能的加入顯然只是敲門(mén)磚。這種單點(diǎn)升級(jí)并不能滿足廠商對(duì)AI的野心。
于是,智能體來(lái)了。
AI Agent又被稱為智能體,被廣泛認(rèn)可是真正體現(xiàn)了AI思維的新應(yīng)用形態(tài)。智能體可以跨越不同的軟件工作流程,來(lái)實(shí)現(xiàn)目標(biāo)主導(dǎo)的自主判斷。這種運(yùn)行邏輯放在手機(jī)里有兩方面的好處。
對(duì)于用戶來(lái)說(shuō),智能體可以被視作獨(dú)立于點(diǎn)滑交互的新交互形式。用戶可以命令智能體來(lái)完成指令,并且其理解能力、生成能力與應(yīng)用范疇都遠(yuǎn)大于此前的語(yǔ)音助手,更加貼近用戶對(duì)個(gè)人助理的基本想象。
對(duì)于手機(jī)廠商來(lái)說(shuō),智能體不僅是一個(gè)全新賣(mài)點(diǎn),還可以繞過(guò)APP的藩籬,讓第一方的應(yīng)用權(quán)限更大,體驗(yàn)更加重要。把智能體做起來(lái),有概率讓用戶習(xí)慣、第三方應(yīng)用服務(wù)都與廠商綁定更加緊密。
在這樣的驅(qū)動(dòng)力下,幾個(gè)月以來(lái)手機(jī)廠商紛紛在智能體陣地上秣馬厲兵,誓有一種在2025年展開(kāi)智能體決戰(zhàn)的架勢(shì)。而從AI手機(jī)的發(fā)展線上看,手機(jī)+AI Agent是一個(gè)脫離了ChatGPT基本應(yīng)用框架,同時(shí)蘋(píng)果為代表的歐美終端廠商沒(méi)有跟進(jìn)的領(lǐng)域。中國(guó)AI手機(jī)的未來(lái)成就,或許就系在智能體的機(jī)遇上。
在智能體方面,目前最為用力地就是榮耀。不久之前的榮耀Magic7發(fā)布會(huì)上,榮耀CEO趙明用YOYO智能體自動(dòng)下單了2000杯咖啡,一下讓智能體手機(jī)的概念大為出圈。目前,榮耀主推的智能體體驗(yàn)包括“一句話關(guān)閉自動(dòng)續(xù)費(fèi)”“一句話點(diǎn)咖啡”“一句話發(fā)送文件”“一句話關(guān)閉應(yīng)用權(quán)限”等。在手機(jī)行業(yè)里相對(duì)完整且具體地展現(xiàn)了智能體價(jià)值。
在2024 vivo開(kāi)發(fā)者大會(huì)上,vivo也亮出了自己的智能體方案Phone GPT,其不僅具有對(duì)屏幕界面的識(shí)別和操作功能,還可以接管音頻,通過(guò)電話實(shí)現(xiàn)預(yù)訂餐廳等功能。把智能體延伸到音頻領(lǐng)域,也成為接下來(lái)一個(gè)值得關(guān)注的方向。
在OPPO這邊,則有可以連續(xù)多輪自然對(duì)話,并可以跨應(yīng)用操作的OPPO AI。除了提供識(shí)物、導(dǎo)航、問(wèn)答等AI能力外,OPPO AI還可以與影像能力、AIGC能力結(jié)合,幫助用戶完成圖片識(shí)別、圖片處理、排版潤(rùn)色等功能。
在華為這里,HarmonyOS NEXT版本具有搭載了盤(pán)古大模型的鴻蒙智能助手小藝。其感知和推理能力較此前版本有極大提升,可以實(shí)現(xiàn)23類(lèi)主要場(chǎng)景的交互。
這些嘗試,都可以看作是向手機(jī)+AI Agent方向的前進(jìn),只是各個(gè)廠商的具體技術(shù)實(shí)現(xiàn)方式、能力側(cè)重以及宣傳話術(shù)不同。
對(duì)于消費(fèi)者來(lái)說(shuō),如果你是深度手機(jī)用戶,今天可能已經(jīng)到了嘗鮮智能體的時(shí)機(jī),但如果并沒(méi)有被傳統(tǒng)交互方式困擾等問(wèn)題,或許還可以讓智能體手機(jī)再成熟一些。
至少AI Agent這顆果子,目前看來(lái)有著碩大無(wú)朋的潛力。
AI大模型與手機(jī)的結(jié)合方案有很多,但個(gè)人認(rèn)為,二者的最佳結(jié)合點(diǎn)其實(shí)是很明確的,那就是無(wú)障礙能力。
AI大模型的核心功能之一,就是在圖像、音頻、文字幾種不同的媒介間進(jìn)行轉(zhuǎn)換,而這恰好也是視障、聽(tīng)障人群最為需要的。因此,當(dāng)有人認(rèn)為AI大模型與手機(jī)結(jié)合并不必要時(shí),我會(huì)說(shuō)看看無(wú)障礙能力的長(zhǎng)足進(jìn)展就能知道,AI手機(jī)必有未來(lái)。
通過(guò)與很多聽(tīng)障、視障朋友的交流,以及對(duì)相關(guān)機(jī)構(gòu)的采訪,發(fā)現(xiàn)大家都希望實(shí)名表?yè)P(yáng)華為和vivo。早些年普遍認(rèn)為蘋(píng)果的無(wú)障礙能力很好,但現(xiàn)在已經(jīng)是華為和vivo在引領(lǐng)端側(cè)無(wú)障礙能力的發(fā)展,尤其是AI時(shí)代的無(wú)障礙升級(jí)。
比如說(shuō),vivo通過(guò)AI技術(shù)為聽(tīng)障、視障人群和老年人提供了一系列幫助。去年,vivo的“手語(yǔ)翻譯官”軟件獲得了CCL2024手語(yǔ)數(shù)字人翻譯質(zhì)量評(píng)測(cè)第一名。今年,vivo還升級(jí)了“手語(yǔ)學(xué)習(xí)”功能,推動(dòng)手語(yǔ)的教育普及。
鴻蒙系統(tǒng)的發(fā)展,每一步都伴隨著對(duì)端側(cè)無(wú)障礙事業(yè)的大力投入。比如HarmonyOS 4就推出了助聽(tīng)器直連功能。在華為開(kāi)發(fā)者大會(huì)2023期間,推出了能幫助視障人群識(shí)別具體場(chǎng)景與物品的小藝看世界。而在今年,HarmonyOS NEXT則在業(yè)界率先推出了小藝聲音修復(fù)功能,它利用AI技術(shù)對(duì)語(yǔ)言障礙者的聲音進(jìn)行實(shí)時(shí)分析、修復(fù)和優(yōu)化,不僅能夠發(fā)出可懂音,還能盡可能保留用戶音色。這個(gè)功能專為四級(jí)和三級(jí)言語(yǔ)障礙人群設(shè)計(jì),可以實(shí)現(xiàn)無(wú)需文本輸入的聲音修復(fù),極大拓展了端側(cè)無(wú)障礙能力的邊界。
對(duì)于很多用戶來(lái)說(shuō),手機(jī)里的AI能力或許是錦上添花,但對(duì)于有障礙群體來(lái)說(shuō),AI手機(jī)或許就是改變生活乃至生命的鑰匙。
僅為此,AI也必須在手機(jī)中存在,壯大,盛放。
回顧一下手機(jī)廠商推進(jìn)的AI能力,會(huì)發(fā)現(xiàn)其實(shí)每一步都還有很青澀的地方。如果我們?cè)敢獬姓J(rèn)二者結(jié)合的復(fù)雜性,那么AI手機(jī)的果子可能還真不太保熟。
如果手機(jī)只提供AI能力,那么廠商會(huì)面臨與應(yīng)用開(kāi)發(fā)者的直接競(jìng)爭(zhēng)。而應(yīng)用開(kāi)發(fā)者包括互聯(lián)網(wǎng)巨頭與專業(yè)的AI廠商,手機(jī)廠商的技術(shù)能力與用戶號(hào)召力可能并不具有說(shuō)服力。
于是,手機(jī)廠商希望押注智能體這樣的突破性體驗(yàn),但目前階段這類(lèi)體驗(yàn)還有待打磨和升級(jí)。很多時(shí)候,用戶給智能體下達(dá)的指令需要反復(fù)確認(rèn),效率還不如直接點(diǎn)滑,而AI接管音頻等能力則不確定性更大。面對(duì)經(jīng)常出錯(cuò)的,且應(yīng)用范圍不廣的智能體,用戶的耐心與信任或許會(huì)快速枯竭。
更為重要的是,這類(lèi)前沿能力還不足以影響消費(fèi)者的核心決策。AI手機(jī)大概率會(huì)導(dǎo)致手機(jī)市場(chǎng)短期向好,但還沒(méi)到能夠逆轉(zhuǎn)持續(xù)走低趨勢(shì)的程度。
再向上一層則比較務(wù)虛。意圖識(shí)別、主動(dòng)服務(wù)、服務(wù)找人等口號(hào),眾多手機(jī)廠商都喊了很多年。但真實(shí)情況是,最先進(jìn)的大模型也無(wú)法預(yù)測(cè)人的想法。消費(fèi)者對(duì)AI手機(jī)的期待是科幻電影里全能的個(gè)人助理。廠商為了促銷(xiāo),也會(huì)在話術(shù)中將AI手機(jī)進(jìn)行包裝和夸大,但最終在可見(jiàn)的范圍內(nèi),手機(jī)行業(yè)只能一次次與消費(fèi)者的預(yù)期違背。
頂著這些壓力,AI手機(jī)還在趕路的途中。從技術(shù)體驗(yàn)的角度,它確實(shí)還不足以帶來(lái)顛覆,但從產(chǎn)業(yè)發(fā)展的角度,AI大模型與手機(jī)結(jié)合是一個(gè)絕佳的戰(zhàn)略機(jī)遇。海外大模型進(jìn)不來(lái),谷歌另辟蹊徑,蘋(píng)果龜速發(fā)展。AI之于中國(guó)手機(jī),多少有了點(diǎn)天命在身的意味。
這是一個(gè)前所未有的局面,即使果子還沒(méi)熟透。對(duì)于大多數(shù)消費(fèi)者,也不妨像《鄉(xiāng)村愛(ài)情》里謝永強(qiáng)經(jīng)常說(shuō)的那樣——“我得去果園看看”。
審核編輯 黃宇
-
手機(jī)
+關(guān)注
關(guān)注
35文章
6874瀏覽量
157541 -
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268874
發(fā)布評(píng)論請(qǐng)先 登錄
相關(guān)推薦
評(píng)論