如今,很多媒體與AI從業(yè)者都在追問一個(gè)問題:大模型,究竟堵在哪了?
經(jīng)歷了2023年的百模大戰(zhàn),AI產(chǎn)業(yè)迎來了從“是否有大模型”到“如何用大模型”的轉(zhuǎn)換期。各個(gè)大模型平臺紛紛走向了公開應(yīng)用階段,面向C端與B端提供能力繁多的大模型應(yīng)用。
然而問題也隨之而來。在大模型平臺百花齊放的同時(shí),我們也能發(fā)現(xiàn)平臺之間的同質(zhì)化急速加劇。C端用戶很難分清不同大模型應(yīng)用之間的差異化,企業(yè)用戶面臨著復(fù)雜的大模型應(yīng)用成本,進(jìn)而導(dǎo)致真正能夠?qū)崿F(xiàn)規(guī)?;{(diào)用的大模型寥寥無幾。
在技術(shù)相對成熟之后,大模型與用戶之間,似乎還是缺少了一點(diǎn)磁力。
我們經(jīng)常討論,沒有任何底層技術(shù)可以不經(jīng)過產(chǎn)品化探索,不進(jìn)行商業(yè)邏輯設(shè)計(jì)就獲得用戶認(rèn)可。技術(shù)、產(chǎn)品、商業(yè),三者之間一定是互為犄角的態(tài)勢,缺一不可。而在百模大戰(zhàn)的進(jìn)程中,行業(yè)往往會更重視模型本身的技術(shù)發(fā)展,忽視產(chǎn)品化與商業(yè)設(shè)計(jì)的重要性。這種缺失與真空,也就是大模型缺乏用戶磁力的來源。
好在隨著時(shí)間推移,類似難題正在得到正視和解決。不久之前,在火山引擎2024“AI創(chuàng)新巡展”成都站期間,火山引擎宣布豆包大模型日均Tokens使用量已突破5000億,平均每家企業(yè)用戶日均Tokens使用量較5月15日模型發(fā)布時(shí)期增長了22倍。
豆包大模型的高增長,或許正是給大模型的用戶磁力難題,寫下了一張答卷。
被廣泛討論的大模型的商業(yè)難,落地難,究竟來源于何處?
從軟件技術(shù)走向應(yīng)用的時(shí)間邏輯上看?;A(chǔ)軟件技術(shù)迭代之后,往往需要較長的產(chǎn)品化周期,進(jìn)而其中優(yōu)秀的產(chǎn)品最終走向商業(yè)化。但大模型風(fēng)潮與以往不同,其技術(shù)特征中本身就有極強(qiáng)的應(yīng)用色彩。這導(dǎo)致AIGC類平臺與應(yīng)用的爆發(fā),基本沒有經(jīng)歷任何的產(chǎn)品化周期,而是直接從算法革新走向了商用落地。
這種特殊的發(fā)展方式,讓大模型短期內(nèi)走到了“兩多一快”的境地:市場上的大模型應(yīng)用多,單一大模型應(yīng)用提供的AIGC能力多,從技術(shù)走向商用的時(shí)間快。于是,用戶還沒來得及了解,眼前就被擺滿了花樣繁多的大模型應(yīng)用;企業(yè)用戶還沒有準(zhǔn)備好大模型的應(yīng)用場景與商業(yè)邏輯,就被智能化熱潮裹挾其中。
大模型帶來的全新應(yīng)用可能性,原本應(yīng)該與用戶形成極強(qiáng)的磁力,但大模型的同質(zhì)化,與用戶的沒有準(zhǔn)備好之間,反而形成了一種“消磁”效應(yīng)。具體來看,我們可以將其拆解為三個(gè)問題:
1.C端消磁。產(chǎn)品體驗(yàn)感的缺失,以及技術(shù)的雷同化,讓用戶難以體會到大模型的魅力所在,進(jìn)而在嘗鮮期過后,快速出現(xiàn)了對大模型應(yīng)用的擱置。
2.B端消磁。過高的嘗試成本,讓企業(yè)在還沒有準(zhǔn)備好實(shí)用大模型的時(shí)候,就需要付出較大的模型部署成本,從而導(dǎo)致大量企業(yè)傾向?qū)Υ竽P瓦M(jìn)行觀望。
3.行業(yè)消磁。快速成型的大模型體系,更多提供的是通用性較強(qiáng)的能力。然而眾多行業(yè)需要的是專業(yè)化、定制化的AI功能,不能充分了解行業(yè)需求,導(dǎo)致大模型能力浮于行業(yè)表面,無法深入其中。
2023年8月,字節(jié)旗下的首款類GPT應(yīng)用豆包正式發(fā)布,很快攻陷各大應(yīng)用市場。目前豆包底層的大模型已經(jīng)應(yīng)用于字節(jié)內(nèi)部各大業(yè)務(wù),覆蓋了協(xié)同辦公、數(shù)據(jù)分析、文案創(chuàng)作、輔助編程、內(nèi)容審核等場景。當(dāng)這個(gè)大模型最終以“豆包大模型”的名稱正式發(fā)布走向市場,所需面對的最大挑戰(zhàn)就是如何建立AI與用戶之間的磁力,打通大模型的商業(yè)化落地空間。
此后的近一年時(shí)間里,我們能看到豆包帶來了關(guān)于大模型磁力的三重奏。
經(jīng)歷了快速的技術(shù)迭代與產(chǎn)品梳理,如今“豆包”的定義更加明確和統(tǒng)一。它表面是一款類GPT的應(yīng)用,背后實(shí)際是一整個(gè)豆包模型家族,而與底層大模型同名的豆包APP,則是字節(jié)通過模型升級產(chǎn)品體驗(yàn),與C端用戶重新建立磁力的通道。
為了破解大模型應(yīng)用缺乏魅力,產(chǎn)品同質(zhì)化太高的問題,豆包貫徹了一個(gè)核心產(chǎn)品設(shè)計(jì)原則,擬人化。
從AI命題被提出的那一刻,這種技術(shù)的核心就是讓機(jī)器模仿人。而伴隨著無數(shù)科幻作品的熏陶,大眾對AI魅力的認(rèn)知與期待也都在于擬人。但要注意的是,AI擬人的目標(biāo)并不能僅僅依靠技術(shù)手段來實(shí)現(xiàn)。而是需要產(chǎn)品層面的更多雕琢。
為了實(shí)現(xiàn)豆包的擬人化,相關(guān)團(tuán)隊(duì)在多個(gè)層級進(jìn)行了一系列產(chǎn)品設(shè)計(jì)。比如說,依靠豆包家族里的語音識別模型和聲音復(fù)刻模型,進(jìn)而實(shí)現(xiàn)與其對話貼近與真人對話的感覺。
在進(jìn)入豆包聊天界面后,用戶會感覺到與社交軟件非常相似的產(chǎn)品設(shè)計(jì)。比如說,聊天框頂部有對話頭像,這一點(diǎn)繼承了用戶與真人聊天的產(chǎn)品習(xí)慣。
在豆包大模型家族中,還推出了角色扮演模型。這個(gè)模型當(dāng)中,AI會模仿不同人設(shè)、不同性格的人來與用戶進(jìn)行對話,并且可以通過智能體來自行設(shè)定聊天角色。將擬人化作為核心功能之一,可以快速拉近與用戶的距離,消弭掉用戶對AI技術(shù)的陌生感。
具體到AIGC能力當(dāng)中,豆包同樣強(qiáng)調(diào)擬人化思路的貫徹。比如豆包在進(jìn)行PPT制作功能時(shí),在PPT生成之外還會提出制作PPT所需注意的問題。這就非常類似于朋友或同事進(jìn)行合作時(shí)的情況,而不僅僅是簡單的AI工具。
在擬人化核心特性的加持下,豆包很快得到了用戶群,尤其是年輕用戶的認(rèn)可。隨后,豆包的戰(zhàn)略權(quán)重開始不斷上升。形成了具有多模態(tài)能力的模型家族,包含了通用模型pro、通用模型lite、語音識別模型、語音合成模型、文生圖模型等十款模型。
豆包雖然是AI模型,但其差異化恰好在于對“人”的重視。通過精細(xì)的擬人化產(chǎn)品設(shè)計(jì),其完成了對大模型同質(zhì)化問題的擺脫。
而在產(chǎn)業(yè)端,豆包也將這種直面問題核心的思路貫徹了下去。
面對大模型機(jī)遇,各行業(yè)以及無數(shù)AI開發(fā)者都躍躍欲試。但較高的模型使用成本,依舊會給企業(yè)進(jìn)行大模型探索、試錯(cuò)造成一定的影響。尤其伴隨業(yè)務(wù)的不斷發(fā)展,大模型成本也會不斷上升。在真正推動大模型落地前,成本賬是企業(yè)用戶必須先算清楚的。
與此同時(shí),大模型的開發(fā)方面臨著另一重困境。模型的調(diào)用量不足,開發(fā)者生態(tài)無法成型,直接導(dǎo)致大模型無法根據(jù)反饋進(jìn)行優(yōu)化調(diào)整,單位模型的推理成本也居高不下。因此,只有用起來才是大模型的唯一出路。對于大模型本身和企業(yè)用戶而言,中間的成本門檻已經(jīng)成為雙方共同的困擾。
在這樣的態(tài)勢下,豆包率先進(jìn)行了大模型低成本化的商業(yè)思路。豆包大模型目前通過字節(jié)跳動旗下云服務(wù)平臺火山引擎面向企業(yè)開放,5月15日,豆包大模型正式發(fā)布之時(shí),火山引擎宣布豆包主力模型在企業(yè)市場的定價(jià)已經(jīng)達(dá)到了0.0008元/千Tokens,0.8厘就能處理1500多個(gè)漢字。這個(gè)價(jià)格已經(jīng)降低到了此前行業(yè)通行方案的1%還低。
豆包率先推動大模型進(jìn)入“厘時(shí)代”,為企業(yè)降低智能化成本帶來了巨大的影響。整個(gè)行業(yè)開始跟隨和效仿,企業(yè)以更低成本、更便捷方式接入大模型成為新的主流。
尤其值得注意的是,與行業(yè)內(nèi)流行輕量化版本降價(jià),吸引企業(yè)用戶試用,然后主力模型保持較高價(jià)格的思路不同。豆包將主力模型與輕量化模型都進(jìn)行了大幅價(jià)格優(yōu)化,主力模型給出了低于行業(yè)價(jià)格99%的定價(jià)。為企業(yè)用戶與大模型之間的深度結(jié)合,掃清了最后的障礙。
除了大眾用戶與企業(yè)用戶之外,大模型落地的很大一部分動力,來自全行業(yè)模式的驅(qū)動。大模型可以伴隨著行業(yè)頭部用戶的使用,快速在行業(yè)軌道中進(jìn)行復(fù)制和推廣,從而深度加強(qiáng)行業(yè)智能化水平。
在這個(gè)過程中,大模型了解行業(yè),深入行業(yè)成為最主要的挑戰(zhàn)。而想要解決它,也只有真正走進(jìn)行業(yè),與行業(yè)達(dá)成生態(tài)合作這一條通道。
不久之前,火山引擎聯(lián)合中國電動汽車百人會,與吉利汽車、長城汽車、捷途汽車、賽力斯、智己汽車等20余家廠商,宣布成立汽車大模型生態(tài)聯(lián)盟,致力于為消費(fèi)者帶來汽車全場景AI新體驗(yàn)。
通過生態(tài)合作,火山引擎可以獲得更加清晰的汽車行業(yè)智能化訴求,從而讓豆包給出更有針對性與專業(yè)性的落地方案。比如說,當(dāng)前車企愈發(fā)重視用戶反饋,但伴隨網(wǎng)絡(luò)信息量的爆炸,人工收集網(wǎng)絡(luò)反饋的方式低效且不夠全面。豆包大模型可以幫助車企進(jìn)行反饋信息收集,并且進(jìn)行初步分析總結(jié),從而實(shí)現(xiàn)智能化的信息篩選與分類,提取出車主的主要關(guān)注點(diǎn)與情感傾向。
此外,豆包可以在汽車行業(yè)的多個(gè)角度、多個(gè)場景實(shí)現(xiàn)落地。比如搭載了豆包lite大模型后,車企可以在低延遲情況下為用戶提供清晰、智能的AI對話能力,支持閑聊、搜索、娛樂、導(dǎo)航、車控等多個(gè)座艙智能助手場景,效果要比傳統(tǒng)語音處理高達(dá)50%以上。在智能座艙、智能駕駛場景中,AI對話將成為十分重要的交互手段。豆包與汽車行業(yè)的深度融合,解決了車內(nèi)語音交互的系列痛點(diǎn)。
類似豆包與汽車的結(jié)合,火山引擎還與OPPO、vivo、榮耀、小米、三星、華碩成立了智能終端大模型聯(lián)盟。OPPO小布助手、榮耀智慧辦公智能助手、小米“小愛同學(xué)”,以及華碩筆記本電腦的豆叮AI助手等應(yīng)用,均已接入火山引擎的大模型服務(wù)。
可以看到,擬人化、低成本、重生態(tài),已經(jīng)成為豆包大模型的三個(gè)支點(diǎn)。它們在技術(shù)之上,為豆包大模型提供了產(chǎn)品、商業(yè)與產(chǎn)業(yè)合作層面的競爭力,消解了大模型同質(zhì)化帶來的落地難題。
用對用戶的尊重,對問題的正視,來重構(gòu)大模型的磁力。這或許才是日均Tokens使用量破5000億背后,豆包身上值得被提取出來的“營養(yǎng)物質(zhì)”。
-
AI
+關(guān)注
關(guān)注
87文章
30728瀏覽量
268882 -
大模型
+關(guān)注
關(guān)注
2文章
2423瀏覽量
2640
發(fā)布評論請先 登錄
相關(guān)推薦
評論