RM新时代赚钱项目,新世代RM官方网站

“做AI 產品經理太難了?！苯谀X極體的同事參加了一場開發(fā)者大會，一位產品經理向我們坦言：“AI時代，做產品的方法論沒變，但以往熟悉的東西幾乎都被清零了。”

用戶需求被清零了，大模型到底能用來做什么，用戶自己是不清楚的，需求是空白的，需求調研、產品定義，就要花費好幾個月的時間。

好不容易定義好了，基礎模型的一個更新，就有可能將前期所做的工作、功能規(guī)劃等推倒重來。

“比如GPT-4o出現(xiàn)之后，語音對話的能力是我們完全意想不到的，就又得把產品開發(fā)過程再來一遍……”

而縱觀一年多來推陳出新的數百個大模型，GPT-4o可以說是產品化程度非常高的一個了。

比如OpenAI發(fā)布會上展示的“AI視頻通話”，使用戶與AI進行實時的、跟真人對話一樣自然的視頻交流。國內模型廠商也很快推出了類似的AI視頻通話功能，不少媒體和用戶都表示“體驗炸裂”。

但半年時間過去，發(fā)現(xiàn)在最初的震驚與新鮮感過后，在真正的軟件生態(tài)里，還是沒有看到“AI視頻通話”被大規(guī)模、高頻率地用起來，更別提激活用戶的付費欲望了。為什么會這樣？

我們就從“AI視頻通話”說開去，聊聊AI產品化、商業(yè)化到底要經過哪些磨礪。

鉆石原礦被開采出來，其實并不璀璨奪目，是經由工匠們的切割打磨，被鑲嵌成鉆石首飾，包裝為“愛情象征”，才走進大眾消費市場，價值實現(xiàn)了百倍千倍攀升。

類GPT-4o大模型就類似于原礦，作為“交互天花板”，潛在商業(yè)價值很大，但必須經過產品化的精細打磨與包裝，才能被大眾用戶廣泛接受，實現(xiàn)其真正的價值和應用潛力。

而基于類GPT-4o所誕生的“AI視頻通話”，雖然向產品化邁進了一步，但依然屬于原型的基礎能力。

盡管OpenAI、智譜等模廠已經針對“AI視頻通話”這一應用，打磨了諸如響應速度、具體用例等產品側的細節(jié)，并融入到ChatGPT、智譜清言APP等產品當中。但作為一種軟件應用來說，這種與通用場景相結合的落地模式，還是比較粗陋。

首先，需求過于寬泛。

AI視頻通話，技術上相當于讓AI擁有“眼睛”和“嘴”，具備察言觀色、跟真人對話的能力。這很容易就讓人想到AI陪伴，人與AI談天說地、談情說愛。

直接將AI視頻通話能力嫁接在聊天機器人上，本質依然是AI聊天，能力升級，但無法解決chatbot商業(yè)價值低的核心問題。

AI視頻聊天，用戶容錯率高，不在乎AI偶爾犯錯或出現(xiàn)幻覺，這也意味著對基礎模型能力要求不嚴苛，無法在技術層面拉開差距。曾經的智能音箱大戰(zhàn)、智能助手紅海，也會在AI視頻聊天領域出現(xiàn)，并且由于聊天并不能幫助用戶完成具體任務或解決問題，用戶還得自己琢磨在視頻里跟AI聊什么，沒一會兒就只能跟AI面面相覷，難以帶來確定性的產品滿足和持久粘性，新鮮感過后就會流失。

而一些直接用途，想要普遍應用，也有大量細節(jié)仍待填充。

比如基于AI視頻通話的無障礙功能，是一個非常直接的落地場景。AI視頻通話，可以將設備攝像頭作為“眼睛”，幫助人去理解物理世界，這對視障人群豈不是很友好？

但實際上，大模型APP的視頻通話功能，是無法直接被視障人群用起來的，還有大量的產品細節(jié)需要考慮。比如我們曾體驗過實時圖像識別，AI只能認出“面前有兩張卡”，但哪張是公交卡，哪張是銀行卡，是無法準確識別的，這就需要基于視障群體出行接觸的高頻物體，進行針對性地精調。

而且，在飛機、高鐵、地鐵等弱網、無網環(huán)境下，也要保證視障人群與AI視頻通話的實時性，就需要純端側運行的多模態(tài)大模型，將模型做小、計算效率做高。

產品設計層面，還有大量的細節(jié)，還等待著填充，才能轉化為用戶可以方便使用的產品和服務。

可以看到，沒有更細致的產品化，盡管“AI視頻通話”這一基礎能力很厲害，卻不知道能用來干什么，很可能導致技術找不到市場，倒在了產品化變現(xiàn)的黎明到來之前。

這個“至暗時刻”會發(fā)生嗎？

欣慰的是，我們發(fā)現(xiàn) “AI視頻通話”能力，已經開始向行業(yè)輸送了，意味著這座AI基礎能力的“原礦”，終于開始被打磨成晶光四射的鉆石。

我們就從“原礦”流向的應用領域，來分享幾個“AI視頻通話”的產品化方向。

大模型怎么落地？智能體是方向。

智能體怎么服務？+AI視頻通話事半功倍。

如今，手機軟件承載著我們日常的絕大多數服務，在各個應用中來回跳轉、操作是非常繁瑣的。

今年以來，榮耀、vivo等廠商都在基于智能體打造一系列創(chuàng)新功能體驗，比如“一句話點奶茶”“一句話訂餐廳”等。用戶只需要向手機助手發(fā)出指令，手機智能體會自動理解需求、拆解任務步驟、調取相關功能，一站到底地完成任務。

Agent手機就很好地解決了數字服務鏈路長、操作繁瑣的問題，但新的問題又來了，那就是智能體還需要“看得懂”“能交流”。

舉個例子，在外賣小程序下單時，遇到廣告是常態(tài)，這時候需要智能體agent執(zhí)行準確的操作，比如“點擊關閉”“跳過”等，來推進到下一步。如果智能體無法識別相關內容，必須用戶自己動手操作，那整個鏈路就被打斷了，用戶體驗會非常不好。有跟智能助手通過文字prompt交流的功夫，用戶自己就能點開程序完成下單了。

Agent手機+視頻通話，就能用戶體驗更進一步。

比起打字的繁瑣、語音尷尬癥，在人機對話時，像跟真人面對面交流一樣，通過語音對話完成下單，更符合直覺，也更有被服務的舒適感。對話之后，大模型對視頻畫面進行實時分析，指導智能體來自動執(zhí)行，整個體驗會從頭到尾絲滑無感。

目前，國內終端廠商在端側智能體方面走得是更快的。腦極體在VDC 2024大會上了解到，藍河操作系統(tǒng)增添了視覺感知能力，讓系統(tǒng)像人類一樣“聽得懂”“看得清”。智能體能夠模擬人類的智能，助力操作系統(tǒng)像人一樣進行溝通、執(zhí)行智能任務。

如果說，智能體可以讓人成為數字服務的最小參與者，那么在智能體手機中打磨的AI視頻通話，則讓人機交互朝著更理想、更符合直覺的體驗靠近，讓數字生活管家走進現(xiàn)實。

將AI視頻通話功能集成到垂直應用軟件中，可以變成擬人化的垂域專家，提供更專業(yè)的服務，解決更具體的問題，從而激活用戶的付費意愿和模型API經濟。

目前，OpenAI為GPT-4o預設了十幾個場景，清言視頻通話API上線智譜開放平臺時，也列出了智能硬件（VR眼鏡）、教育培訓AI私教、文旅場景AI向導、具身智能等落地方向。通過將AI視頻通話API開放出來，鼓勵開發(fā)者在產品中集成“AI視頻通話”功能。

9月24日，多鄰國（Duolingo）在第六屆全球分享大會上，推出了 AI 視頻通話（Video Call）。Duolingo Max 用戶可以與多鄰國的角色 Lily（拽姐）進行視頻通話，進行個性化的互動練習。在對話中，AI會根據用戶的語言水平靈活調整內容。

學習語言最難的就是高頻使用環(huán)境和開口說話的心理障礙，通過AI視頻通話提供實時的對話機會，可以讓小白初學者也能自信開口，進行有效聯(lián)系。據說，多鄰國的這一新功能接入了OpenAI的高級語音API功能。

國內頭部社交軟件Soul，也上線了AI聊天機器人“AI茍蛋”，可以主動跟用戶找話題，并且年底將開啟AI陪聊機器人的視頻通話服務。不同于泛泛聊天，Soul主打的是靈魂交友，平臺用戶傾向于開展深層交流，探討深度話題，尋求心靈共鳴。

在這種較為成熟的社區(qū)氛圍下，用戶在使用AI視頻通話的預期、內容也是較為明確的，不會出現(xiàn)不知道聊什么的情況。

各行各業(yè)都存在大量需要互動的場景，可以跟“AI視頻通話”相結合提供擬人化體驗。但用戶能否由此對應用和AI視頻通話產生黏性，還需要行業(yè)伙伴把使用門檻降到最低，這不僅需要行業(yè)擁有產品開發(fā)的能力與意愿，能夠洞察缺口與機遇，也需要模廠的生態(tài)支持。

從哆啦A夢到阿童木、賈維斯、Her，這些讓人類感覺友好溫暖的AI，都是擬人化的。也許說明，我們更愿意跟更像人類的AI打交道，而不是冰冷無形的機器。

一位智能機器從業(yè)者告訴我們，一開始設計的新車只有虛擬的語音助手，用戶上車之后覺得跟空氣說話很尷尬，激活率不高，所以設計了一個帶有屏幕的車載控件，可以跟車主打招呼、有表情，車主很喜歡跟它對話，逢年過節(jié)還會為它買各種裝飾物，把它當作用車場景中的家庭一員。

從這個思路看，AI視頻通話其實可以被加入各種硬件當中，與用戶展開真人一般的對話，從而成為情感共同體，由此衍生的商業(yè)空間也非常充裕。

透過AI視頻通話，相信大家能夠感受到，無論是AI企業(yè)或普通大眾，對于AI產品化的需求越來越實質。

模型技術只是能力，是原型，而遠不到普遍可用的階段。唯有通過產品化的細致打磨，AI這座商業(yè)富礦，才能真正顯露出鉆石般的光芒。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關注

關注
87

文章
30601

瀏覽量
268805

TCL華星趙斌：Micro LED產品化尚需數年

范圍內展開激烈的競爭。對于備受關注的Micro LED技術，尤其是玻璃級Micro LED，趙斌表示，盡管該技術具有巨大的潛力，但其產品化的道路仍然漫長。目前，Micro LED仍處于相對早期的研發(fā)階段，各項技術和工藝仍在不斷完善和優(yōu)化之中。趙斌強調，Micro LED要實

發(fā)表于 12-16 10:19 ?175次閱讀

Banana P開源社區(qū)基于龍芯芯片方案的產品化設計

RS232端口+2個CAN2.0端口，配置靈活，為應用開發(fā)者提供功能齊全的硬件解決方案。提供較強算力的邊緣計算支持。開發(fā)者可以快速利用開發(fā)平臺，進行開發(fā)并產品化 []() 龍芯2K1000LA處理器是面向

發(fā)表于 11-30 14:00

Banana P開源社區(qū)基于龍芯芯片方案的產品化設計-國產替換全國產化

Banana P開源社區(qū)基于龍芯芯片方案的產品化設計

發(fā)表于 11-30 13:58 ?173次閱讀

Banana P開源社區(qū)基于龍芯芯片方案的<b class='flag-5'>產品化</b>設計-國產替換全國產<b class='flag-5'>化</b>

ADS1291 ECG三條感應信號，在主板走線如圖，影響大不大？

ECG 三條感應信號，在主板走線如圖，影響大不大？

發(fā)表于 11-28 06:52

可靈AI全球首發(fā)視頻模型定制功能，助力AI視頻創(chuàng)作

屬于自己的專屬人臉模型。在模型定制完成后，用戶可以基于該模型生成包含同一人物鏡頭的多個視頻內容，從而滿足用戶對于個性化視頻創(chuàng)作的多樣化需求。此外，可靈

發(fā)表于 11-26 14:02 ?444次閱讀

TIKOOL太酷信息-數字矩陣內部通話系統(tǒng)

控制、多基站IP互聯(lián)、遠程通話、遠程Tally、有線無線互控融合燈功能特點。支持上千路全雙工通話，通過后臺管理軟件任意靈活分配，打破國外同類產品壟斷，從技術研發(fā)到批量生產完成自主國產

發(fā)表于 11-16 15:15 ?0次下載

AI 大模型行業(yè)應用：企業(yè)如何走出一條智能化蛻變之路？

隨著 chatGPT 的橫空問世，我們對于人工智能在日常生活中的應用場景逐漸了解，無論是搜索、問答、文生圖還是文生視頻都出現(xiàn)了很多創(chuàng)意，甚至 AI 還可以做詩，輸入一條指令，就可以讓它當場賦詩一首

發(fā)表于 09-27 18:16 ?667次閱讀

THS8136三路10位180 MSPS圖形和視頻DAC數據表

電子發(fā)燒友網站提供《THS8136三路10位180 MSPS圖形和視頻DAC數據表.pdf》資料免費下載

發(fā)表于 07-09 09:28 ?0次下載

THS8136<b class='flag-5'>三路</b>10位180 MSPS圖形和<b class='flag-5'>視頻</b>DAC數據表

DigiKey 推出《數字化城市》第 4 季視頻系列，聚焦人工智能

全球供應品類豐富、發(fā)貨快速的現(xiàn)貨技術元器件和自動化產品領先商業(yè)分銷商?DigiKey，日前宣布推出《數字化城市》視頻系列第 4 季《智能世界中的 A

發(fā)表于 07-02 15:32 ?913次閱讀

大模型產品化，不過是三支舞

AI產品化的答案，才是AI商業(yè)化的起點

發(fā)表于 06-13 09:27 ?1919次閱讀

HDMI音視頻采集與H.264編碼?體化采集卡LCC260數據手冊

LCC260是靈卡技術研發(fā)的?款HDMI音視頻采集與H.264編碼?體化的采集卡。其輸入接口HDMI最高支持1920x1080p@60fps視頻輸入，輸出接口采用USB2.0，可同時輸出兩路

發(fā)表于 04-12 14:38 ?1次下載

具有三條 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表

電子發(fā)燒友網站提供《具有三條 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表.pdf》資料免費下載

發(fā)表于 04-09 14:40 ?3次下載

鴻蒙開發(fā)實戰(zhàn)【通話管理】

通話管理模塊主要管理CS（Circuit Switch，電路交換）、IMS（IP Multimedia Subsystem，IP多媒體子系統(tǒng)）和OTT（over the top，OTT解決方案）三種類型的通話，負責申請

發(fā)表于 03-14 20:10 ?408次閱讀

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

近日，業(yè)界領先的AI技術公司Stability AI與中國AI創(chuàng)業(yè)公司Morph AI達成重要合作。雙方宣布共同推出一款革新性的all-in-one（一體式）

發(fā)表于 03-05 10:44 ?866次閱讀

KS-PXIE6352三路DVI/HDMI視頻源板介紹

電子發(fā)燒友網站提供《KS-PXIE6352三路DVI/HDMI視頻源板介紹.pdf》資料免費下載

發(fā)表于 03-04 10:05 ?0次下載

RM新时代网站-首页

搜索歷史

“AI視頻通話”產品化的三條路

評論

TCL華星趙斌：Micro LED產品化尚需數年

Banana P開源社區(qū)基于龍芯芯片方案的產品化設計

Banana P開源社區(qū)基于龍芯芯片方案的產品化設計-國產替換全國產化

ADS1291 ECG三條感應信號，在主板走線如圖，影響大不大？

可靈AI全球首發(fā)視頻模型定制功能，助力AI視頻創(chuàng)作

TIKOOL太酷信息-數字矩陣內部通話系統(tǒng)

AI 大模型行業(yè)應用：企業(yè)如何走出一條智能化蛻變之路？

THS8136三路10位180 MSPS圖形和視頻DAC數據表

DigiKey 推出《數字化城市》第 4 季視頻系列，聚焦人工智能

大模型產品化，不過是三支舞

HDMI音視頻采集與H.264編碼?體化采集卡LCC260數據手冊

具有三條 100mA 通道的低 EMI 汽車 LED驅動器TPS61193-Q1數據表

鴻蒙開發(fā)實戰(zhàn)【通話管理】

Stability AI與Morph AI共同推出一體化AI視頻創(chuàng)作工具

KS-PXIE6352三路DVI/HDMI視頻源板介紹