RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

語音交互領(lǐng)域亞馬遜能否一直占到先機

454398 ? 來源:網(wǎng)絡(luò)整理 ? 作者:工程師1 ? 2018-05-24 14:50 ? 次閱讀

別調(diào)戲各路中文語音助手了,了解 Echo 和 Alexa 才是正經(jīng)事。

語音時代核心硬件形態(tài):Echo 定義

四年前,搭載語音助手 Alexa 的亞馬遜智能音箱 Echo 問世,伴隨其出現(xiàn)的,還有一個全新的概念,“Voice First”。當時亞馬遜 Echo 的負責(zé)人 Mike George 認為,語音交互具有完全無門檻的易用性和高度直覺化的引導(dǎo),所以人機交互的未來將圍繞著“語音”展開。這套理論在當時并沒有得到廣泛的認可,畢竟彼時 Siri 問世已有 3 年,并沒有做出什么實質(zhì)性的成績,人們對 Siri 的使用更多是停留在“調(diào)戲”的層面,很少有人會真的從實用的角度去討論如何使用 Siri。

人們對語音交互有著天然的不信任,也很難從過去幾十年的圖形界面的舒適區(qū)中馬上走出來。亞馬遜卻認為問題并不出在“語音交互”本身。它通過 Echo,大刀闊斧地砍掉了“圖形界面”的存在,用音箱這種形式,“強迫”用戶通過語音去和這樣一個計算設(shè)備進行交互。

在屏幕消失之后,用戶開始發(fā)現(xiàn)其實語音交互在一些場景下反而相當方便且高效。早上起來一邊刷牙一邊問問 Alexa 今天的天氣,讓 Alexa 播放自己喜歡的音樂。Echo 的誕生讓人機之間的“有效交互距離”被顯著延長了,你不需要將手放到鍵盤鼠標上,不需要將手指放到觸摸屏上,就可以“隔空”和一個計算設(shè)備進行交互,這是智能音箱的核心產(chǎn)品優(yōu)勢。

后來的故事我們都知道了,谷歌、蘋果反而成為了跟隨者,Google Home、HomePod,是這兩大巨頭對“Voice First”理論的認可。蘋果在 HomePod 的產(chǎn)品設(shè)計上主打音質(zhì)而非“智能助手”,且在發(fā)售時間上姍姍來遲,緊隨其后的消息就是其銷量上的滑鐵盧。三個月 60 萬臺的銷量,使蘋果在智能音箱這個新戰(zhàn)場上僅僅占據(jù)了 6% 的市場份額。而同期 Echo 的銷量卻高達 400 萬臺。

Echo 在語音交互世界里,為亞馬遜獲得了產(chǎn)品形態(tài)的領(lǐng)先,最新的數(shù)據(jù)顯示,Echo 已經(jīng)占據(jù)了這個市場 73% 的份額。亞馬遜也在過去的幾年里盡自己所能,讓 Alexa 進入越來越多的硬件。無論是智能家居還是車載智能系統(tǒng),亞馬遜希望 Alexa 無處不在。

谷歌也是這么想的,所以從去年到今年的 CES 上,亞馬遜和谷歌圍繞著第三方硬件支持展開了一場軍備競賽,越來越多的第三方硬件開始支持 Alexa 或 Google Assistant,正在漸漸形成一種“一呼百應(yīng)”的態(tài)勢。

從 Skills 到 Blueprints,Alexa 開始做得更多更好

但亞馬遜深知,硬件層面的產(chǎn)品形態(tài)只是“Voice First”的第一步。更關(guān)鍵的深層次問題仍然在于軟件的體驗,如何讓 Alexa 可以做的事情越來越多,最終圍繞著語音交互搭建起一個豐富完備的平臺,逐漸開始生態(tài)化,才是亞馬遜完成這樣一個“語音烏托邦”的關(guān)鍵。

所以亞馬遜為 Alexa 打造了“Skills”(技能)。Skills 允許第三方開發(fā)者針對 Alexa 開發(fā)應(yīng)用和功能,讓用戶可以借由 Alexa 使用第三方的服務(wù)。(類似于開發(fā)者為蘋果生態(tài)開發(fā)的可在 App Store 下載的 App。)到去年,Alexa 上的 Skills 數(shù)量超過了 15000 個,遠超谷歌的同類產(chǎn)品“Action”(動作)。更不必說蘋果必須配合 App 才能工作的 SiriKit,在發(fā)布兩年之后還處于一個幾乎未起步的狀態(tài)。

第三方開發(fā)生態(tài)的蓬勃發(fā)展,讓 Alexa 在第三方服務(wù)接入的生態(tài)豐富性上一騎絕塵。但這并不代表 Alexa 的體驗?zāi)軌蚰雺?Google Assistant。Alexa 的平臺上仍然存在著大量沒什么人用的冷門 Skills,市場調(diào)研結(jié)果也顯示,絕大多數(shù)情況下用戶仍然只用亞馬遜本身開發(fā)的那些簡單的基礎(chǔ)功能。而論基礎(chǔ)功能,Alexa 和 Google Assistant 甚至 Siri,在體驗上并沒有很大的差別。

這可能是 Blueprints 誕生的源動力。

一個月前,亞馬遜為 Alexa 帶來了 Skill Blueprints 功能。直譯過來的意思就是“技能藍圖”。Blueprints 有點像針對 Alexa 的 Workflow,用戶不需要任何編程語言知識,就可以利用 Blueprints 中預(yù)設(shè)的模版,將你想要提供的信息以“答案”的形式寫進已經(jīng)準備好的“問題”里,打造屬于用戶自己的“技能”。

盡管目前 Blueprints 所支持的預(yù)設(shè)功能還非常有限,只能在預(yù)設(shè)的模版下,為特定問題預(yù)設(shè)答案。這使其在應(yīng)用層面沒有太多的靈活性,僅僅能用它來制作一些“問答游戲”。包括其中一個比較實用的功能是,讓來到家里的訪客可以問 Alexa 家里的 Wi-Fi 密碼,以及如何使用電視這樣的問題。目前制作好的“藍圖”也不能被發(fā)布或分享,嚴格與制作者的亞馬遜賬號綁定。

但 Blueprints 的產(chǎn)品邏輯使其完全有潛力成為亞馬遜自己的 Workflow 或 IFTTT,通過設(shè)置一系列的條件和操作,其完全可以讓 Alexa 平臺上的眾多功能更加有機地結(jié)合起來。

想象一下,你對 Alexa 喊出“我要去上班了”,Alexa 就可以自動關(guān)閉家里的燈、在關(guān)門后自動落鎖,開啟洗衣機,然后自動為你叫一輛 Uber。這在未來將成為 Alexa 上眾多功能的粘合與催化劑,也會讓目前的語音交互到達一個全新的次元,在定義上也將更加接近于“系統(tǒng)”的概念。

語音時代:將語音交互的邊界推向更遠的遠方

在“培養(yǎng)用戶的語音交互習(xí)慣”取得了初步成果之后,亞馬遜推出了帶屏幕但主要交互仍基于語音的 Echo Show。而在今年 Google I/O 的首場 KeyNote 上,谷歌也宣布其將在今年力推帶屏幕的 Smart Display 產(chǎn)品。在消費者已經(jīng)開始慢慢習(xí)慣與智能設(shè)備進行語音交互之后,帶屏幕的 Smart Display 存在的產(chǎn)品意義很明顯,就是要拓寬這樣一個語音交互世界的版圖,讓智能助手有更強大的信息展示功能。當用戶問接下來一周的天氣時,與其將每一天的天氣用語音播報出來,直接在屏幕上顯示一張氣溫折線圖,一定是更高效的。將語音交互和圖形界面進行更深度的結(jié)合,有助于將智能語音助手進一步打造成一個完整的,擁有強勢功能的“下一代操作系統(tǒng)”。

作為語音交互領(lǐng)域的領(lǐng)軍者,亞馬遜已經(jīng)繪出了一副完整的藍圖,描繪了這樣一個“語音烏托邦”。無論未來的世界是否將被語音交互所主導(dǎo),它至少會成為一塊誰都不可忽視的大蛋糕。今年的 CES,亞馬遜和谷歌在智能硬件領(lǐng)域仍打得熱火朝天,兩邊都想獲得這樣一個“語音烏托邦”的主導(dǎo)權(quán)。

有一種觀點認為,亞馬遜之所以要搶占語音交互領(lǐng)域的先機,其中的最關(guān)鍵原因在于,作為一家零售商,亞馬遜想要占領(lǐng)一個“最簡單、最直接的指令入口”。這種解釋是很合理的,在語音交互的抽象世界里,“默認選項”的壟斷力量只會比圖形界面更強大。如果人們習(xí)慣了對著智能音箱喊一句指令就可以買東西的生活,將這些指令接入到亞馬遜自身零售業(yè)務(wù)的重要性是不言而喻的。

無論是作為“下一代人機交互標準”,還是作為“零售行業(yè)的重要入口”,亞馬遜成功地驅(qū)動了用戶和計算機“說話”的欲望。人機交互的公式被圖形界面定義了數(shù)十年之久,整個行業(yè)也幾乎被巨頭們籠罩得嚴嚴實實。亞馬遜通過自己敏銳的產(chǎn)品洞察力,在其之上撕開了一個大裂口。而如何將新的交互方式與自身的業(yè)務(wù)線有機結(jié)合,將會是亞馬遜未來 5 - 10 年的機遇與挑戰(zhàn)。

剛剛過去的 Google I/O,谷歌在語音助手這一塊展現(xiàn)出了空前的重視程度。而接下來的 WWDC 18,蘋果也將在這個領(lǐng)域交出一份自己的答卷。無論是把握著互聯(lián)網(wǎng)軟件服務(wù)的谷歌,還是把握著硬件制造和銷售主導(dǎo)地位的蘋果,都不希望看到計算機交互的未來被把握在亞馬遜的手上。而 Alexa 能否成為亞馬遜走向美國科技界制高點的關(guān)鍵動力,會是未來幾年內(nèi)不可忽視的重要話題。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6161

    瀏覽量

    105299
  • 蘋果
    +關(guān)注

    關(guān)注

    61

    文章

    24395

    瀏覽量

    198551
  • 亞馬遜
    +關(guān)注

    關(guān)注

    8

    文章

    2650

    瀏覽量

    83315
收藏 人收藏

    評論

    相關(guān)推薦

    基于語音識別的智能會議系統(tǒng)具備哪些交互功能

    標貝科技專注智能語音交互領(lǐng)域多年,在語音識別和語音合成領(lǐng)域有著多項大型企業(yè)合作案例,標貝與多個智
    的頭像 發(fā)表于 12-20 10:35 ?27次閱讀

    AD7621 REF引腳一直為1.2V,是什么原因?

    幫忙求助下ADI,我們買了片AD7621做測試,發(fā)現(xiàn)REF引腳一直為1.2V,不是手冊上說的2.048V,能否幫忙問問原廠是什么原因
    發(fā)表于 12-19 07:43

    adc12j4000 fpga ip核pcs層讀出來的數(shù)據(jù)一直不對,導(dǎo)致鏈路一直同步不上,同步信號sync一直為低怎么解決?

    adc12j4000采用4Gbps的采樣率 旁路模式 寄存器205讀回來的狀態(tài)是18h,目測是對的。寄存器31讀回來的一直是C7h,即dirty capture一直是高。fpga ip核pcs層讀出來的數(shù)據(jù)一直不對,導(dǎo)致鏈路
    發(fā)表于 12-12 07:59

    基于智能語音交互的智能呼叫中心工作機制

    作為實現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之的智能語音交互技術(shù),它通過集成自然語言處理(NLP)、語音識別(ASR)和語音合成(TTS)等先進技術(shù),實
    的頭像 發(fā)表于 12-03 16:44 ?273次閱讀
    基于智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>的智能呼叫中心工作機制

    點煙器充電器可以一直插著嗎

    關(guān)于點煙器充電器是否可以一直插著的問題,存在不同的觀點和建議。以下是對這問題的分析: 支持一直插著的觀點 安全無憂 :點煙器充電器在汽車熄火后會自動斷電,靜態(tài)電流很?。s1~2毫安),因此不存在
    的頭像 發(fā)表于 10-14 15:42 ?648次閱讀

    【實操文檔】在智能硬件的大模型語音交互流程中接入RAG知識庫

    本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯 智能硬件的語音交互接入大模型后可以直接理解自然語言內(nèi)容,但大模型作為個語言模型,對專業(yè)領(lǐng)域知識
    發(fā)表于 09-29 17:12

    樂鑫聲學(xué)前端算法:打造智能語音交互新體驗,ESP32-S3 SOC技術(shù)方案

    隨著人工智能技術(shù)的不斷進步,智能語音設(shè)備正逐漸成為我們生活中不可或缺的部分。然而,在嘈雜的現(xiàn)實環(huán)境中,如何實現(xiàn)清晰、準確的語音交互,一直
    的頭像 發(fā)表于 08-03 08:04 ?923次閱讀
    樂鑫聲學(xué)前端算法:打造智能<b class='flag-5'>語音</b><b class='flag-5'>交互</b>新體驗,ESP32-S3 SOC技術(shù)方案

    在rtthreadstudio中安裝platformio,一直報出platformio未安裝怎么解決?

    我在rtthreadstudio中安裝platformio,顯示是成功的,但是創(chuàng)建基于platformio的應(yīng)用工程時,一直報出platformio未安裝。能否解決。電話:131**4391,可加微信。能否幫忙解決?
    發(fā)表于 07-25 06:12

    過欠壓保護器一直亮紅燈怎么復(fù)位

    過欠壓保護器是種用于保護電器設(shè)備免受過電壓或欠電壓影響的裝置。當電壓超過或低于設(shè)定值時,過欠壓保護器會自動切斷電源,以保護電器設(shè)備不受損害。然而,有時過欠壓保護器可能會出現(xiàn)故障,導(dǎo)致其一直亮紅燈
    的頭像 發(fā)表于 07-13 15:25 ?1.4w次閱讀

    亞馬遜語音助手的競賽中上遠遠落后

    在AI浪潮席卷全球之際,科技巨頭們無不爭先恐后,力圖搶占先機。然而,在語音助手的競賽中,曾經(jīng)的領(lǐng)先者亞馬遜可能即將獲得最后名。 繼蘋果在其WWDC 2024大會上發(fā)布了
    的頭像 發(fā)表于 06-18 16:54 ?1319次閱讀

    智能語音交互技術(shù)如何助力設(shè)備實現(xiàn)人機自然對話

    智能語音交互技術(shù)是指通過語音識別、語音合成和自然語言理解等技術(shù),實現(xiàn)人與機器之間自然語言的交流和互動。隨著現(xiàn)代人工智能在各行業(yè)的普及,智能語音
    的頭像 發(fā)表于 05-23 15:14 ?376次閱讀

    WTK6900G語音識別芯片在車載語音交互氛圍燈上的應(yīng)用案例解析

    隨著智能汽車的快速發(fā)展,車載語音交互技術(shù)逐漸成為提升駕駛體驗的關(guān)鍵技術(shù)之。傳統(tǒng)的車載燈光控制系統(tǒng)往往依賴于手動操作,不僅操作繁瑣,而且在駕駛過程中容易分散駕駛員的注意力。因此,開發(fā)
    的頭像 發(fā)表于 05-17 13:57 ?405次閱讀

    標貝語音識別技術(shù)在金融領(lǐng)域中的應(yīng)用實例

    隨著語音識別技術(shù)與文本挖掘、自然語言處理等技術(shù)的不斷融合,智能語音交互技術(shù)在金融領(lǐng)域中爆發(fā)了出巨大的應(yīng)用潛力。標貝科技根據(jù)自身與金融領(lǐng)域合作
    的頭像 發(fā)表于 05-16 16:55 ?606次閱讀
    標貝<b class='flag-5'>語音</b>識別技術(shù)在金融<b class='flag-5'>領(lǐng)域</b>中的應(yīng)用實例

    求助蜂鳴器一直

    線路板功能正常,在蜂鳴器上接了個電磁牽引后,蜂鳴器一直響,本來是蜂鳴器是產(chǎn)量到達指定數(shù)值才響次。有懂的不
    發(fā)表于 04-23 12:42

    使用modustoolbox_v3.0 創(chuàng)建XMC7200_kit的工程,但是在github上獲取一直失敗的原因?

    我使用modustoolbox_v3.0 創(chuàng)建XMC7200_kit的工程,但是在github上獲取一直失敗。 能否提供個支持XMC7000的offline_packet_content文件。
    發(fā)表于 02-02 06:07
    RM新时代网站-首页