RM新时代官方网站,RM新时代官方网站

小愛同學(xué)是小米公司于2017年7月26日發(fā)布的收款人工智能（AI）音箱的喚醒詞及二次元人物形象。小愛同學(xué)一經(jīng)推入市場便受萬千寵愛，網(wǎng)絡(luò)上關(guān)于小愛同學(xué)的使用體驗各式各樣，無不是在稱贊，他們對小愛同學(xué)的功能、特點無不熟悉，但是你知道小愛同學(xué)是怎么工作的嗎？

智能語音交互是人工智能的分支，相當于語音助手，屬于一款智能型的手機應(yīng)用，通過智能對話與即時問答的智能交互，實現(xiàn)幫助用戶解決問題的功能。

說起智能語音助手大家首先想起的是哪些呢？

1. Siri

蘋果iOS系統(tǒng)中的人工智能助手軟件

2. Cortana

微軟開發(fā)的全球第一款人工智能助手，中文名小娜，橫跨手機與PC兩大平臺。

3. Alexa

亞馬遜推出的語音助手，主要搭載在Amazon Fcho智能音箱上。

智能語音交互是怎么實現(xiàn)交互流程中的輸入輸出呢？

智能語音交互界面事實上包含了三個技術(shù)環(huán)節(jié)：

1. 語音識別（ASR）

將人類的語音中的詞匯轉(zhuǎn)換為計算機可讀的輸入，一般包括了信號處理，盡可能的降低環(huán)境噪聲、信道、說話人等因素對特征造成的影響。用戶根據(jù)系統(tǒng)設(shè)計的口令密碼與系統(tǒng)進行溝通。

比如：小愛同學(xué)的操作執(zhí)行，每次發(fā)出指令的模式必須是“小愛同學(xué)+工作任務(wù)”，小愛同學(xué)接收后在把語音轉(zhuǎn)化成文字，再結(jié)合文字做出指令回復(fù)。

2. 語義處理（NLP）

自然語言的處理，就是把人的語言轉(zhuǎn)化成機器能夠理解的數(shù)字，分解開，并回復(fù)相應(yīng)的語言。很多在購買智能音箱之后都會有覺得是“智障音箱”的主要原因就在這里，現(xiàn)在的技術(shù)條件下，只能做到固定的回答，無法像人類一樣思考，再加上人類語言有大量的表達方式和歧義語句，理解錯誤的地方也非常多。語義處理的主要目的就是把人類語言與機器語言盡可能的相互接近，實現(xiàn)真正的用戶正常對話。

3. 語音合成（TTS）

是通過機械的、電子的方法產(chǎn)生人造語音的技術(shù)，將計算機自己產(chǎn)生的、或外部輸入的文字信息轉(zhuǎn)變?yōu)闃芬饴牭枚?、流利的漢語口語輸出的技術(shù)，可以讓機器人像人一樣開口說話，小愛同學(xué)就是通過這項技術(shù)跟你交流的。

語音交互發(fā)展的優(yōu)勢

1. 解放雙手、雙眼、雙腿，接觸空間限制，遠場可交互

2. 指向明確，語義直達目標，縮短使用路徑

3. 自然簡單人性化，學(xué)習(xí)門檻低

4. 可以一對一，也可以一對多

5. 對硬件的要求低

語音交互的劣勢

1. 不適合用戶選擇多、流程長，需要大量輔助信息決策的交互任務(wù)

2. 遠場語音交互對距離、噪音、混響、聲源數(shù)量等有一定的要求

3. 不適用于公共場合，需要安靜的嘗試

4. 依賴嘴巴和耳朵，對語種、口音和發(fā)音有一定要求

5. 輸出信息單一，表達能力有限

從技術(shù)和時間上來說，現(xiàn)在的智能語音交互系統(tǒng)還是存在一定缺陷和局限的，但是我們相信任何技術(shù)都是在實踐中成長的，你們的小愛同學(xué)也會越來越惹人愛的。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268882
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238240
智能語音

智能語音

+關(guān)注

關(guān)注
10

文章
782

瀏覽量
48758

原文標題：智能語音交互：你知道小愛同學(xué)是怎么工作的嗎？

文章出處：【微信號：dkiot888，微信公眾號：鼎酷IOT部落】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

【實操文檔】在智能硬件的大模型語音交互流程中接入RAG知識庫

本帖最后由 jf_40317719 于 2024-9-29 17:13 編輯智能硬件的語音交互接入大模型后可以直接理解自然語言內(nèi)容，但大模型作為一個語言模型，對專業(yè)領(lǐng)域知識的訓(xùn)練缺乏也是

發(fā)表于 09-29 17:12

車載導(dǎo)航人機語音交互系統(tǒng)的實現(xiàn)

利用小詞匯量的關(guān)鍵詞識別引擎實現(xiàn)大詞匯量POI名稱的識別，并且獲得了滿意的識別正確率，但是耗時較長。結(jié)語本文主要完成了車載導(dǎo)航人機語音交互系統(tǒng)的設(shè)計和實現(xiàn)，并在實驗室環(huán)境

發(fā)表于 08-15 21:27

【Gokit 3試用體驗】通過Lark 7618模組實現(xiàn)語音交互+語音交互UI設(shè)計理念

語言是人類交互最自然最舒適的方法，而今天，機智云Gokit 3上Lark7618智能語音識別模塊提供了一個很好的外圍音頻實時采集電路，以及快速的音頻合成輸出系統(tǒng)，有這兩樣，加持Goki

發(fā)表于 08-28 13:46

智能音箱混戰(zhàn) 遠場語音交互只是開始

　　導(dǎo)讀：遠場語音交互開始是智能音響，但是將來絕對不僅僅是智能音響，技術(shù)還會擴展到很多其他的產(chǎn)品。　　7月5日，阿里推出了自己的首款消費級AI產(chǎn)品天貓精靈X1，同日百度也宣布了Du

發(fā)表于 07-17 09:37

請問labview動態(tài)調(diào)用子vi的輸入輸出怎么和主程序交互

labview中動態(tài)調(diào)用子vi，子vi的輸入輸出怎么和主程序交互

發(fā)表于 01-16 20:17

車載導(dǎo)航人機語音交互系統(tǒng)的設(shè)計和實現(xiàn)

的設(shè)計中，根據(jù)人機交互的需求，設(shè)計語音導(dǎo)航系統(tǒng)的硬件框架如圖 1所示。語音導(dǎo)航系統(tǒng)和用戶之間的人機交互接口由觸摸屏、按鈕、話筒、顯示屏和擴音

發(fā)表于 05-07 07:00

樹莓派語音交互如何實現(xiàn)開關(guān)燈？

樹莓派語音交互如何實現(xiàn)開關(guān)燈？

發(fā)表于 11-08 07:08

探析智能語音交互應(yīng)用和技術(shù)

北京聲加科技CEO邱鋒海受邀以《聲加萬物、聆聽未來：智能語音交互應(yīng)用和技術(shù)》為題，分享了目前正在爆發(fā)的智能語音

發(fā)表于 11-23 09:54 ?4810次閱讀

什么是人機交互技術(shù)？

計算機輸入、輸出設(shè)備，以有效的方式實現(xiàn)人與計算機對話的技術(shù)。人機交互系統(tǒng)的主要組成 1、多模態(tài)輸入/輸

發(fā)表于 11-02 15:14 ?1.9w次閱讀

智能交互終端的功能智能交互終端怎么設(shè)置

智能交互終端是指能夠通過人機交互的方式，實現(xiàn)信息互動、控制操作等功能的設(shè)備。具體包括以下幾個方面的功能：　　1. 語音

發(fā)表于 04-16 11:53 ?4367次閱讀

什么是智能交互終端功能

家一起來看一下吧。智能交互系統(tǒng) 智能交互系統(tǒng)是指通過計算機輸入、輸出設(shè)備，以有效的方式

發(fā)表于 06-15 14:04 ?778次閱讀

請問MCU是如何實現(xiàn)IO口的輸入輸出控制的？

GPIO（General Port Input&Output）通用輸入輸出接口，MCU各個管腳對外交互最根本的單位。

發(fā)表于 08-10 11:10 ?3210次閱讀

情感語音識別技術(shù)在人機交互中的應(yīng)用與挑戰(zhàn)

?一、引言隨著人工智能技術(shù)的不斷發(fā)展，人機交互已經(jīng)成為了研究的熱點之一。情感語音識別技術(shù)作為人機交互中的重要組成部分，能夠通過識別人的

發(fā)表于 11-09 15:27 ?875次閱讀

智能語音交互技術(shù)如何助力設(shè)備實現(xiàn)人機自然對話

智能語音交互技術(shù)是指通過語音識別、語音合成和自然語言理解等技術(shù)，實現(xiàn)人與機器之間自然語言的交流和

發(fā)表于 05-23 15:14 ?376次閱讀

基于智能語音交互的智能呼叫中心工作機制

作為實現(xiàn)智能呼叫中心的關(guān)鍵技術(shù)之一的智能語音交互技術(shù)，它通過集成自然語言處理（NLP）、語音識別

發(fā)表于 12-03 16:44 ?272次閱讀

RM新时代网站-首页

搜索歷史

智能語音交互是怎么實現(xiàn)交互流程中的輸入輸出呢?

評論

【實操文檔】在智能硬件的大模型語音交互流程中接入RAG知識庫

車載導(dǎo)航人機語音交互系統(tǒng)的實現(xiàn)

【Gokit 3試用體驗】通過Lark 7618模組實現(xiàn)語音交互+語音交互UI設(shè)計理念

智能音箱混戰(zhàn) 遠場語音交互只是開始

請問labview動態(tài)調(diào)用子vi的輸入輸出怎么和主程序交互

車載導(dǎo)航人機語音交互系統(tǒng)的設(shè)計和實現(xiàn)

樹莓派語音交互如何實現(xiàn)開關(guān)燈？

探析智能語音交互應(yīng)用和技術(shù)

什么是人機交互技術(shù)？

智能交互終端的功能智能交互終端怎么設(shè)置

什么是智能交互終端功能

請問MCU是如何實現(xiàn)IO口的輸入輸出控制的？

情感語音識別技術(shù)在人機交互中的應(yīng)用與挑戰(zhàn)

智能語音交互技術(shù)如何助力設(shè)備實現(xiàn)人機自然對話

基于智能語音交互的智能呼叫中心工作機制