RM新时代还出款吗,rm新时代平台靠谱吗

有數(shù)據(jù)顯示，到2020年，全球語音市場規(guī)模預(yù)計將達(dá)到 191.7 億美元。語音識別作為研究人工智能的方向之一，隨著語音交互技術(shù)的發(fā)展，語音AI 芯片也隨之誕生?，F(xiàn)在不論是互聯(lián)網(wǎng)巨頭，還是AI 初創(chuàng)公司，都陸續(xù)宣布進(jìn)軍芯片領(lǐng)域。

回頭看國內(nèi)車載語音市場，真正開始發(fā)展可以說是在2013年。在此之前，車內(nèi)語音部分的運(yùn)用最多也就是聽音樂和廣播，雖然車載語音已經(jīng)出現(xiàn)，但系統(tǒng)還處于初級階段，準(zhǔn)確率還不夠高，市場普及度很低。

2013年是一個轉(zhuǎn)折點，行業(yè)開始變革，更多人開始關(guān)注車載語音市場的發(fā)展。2015年之后側(cè)重云端方向，和智能汽車、車聯(lián)網(wǎng)的發(fā)展方向相關(guān)，產(chǎn)品形態(tài)也越來越標(biāo)準(zhǔn)。

2016年，隨著人工智能領(lǐng)域的發(fā)展，很多公司在智能語音部分加大了力度，特別是對語音芯片的研發(fā)。今年更是語音芯片“爆發(fā)”的一年，并且在之后的一段時間，語音芯片還會持續(xù)作為熱點。

多場景、低功耗

不同的語音技術(shù)公司研發(fā)語音芯片的考慮可能都不太一樣，大體上來講有幾方面原因。

首先是快速集成和低功耗的需要。語音芯片能夠更好地將本地功能進(jìn)行集成，同時由于現(xiàn)在涉及深度學(xué)習(xí)的計算量巨大，終端設(shè)備對功耗的要求也很高，低功耗的芯片成為市場需求。

其次是IoT時代下多樣化場景的需要。物聯(lián)網(wǎng)場景下，設(shè)備形態(tài)是多樣化的，需要一個硬件載體，成本低，算力強(qiáng)，同時能承載多樣化終端設(shè)備的需求，芯片在這個過程中扮演著核心的角色。

此外還有盈利的目的。任何語音技術(shù)公司，推出產(chǎn)品或者技術(shù)、以及軟硬件一體化的方案，最終都是為了盈利。研發(fā)語音芯片也不例外，現(xiàn)在正是物聯(lián)網(wǎng)時代推動產(chǎn)品落地的時間點，增加硬件功能之后的產(chǎn)品會帶來更高的市場效益。

語音芯片，從IOT到車載

不久前，云知聲，思必馳、出門問問等語音技術(shù)公司相繼發(fā)布了自己的AI芯片計劃。

5月16日，云知聲發(fā)布了首款面向物聯(lián)網(wǎng)領(lǐng)域的AI芯片UniOne，同時，億咖通和云知聲簽署了戰(zhàn)略合作，將攜手在UniOne芯片的基礎(chǔ)上打造車規(guī)級AI芯片，這一芯片可以為用戶與車之間提供更深層次的智能語音交互能力。

5月24日，出門問問發(fā)布了國內(nèi)首款已經(jīng)量產(chǎn)的AI語音芯片模組“問芯”Mobvoi A1，它可以幫助傳統(tǒng)家電廠商獲得遠(yuǎn)場語音交互的能力，之后會在創(chuàng)維電視和微鯨電視上實現(xiàn)合作落地。

6月26日，智能語音技術(shù)公司思必馳宣布已完成新一輪融資，并宣布已與某芯片巨頭在AI芯片方面達(dá)成合作，雙方將成立合資公司，并且適用于智能語音交互的AI芯片已在研發(fā)過程中。

雖然語音技術(shù)公司陸續(xù)宣布自己在研發(fā)語音芯片，但高工智能汽車咨詢了多家語音技術(shù)公司以及主機(jī)廠，了解到現(xiàn)在還沒有專門針對車載領(lǐng)域的語音芯片。

云知聲芯片負(fù)責(zé)人李霄寒博士介紹，云知聲5月16日發(fā)布的這款芯片是UniOne 系列芯片中的第一款，從語音AI切入，芯片命名“雨燕”，主要面向的是IoT領(lǐng)域，適合智能家電、智能車載等多個人機(jī)交互場景。目前在積極推進(jìn)車規(guī)級芯片設(shè)計，預(yù)計明年推出符合車規(guī)要求的“雨燕”產(chǎn)品。

另一家語音公司思必馳宣布研發(fā)的AI芯片，也不是專門針對車載領(lǐng)域的語音芯片，預(yù)計下半年流片；出門問問推出“問芯”Mobvoi A1是語音芯片模組，即語音模組和芯片的結(jié)合，最先是在智能家居領(lǐng)域，也不是針對車載領(lǐng)域的語音芯片。

現(xiàn)在市場上推出的“語音芯片”可以稱作是傳統(tǒng)芯片的“智能化”，將芯片和語音技術(shù)融合在一起，相比傳統(tǒng)的芯片和語音技術(shù)獨立而言，語音和芯片一體化之后，二者相互結(jié)合，如果芯片能夠和語音技術(shù)很好地匹配，不僅能夠解決兼容性的問題，同時還能實現(xiàn)降低功耗需求。

車規(guī)級的語音芯片是市場需求

車載領(lǐng)域的語音芯片首先一定要滿足車規(guī)的技術(shù)要求，通過溫度、穩(wěn)定性的測試才可以上車，研發(fā)出可以通過車規(guī)的語音芯片還存在難點。

技術(shù)上，開發(fā)芯片本身就有一定的難度。軟件和芯片要結(jié)合在一起，其實就是把交互的東西放到硬件載體上，配比和兼容就是有難度的，還要做到識別速度快、適配不同的CPU、最后到實現(xiàn)量產(chǎn)，都需要強(qiáng)大的技術(shù)支撐。

雖然現(xiàn)在缺乏車載領(lǐng)域的語音芯片，隨著汽車智能化以及車載語音交互的發(fā)展，未來車規(guī)級的語音芯片會成為市場需求。

吉利汽車負(fù)責(zé)HMI的相關(guān)人士表示，現(xiàn)在車載語音控制能力還遠(yuǎn)遠(yuǎn)不夠，就目前已經(jīng)上市的車型而言，語音的在線控制識別速度很慢，而本地詞庫又很少，自然語音狀況下語音內(nèi)容和詞庫無法匹配，就會出現(xiàn)無法識別或識別有誤。

而目前市面上推出“云+端+芯片”或者“云端芯”一體化的芯片，優(yōu)化了網(wǎng)絡(luò)識別的能力，但本地識別的能力依舊比較差，識別速度慢，用戶是比較難接受的。

語音芯片需要提高本地識別功能，但未來比較理想的是，隨著網(wǎng)絡(luò)傳輸速度的完善，研發(fā)出能夠?qū)⒈镜刈R別和在線識別結(jié)合在一起的語音芯片。

億咖通相關(guān)人士表示，隨著車聯(lián)網(wǎng)，人工智能的發(fā)展，車載芯片性能遠(yuǎn)遠(yuǎn)不能滿足汽車娛樂和多樣化交互功能需求。語音作為車載系統(tǒng)的剛需和亮點，更希望有強(qiáng)勁的硬件加速能力和適應(yīng)力的平臺，車規(guī)級智能語音芯片會是大勢所趨。

響應(yīng)速度和識別率如何提升

最近，首款搭載“祺云概念”智聯(lián)系統(tǒng)的中期換代車型傳祺GS4搭載的智能語音控制系統(tǒng)，用戶發(fā)出語音指令，系統(tǒng)便能在1.2秒內(nèi)快速反應(yīng)。官方宣稱，速度和靈敏度遠(yuǎn)超同級。

傳祺智能語音控制系統(tǒng)能夠在正常環(huán)境中實現(xiàn)95%識別正確率并具備多方言口音普通話的識別能力，離線語音識別能力、汽車訓(xùn)練的麥克陣列降噪能力、語音打斷技術(shù)、可見即可說、自定義語音喚醒等多項核心技術(shù)能力。

針對傳祺GS4智能語音控制系統(tǒng)這一大賣點，有業(yè)內(nèi)人士表示：“在網(wǎng)速、使用環(huán)境、車機(jī)CPU、內(nèi)存等各方面最佳工況時，達(dá)到1.2S響應(yīng)、95%識別率并不難?！?/p>

而在實際應(yīng)用中，車輛噪音、網(wǎng)速波動、車機(jī)后臺多進(jìn)程、硬件資源被占用、第三方執(zhí)行器件延遲等等，都會造成語音控制系統(tǒng)延遲

科大訊飛相關(guān)人士表示：“影響語音識別響應(yīng)時間有：音頻后端檢測、網(wǎng)絡(luò)傳輸、引擎處理和應(yīng)用處理四個方面?！?/p>

音頻后端點檢測是影響語音響應(yīng)速度最重要的部分，也是不可減少和用時最長的部分。講完一句語音指令，系統(tǒng)需要800ms-1000ms靜音段來識別講話是否結(jié)束，減少這個時間，則會帶來體驗下降。例如，用戶說話停頓，系統(tǒng)誤認(rèn)為用戶已經(jīng)說完了，導(dǎo)致錯誤的識別結(jié)果。

引擎處理，車機(jī)硬件配置低或其它進(jìn)程占用CPU、內(nèi)存等硬件資源，導(dǎo)致語音處理進(jìn)程沒有足夠的系統(tǒng)資源，引起處理延遲。

通過升級車機(jī)硬件和優(yōu)化引擎算法兩種方案可以有效解決問題，但升級硬件配置需要增加成本，所以主機(jī)廠更加傾向于，優(yōu)化引擎算法，在低成本硬件平臺上實現(xiàn)高效語音系統(tǒng)應(yīng)用。

網(wǎng)絡(luò)速度慢、不穩(wěn)定也是會導(dǎo)致語音識別延遲的一大因素。通過提升網(wǎng)絡(luò)傳輸速率，如未來的5G通訊，也可以有效減少延遲。

除此之外，優(yōu)化信源（地圖、音樂、電臺等等）和第三方執(zhí)行器件（開車內(nèi)燈、開天窗、座椅加熱等等），也能減少語音控制系統(tǒng)延遲，提升用戶體驗。

語音控制、觸屏、機(jī)械按鍵等都屬于控制層，最終做出執(zhí)行反饋的是信源和第三方執(zhí)行器件。如果信源和第三方執(zhí)行器件運(yùn)行緩慢，也會影響用戶對語音控制系統(tǒng)的體驗。

目前，車載領(lǐng)域已經(jīng)量產(chǎn)的語音產(chǎn)品大多數(shù)響應(yīng)時間在1.5s-3s之間，當(dāng)響應(yīng)時間達(dá)到2s以上時，用戶能夠感覺到明顯的延遲。

低NVH可提高識別率

識別率對用戶體驗至關(guān)重要，識別率太低、不準(zhǔn)確，用戶好似對牛彈琴，不但不能體現(xiàn)語音控制系統(tǒng)的便利性，反而會成為雞肋配置。

主機(jī)廠相關(guān)人士表示：“提升語音識別率除了技術(shù)方面，降低車輛NVH也是一個重要的途徑?！?/p>

車輛行駛中，外界環(huán)境噪音、發(fā)動機(jī)震動噪音、胎噪、風(fēng)噪、車身共振等等都會影響語音指令識別率，所以除了不斷對語音系統(tǒng)優(yōu)化之外，降低車輛NVH也是提升語音識別率和用戶體驗的方法之一。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

芯片

芯片

+關(guān)注

關(guān)注
455

文章
50714

瀏覽量
423136
AI

AI

+關(guān)注

關(guān)注
87

文章
30728

瀏覽量
268886
人工智能

人工智能

+關(guān)注

關(guān)注
1791

文章
47183

瀏覽量
238243
車聯(lián)網(wǎng)

車聯(lián)網(wǎng)

+關(guān)注

關(guān)注
76

文章
2577

瀏覽量
91553

原文標(biāo)題：“語音AI芯片”持續(xù)發(fā)酵，車載語音去向何處？| GGAI深度

文章出處：【微信號：ilove-ev，微信公眾號：高工智能汽車】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

語音識別與自然語言處理的關(guān)系

在人工智能的快速發(fā)展中，語音識別和自然語言處理（NLP）成為了兩個重要的技術(shù)支柱。語音識別技術(shù)使得機(jī)器能夠理解人類的語音，而自然語言處理則讓

發(fā)表于 11-26 09:21 ?325次閱讀

語音識別技術(shù)的應(yīng)用與發(fā)展

語音識別技術(shù)的發(fā)展可以追溯到20世紀(jì)50年代，但直到近年來，隨著計算能力的提升和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步，這項技術(shù)才真正成熟并廣泛應(yīng)用于各個領(lǐng)域。語音識別技術(shù)的應(yīng)用不僅提高了工作效率，也極大

發(fā)表于 11-26 09:20 ?389次閱讀

ASR與傳統(tǒng)語音識別的區(qū)別

ASR（Automatic Speech Recognition，自動語音識別）與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比：一、技術(shù)基礎(chǔ) ASR ：基于深度學(xué)習(xí)算

發(fā)表于 11-18 15:22 ?439次閱讀

ASR語音識別技術(shù)應(yīng)用

ASR（Automatic Speech Recognition）語音識別技術(shù)，是計算機(jī)科學(xué)與人工智能領(lǐng)域的重要突破，能將人類語音轉(zhuǎn)換為文本，廣泛應(yīng)用于智能家居、醫(yī)療、交通等多個領(lǐng)域。以下是對ASR

發(fā)表于 11-18 15:12 ?554次閱讀

物聯(lián)網(wǎng)系統(tǒng)智能控制產(chǎn)品的語音識別方案_離線語音識別芯片分析

01 物聯(lián)網(wǎng)系統(tǒng)中為什么要使用離線語音識別芯片物聯(lián)網(wǎng)系統(tǒng)中使用離線語音識別芯片的原因主要基于以下幾個方面： 1、實時性與可靠性實時性好：離線語音

發(fā)表于 09-26 17:56 ?556次閱讀

WTK6900FC語音識別模塊

語音識別

WT-深圳唯創(chuàng)知音電子有限公司
發(fā)布于 :2024年09月25日 17:35:07

唯創(chuàng)知音WT2605C用在離在線語音識別方案# #語音芯片 #語音識別 #唯創(chuàng)知音

語音識別

WT-深圳唯創(chuàng)知音電子有限公司
發(fā)布于 :2024年09月12日 17:24:28

什么是離線語音識別芯片？與在線語音識別的區(qū)別

離線語音識別芯片適用于智能家電等，特點為小詞匯量、低成本、安全性高、響應(yīng)快，無需聯(lián)網(wǎng)。在線語音識別功能更廣泛、識別準(zhǔn)確率高，但依賴穩(wěn)定網(wǎng)絡(luò)。

發(fā)表于 07-22 11:33 ?398次閱讀

車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

車載語音識別系統(tǒng)是指利用機(jī)器學(xué)習(xí)算法實現(xiàn)的一種自然語言處理技術(shù)，載語音識別系統(tǒng)通過辨別聲音的語調(diào)、語速和音量，將所聽到的語音轉(zhuǎn)化成可讀取的語

發(fā)表于 06-19 15:52 ?353次閱讀

網(wǎng)絡(luò)延遲為何如此重要

網(wǎng)絡(luò)延遲是指數(shù)據(jù)在網(wǎng)絡(luò)上從一點傳輸?shù)搅硪稽c所需的時間。它是影響任何基于網(wǎng)絡(luò)的系統(tǒng)(包括網(wǎng)站、應(yīng)用程序和云服務(wù))的關(guān)鍵因素。以下是網(wǎng)絡(luò)延遲很重要的一些原因：體驗延遲會影響基于網(wǎng)絡(luò)的系統(tǒng)的用戶體驗。例如，在瀏覽網(wǎng)站時，延遲可能會導(dǎo)致頁面加載時間延遲，從而導(dǎo)致用戶感到沮喪，甚至可能導(dǎo)致用戶離開。生產(chǎn)力網(wǎng)絡(luò)延遲會嚴(yán)重影響生產(chǎn)力。例如，網(wǎng)絡(luò)速度慢會導(dǎo)致訪問文件或應(yīng)用延遲，從而浪費時間并降低效率。收入對于依賴

發(fā)表于 05-28 10:39 ?441次閱讀

環(huán)保又高效：365nm固化燈為何如此受歡迎?

在追求綠色發(fā)展和高效生產(chǎn)的當(dāng)下，一款產(chǎn)品若能在滿足性能需求的同時，還兼具環(huán)保與高效兩大優(yōu)勢，無疑會受到市場的熱烈追捧。而在工業(yè)固化領(lǐng)域，365nm固化燈便是這樣一款備受矚目的產(chǎn)品。那么，為何

發(fā)表于 05-15 11:19 ?335次閱讀

RISC-V為何如此重要？

本文由半導(dǎo)體產(chǎn)業(yè)縱橫（ID：ICVIEWS）編譯自xda-developersRISC-V正在緩慢而悄然地改變CPU市場。RISC-V在過去幾年中一直是行業(yè)流行語，它正在慢慢改變半導(dǎo)體市場。但是

發(fā)表于 04-29 08:28 ?381次閱讀

什么是邊緣計算？它為何如此重要？

，什么是邊緣計算？它為何如此重要？本文將對其進(jìn)行詳細(xì)的解析。邊緣計算，簡而言之，是指在靠近物或數(shù)據(jù)源頭的一側(cè)，采用網(wǎng)絡(luò)、計算、存儲、應(yīng)用核心能力為一體的開放平臺，就近提供最近端服務(wù)。它的核心思想是將計算任

發(fā)表于 04-22 15:25 ?444次閱讀

語音識別的技術(shù)歷程及工作原理

語音識別的本質(zhì)是一種基于語音特征參數(shù)的模式識別，即通過學(xué)習(xí)，系統(tǒng)能夠把輸入的語音按一定模式進(jìn)行分類，進(jìn)而依據(jù)判定準(zhǔn)則找出最佳匹配結(jié)果。

發(fā)表于 03-22 16:58 ?3096次閱讀

英特爾或可以拿到超百億美元補(bǔ)貼

英特爾或可以拿到超百億美元補(bǔ)貼據(jù)彭博社的爆料，美國為引導(dǎo)半導(dǎo)體制造業(yè)的回歸，目前正在就向英特爾公司提供超過100億美元（換算下來約人民幣711.94億元）的補(bǔ)貼進(jìn)行談判。而這筆超100億美

發(fā)表于 02-18 11:19 ?650次閱讀