RM新时代网站-首页

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里達(dá)摩院公布自研語(yǔ)音識(shí)別模型DFSMN,識(shí)別準(zhǔn)確率達(dá)96.04%

肖青梅 ? 來(lái)源:未知 ? 作者:xiaoqingmei ? 2018-06-07 14:36 ? 次閱讀

【導(dǎo)讀】:日前,阿里巴巴達(dá)摩院機(jī)器智能實(shí)驗(yàn)室推出了新一代語(yǔ)音識(shí)別模型DFSMN,據(jù)悉語(yǔ)音識(shí)別準(zhǔn)確率達(dá)96.04%,未來(lái)將用于智能家居設(shè)備。

達(dá)摩院機(jī)器智能實(shí)驗(yàn)室的語(yǔ)音識(shí)別團(tuán)隊(duì)主導(dǎo)了這個(gè)模型的研發(fā),并宣布向全世界企業(yè)與個(gè)人開(kāi)源。對(duì)比目前業(yè)界使用最為廣泛的LSTM模型,DFSMN模型訓(xùn)練速度更快、識(shí)別準(zhǔn)確率更高。采用全新DFSMN模型的智能音響或智能家居設(shè)備,相比前代技術(shù)深度學(xué)習(xí)訓(xùn)練速度提到了3倍,語(yǔ)音識(shí)別速度提高了2倍。

在近期舉行的云棲大會(huì)武漢峰會(huì)上,裝有DFSMN語(yǔ)音識(shí)別模型的“AI收銀員”在與真人店員的PK中,在嘈雜環(huán)境下準(zhǔn)確識(shí)別了用戶的語(yǔ)音點(diǎn)單,在短短49秒內(nèi)點(diǎn)了34杯咖啡。此外,裝備這一語(yǔ)音識(shí)別技術(shù)的自動(dòng)售票機(jī)也已在上海地鐵“上崗”。

著名語(yǔ)音識(shí)別專家,西北工業(yè)大學(xué)教授謝磊表示:“阿里此次開(kāi)源的DFSMN模型,在語(yǔ)音識(shí)別準(zhǔn)確率上的穩(wěn)定提升是突破性的。是近年來(lái)深度學(xué)習(xí)在語(yǔ)音識(shí)別領(lǐng)域最具代表性的成果之一。對(duì)全球?qū)W術(shù)界和AI技術(shù)應(yīng)用都有巨大影響?!庇袠I(yè)內(nèi)人士稱,DFSMN有望成為繼傳統(tǒng)的LSTM模型后,成為全球語(yǔ)音識(shí)別領(lǐng)域最主要的聲學(xué)識(shí)別模型之一。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1613

    瀏覽量

    47164
  • 語(yǔ)言識(shí)別
    +關(guān)注

    關(guān)注

    0

    文章

    15

    瀏覽量

    4824
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何提升人臉門禁一體機(jī)的識(shí)別準(zhǔn)確率?

    準(zhǔn)確率,可以從以下幾個(gè)方面進(jìn)行改進(jìn)。一、優(yōu)化算法與模型人臉識(shí)別的核心在于算法的優(yōu)化和模型的調(diào)整,目前深度學(xué)習(xí)技術(shù)在圖像識(shí)別中的應(yīng)用取得了顯著
    的頭像 發(fā)表于 12-10 15:05 ?113次閱讀
    如何提升人臉門禁一體機(jī)的<b class='flag-5'>識(shí)別</b><b class='flag-5'>準(zhǔn)確率</b>?

    語(yǔ)音識(shí)別與自然語(yǔ)言處理的關(guān)系

    了人機(jī)交互的革命,使得機(jī)器能夠更加自然地與人類溝通。 語(yǔ)音識(shí)別技術(shù)概述 語(yǔ)音識(shí)別,也稱為自動(dòng)語(yǔ)音識(shí)別
    的頭像 發(fā)表于 11-26 09:21 ?325次閱讀

    語(yǔ)音識(shí)別技術(shù)的應(yīng)用與發(fā)展

    體驗(yàn)。 語(yǔ)音識(shí)別技術(shù)的原理 語(yǔ)音識(shí)別技術(shù)的核心在于將聲波信號(hào)轉(zhuǎn)換為可理解的文本信息。這一過(guò)程通常包括以下幾個(gè)步驟: 聲學(xué)模型 :用于
    的頭像 發(fā)表于 11-26 09:20 ?389次閱讀

    ASR與傳統(tǒng)語(yǔ)音識(shí)別的區(qū)別

    識(shí)別技術(shù)。 構(gòu)建更深更復(fù)雜的神經(jīng)網(wǎng)絡(luò)模型,利用大量數(shù)據(jù)進(jìn)行訓(xùn)練。 提高了語(yǔ)音識(shí)別準(zhǔn)確率和穩(wěn)定性。 傳統(tǒng)
    的頭像 發(fā)表于 11-18 15:22 ?439次閱讀

    ai人工智能回答準(zhǔn)確率高嗎

    ,AI可能表現(xiàn)出較高的準(zhǔn)確率。例如,在圖像識(shí)別、語(yǔ)音識(shí)別等領(lǐng)域,經(jīng)過(guò)大量訓(xùn)練的AI系統(tǒng)通常能夠取得令人滿意的準(zhǔn)確率。 然而,在其他領(lǐng)域或場(chǎng)景
    的頭像 發(fā)表于 10-17 16:30 ?2960次閱讀

    阿里達(dá)摩發(fā)布玄鐵R908 CPU

    在杭州第四屆RISC-V中國(guó)峰會(huì)上,阿里達(dá)摩再次展現(xiàn)技術(shù)實(shí)力,隆重推出了玄鐵處理器家族的最新成員——R908 CPU。此次發(fā)布標(biāo)志著玄鐵系列在高端計(jì)算領(lǐng)域的全面升級(jí),吸引了業(yè)界的廣泛矚目。
    的頭像 發(fā)表于 08-23 16:27 ?977次閱讀

    NRK3301識(shí)別語(yǔ)音芯片在智能按摩椅中的應(yīng)用與體驗(yàn)提升

    了新的變革。?一、高識(shí)別準(zhǔn)確率和快速響應(yīng)?NRK3301語(yǔ)音識(shí)別芯片采用最新的神經(jīng)網(wǎng)絡(luò)(?TDNN)?算法,?具有高識(shí)別
    的頭像 發(fā)表于 08-03 08:07 ?400次閱讀
    NRK3301<b class='flag-5'>識(shí)別</b><b class='flag-5'>語(yǔ)音</b>芯片在智能按摩椅中的應(yīng)用與體驗(yàn)提升

    什么是離線語(yǔ)音識(shí)別芯片?與在線語(yǔ)音識(shí)別的區(qū)別

    離線語(yǔ)音識(shí)別芯片適用于智能家電等,特點(diǎn)為小詞匯量、低成本、安全性高、響應(yīng)快,無(wú)需聯(lián)網(wǎng)。在線語(yǔ)音識(shí)別功能更廣泛、識(shí)別
    的頭像 發(fā)表于 07-22 11:33 ?398次閱讀

    Transformer模型語(yǔ)音識(shí)別語(yǔ)音生成中的應(yīng)用優(yōu)勢(shì)

    隨著人工智能技術(shù)的飛速發(fā)展,語(yǔ)音識(shí)別語(yǔ)音生成作為人機(jī)交互的重要組成部分,正逐漸滲透到我們生活的各個(gè)方面。而Transformer模型
    的頭像 發(fā)表于 07-03 18:24 ?1083次閱讀

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    語(yǔ)音識(shí)別技術(shù)是在智能會(huì)議系統(tǒng)中至關(guān)重要,準(zhǔn)確的智能會(huì)議語(yǔ)音識(shí)別能力,意味著會(huì)議參與者可以通過(guò)語(yǔ)音
    的頭像 發(fā)表于 06-21 11:15 ?331次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>準(zhǔn)確</b>性案例分享

    有效提升智能會(huì)議系統(tǒng)語(yǔ)音識(shí)別準(zhǔn)確性案例分享

    語(yǔ)音識(shí)別技術(shù)是在智能會(huì)議系統(tǒng)中至關(guān)重要,準(zhǔn)確的智能會(huì)議語(yǔ)音識(shí)別能力,意味著會(huì)議參與者可以通過(guò)語(yǔ)音
    的頭像 發(fā)表于 06-21 11:13 ?473次閱讀
    有效提升智能會(huì)議系統(tǒng)<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>準(zhǔn)確</b>性案例分享

    阿里達(dá)摩提出“知識(shí)鏈”框架,降低大模型幻覺(jué)

    近日,阿里巴巴達(dá)摩(湖畔實(shí)驗(yàn)室)攜手新加坡南洋理工大學(xué)等研究機(jī)構(gòu),共同推出了大模型知識(shí)鏈(CoK)框架。該框架不僅可實(shí)時(shí)檢索異構(gòu)知識(shí)源,還能逐步糾正推理錯(cuò)誤,有效提高了大
    的頭像 發(fā)表于 05-10 11:46 ?686次閱讀

    在全志V853平臺(tái)上成功部署深度學(xué)習(xí)步態(tài)識(shí)別算法

    集上測(cè)試了NB模型的步態(tài)識(shí)別準(zhǔn)確率。CASIA-B是一個(gè)大規(guī)模、多視角的步態(tài)識(shí)別數(shù)據(jù)集,共包含124個(gè)樣本,每個(gè)樣本都有10種步態(tài)序列,分為6個(gè)正常行走的序列(NM),2個(gè)身著長(zhǎng)外套行
    發(fā)表于 03-04 10:15

    阿里達(dá)摩在上海成立新公司,聚焦人工智能與軟件開(kāi)發(fā)

    天眼查信息顯示,達(dá)摩(上海)科技有限公司已正式成立,法定代表人為張建鋒,注冊(cè)資本為1000萬(wàn)人民幣。該公司由阿里巴巴旗下阿里巴巴達(dá)摩
    的頭像 發(fā)表于 02-04 10:52 ?999次閱讀

    重塑翻譯與識(shí)別技術(shù):開(kāi)源語(yǔ)音識(shí)別模型Whisper的編譯優(yōu)化與部署

    模型介紹Whisper模型是一個(gè)由OpenAI團(tuán)隊(duì)開(kāi)發(fā)的通用語(yǔ)音識(shí)別模型。它的訓(xùn)練基于大量不同的音頻數(shù)據(jù)集,是一個(gè)多任務(wù)
    的頭像 發(fā)表于 01-06 08:33 ?3633次閱讀
    重塑翻譯與<b class='flag-5'>識(shí)別</b>技術(shù):開(kāi)源<b class='flag-5'>語(yǔ)音</b><b class='flag-5'>識(shí)別</b><b class='flag-5'>模型</b>Whisper的編譯優(yōu)化與部署
    RM新时代网站-首页