10 月 29 日,廣州云從信息科技有限公司(以下簡稱云從科技)宣布在語音識別技術上取得重大突破,該技術在全球最大的開源語音識別數(shù)據(jù)集 Librispeech 上刷新了世界紀錄,錯詞率(Worderrorrate,WER)降低至 2.97%,將Librispeech 的 WER 指標提升了 25%,超過微軟、谷歌、IBM、阿里、百度及約翰霍普金斯大學等企業(yè)及高校。
據(jù)介紹,云從科技核心技術閉環(huán)包括人臉識別、智能感知與智能分析三個階段,而語音識別技術是智能感知的重要部分,通過語音識別,機器可以像人類一樣理解語言,進而展開處理并進行反饋。
云從科技此次推出的語音識別模型Pyramidal-FSMN 融合圖像識別與語音識別的優(yōu)勢,將殘差卷積網(wǎng)絡和金字塔記憶模塊的序列記憶網(wǎng)絡相結合,能夠同時有效的提取空間和時間上不同粒度的信息,相比目前業(yè)界使用最為廣泛的 LSTM 模型,其訓練速度更快、識別準確率更高。
此次突破是云從科技在今年4月刷新“跨鏡追蹤技術(ReID)”三項世界紀錄后取得的又一重大成果。今年4月,云從科技跨鏡追蹤技術(ReID)技術在 Market-1501,DukeMTMC-reID,CUHK03 三個數(shù)據(jù)集刷新了世界紀錄,其中最高在 Market-1501 上的首位命中率(Rank-1 Accuracy)達到96.6%,讓跨鏡追蹤技術(ReID)技術在準確率上首次達到商用水平。
-
語音識別
+關注
關注
38文章
1739瀏覽量
112634 -
云從科技
+關注
關注
1文章
70瀏覽量
9696
原文標題:云從科技取得語音識別技術新突破
文章出處:【微信號:robotmagazine,微信公眾號:機器人技術與應用】歡迎添加關注!文章轉載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論