10 月 29 日,廣州云從信息科技有限公司(以下簡稱云從科技)宣布在語音識別技術(shù)上取得重大突破,該技術(shù)在全球最大的開源語音識別數(shù)據(jù)集 Librispeech 上刷新了世界紀錄,錯詞率(Worderrorrate,WER)降低至 2.97%,將Librispeech 的 WER 指標提升了 25%,超過微軟、谷歌、IBM、阿里、百度及約翰霍普金斯大學等企業(yè)及高校。
據(jù)介紹,云從科技核心技術(shù)閉環(huán)包括人臉識別、智能感知與智能分析三個階段,而語音識別技術(shù)是智能感知的重要部分,通過語音識別,機器可以像人類一樣理解語言,進而展開處理并進行反饋。
云從科技此次推出的語音識別模型Pyramidal-FSMN 融合圖像識別與語音識別的優(yōu)勢,將殘差卷積網(wǎng)絡和金字塔記憶模塊的序列記憶網(wǎng)絡相結(jié)合,能夠同時有效的提取空間和時間上不同粒度的信息,相比目前業(yè)界使用最為廣泛的 LSTM 模型,其訓練速度更快、識別準確率更高。
此次突破是云從科技在今年4月刷新“跨鏡追蹤技術(shù)(ReID)”三項世界紀錄后取得的又一重大成果。今年4月,云從科技跨鏡追蹤技術(shù)(ReID)技術(shù)在 Market-1501,DukeMTMC-reID,CUHK03 三個數(shù)據(jù)集刷新了世界紀錄,其中最高在 Market-1501 上的首位命中率(Rank-1 Accuracy)達到96.6%,讓跨鏡追蹤技術(shù)(ReID)技術(shù)在準確率上首次達到商用水平。
-
語音識別
+關(guān)注
關(guān)注
39文章
1774瀏覽量
113904 -
云從科技
+關(guān)注
關(guān)注
1文章
73瀏覽量
10038
原文標題:云從科技取得語音識別技術(shù)新突破
文章出處:【微信號:robotmagazine,微信公眾號:機器人技術(shù)與應用】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
全球首次!民營企業(yè)核聚變裝置實驗取得重大突破

中軟國際在大型銀行AI項目領(lǐng)域?qū)崿F(xiàn)重大突破

普強信息入選2024語音識別技術(shù)公司TOP30榜單
語音識別技術(shù)在通信領(lǐng)域中的應用實例
Figure AI宣布終止與OpenAI合作,稱已在AI方面取得重大突破
重大突破!優(yōu)刻得×腦虎科技腦機接口臨床試驗取得新進展

國外科研團隊在X射線科學領(lǐng)域取得了重大突破
谷歌量子芯片實現(xiàn)計算領(lǐng)域重大突破
ASR語音識別技術(shù)應用
半導體研究所在量子點異質(zhì)外延技術(shù)上取得重大突破

評論