某些語音識別系統(tǒng)(ASR)的準(zhǔn)確性可能要比之前假定的差很多。”這是最近約翰·霍普金斯大學(xué)、波蘭波茲南工業(yè)大學(xué)、弗羅茨瓦夫科技大學(xué)以及初創(chuàng)公司Avaya的研究人員一項(xiàng)正在進(jìn)行的研究主要發(fā)現(xiàn)。
這項(xiàng)研究對內(nèi)部創(chuàng)建的數(shù)據(jù)集上的商業(yè)語音識別模型進(jìn)行了基準(zhǔn)測試。共同作者聲稱,詞錯誤率(Word Error Rate, WER)(一種常見的語音識別性能指標(biāo))要顯著高于最佳報(bào)告結(jié)果,這可能表明自然語言處理(NLP)領(lǐng)域存在更多待克服的問題。
據(jù)了解,目前ASR已廣泛應(yīng)用于諸多場景中,如電話會議、電子郵件、智能設(shè)備等。ASR模型的綜合基準(zhǔn)中,標(biāo)準(zhǔn)語料庫的WER僅有2%~3%,而正是這一統(tǒng)計(jì)數(shù)據(jù)遭到了上述作者的質(zhì)疑。他們聲稱,大多數(shù)ASR的交互場景都是在“類似于聊天機(jī)器人”的背景下進(jìn)行的,說話人往往因?yàn)橐庾R到跟他們的交互對象是聊天機(jī)器人,因此通常會將命令簡化成結(jié)構(gòu)緊湊的簡短詞語,而非正常的自然對話。作者基于來自1595個供應(yīng)商和1261個客戶的50個呼叫中心對話數(shù)據(jù)集對幾套ASR系統(tǒng)進(jìn)行了評估。其通常時間長達(dá)8.5個小時,其中2.2個小時是對話。通過測試,作者發(fā)現(xiàn)ASR系統(tǒng)的錯誤率基本在15%以下,這與基準(zhǔn)測試中的2%相悖。
而基于保險(xiǎn)、通信、預(yù)定等金融行業(yè)的語料庫中,作者發(fā)現(xiàn)其WER的測試結(jié)果高達(dá)23.31%。其中,預(yù)定和通信的錯誤率最高,可能是因?yàn)閷υ捝婕疤囟ǖ娜掌凇r間、訂單金額、地點(diǎn)、產(chǎn)品和公司名稱等。但在所有領(lǐng)域的測試中,其錯誤率均高于13.73%。
研究人員將這一問題歸結(jié)為領(lǐng)域適應(yīng)性問題——基準(zhǔn)測試使用了單一性語料,例如Librispeech(1000小時英語有聲讀物錄音)、WSJ(新聞口述的談話)和Switchboard(電話交談),這些都可能太過簡單而無法真正挑戰(zhàn)ASR系統(tǒng)的可靠性。
而且,盡管他們試圖刻意模仿真實(shí)、自發(fā)的對話,但本質(zhì)上還是受約束的,比如需要配音演員,就某一合適主題進(jìn)行腳本/半腳本對話,而且正是由于配音演員的存在,幾乎都不需要考慮因性別、母語因素而產(chǎn)生的發(fā)音問題。
作為一種補(bǔ)救措施,研究人員建議ASR和NLP社區(qū)收集和注釋音頻數(shù)據(jù)集,使其更好地與ASR系統(tǒng)的實(shí)際應(yīng)用場景保持一致,他們還呼吁建立更具包容性的聲學(xué)模型,更廣泛的方言語料庫,這些改變將會促進(jìn)音頻信號處理的技術(shù)改進(jìn)。
因此,這些問題并非無法克服。“學(xué)界和工業(yè)界應(yīng)該深思熟慮,考慮可以創(chuàng)建高質(zhì)量的測試數(shù)據(jù)集。我們認(rèn)為,對ASR準(zhǔn)確性的過于樂觀會損害NLP領(lǐng)域下游應(yīng)用程序的開發(fā)。”研究人員最后表示。
責(zé)編AJX
-
軟件
+關(guān)注
關(guān)注
69文章
5117瀏覽量
88906 -
語音識別
+關(guān)注
關(guān)注
39文章
1773瀏覽量
113880 -
ASR
+關(guān)注
關(guān)注
2文章
44瀏覽量
19029
發(fā)布評論請先 登錄

岸橋箱號識別系統(tǒng):精準(zhǔn)高效,穩(wěn)定可靠#岸橋識別系統(tǒng) #岸橋理貨系統(tǒng) #岸橋箱號識別系統(tǒng)

手持火車號識別系統(tǒng)能識別哪些類型的火車#手持火車號識別設(shè)備 #手持終端火車號識別系統(tǒng)
工地AI行為識別系統(tǒng)作用

手持終端火車號識別系統(tǒng):99%高準(zhǔn)確率賦能智慧物流 #手持終端火車號識別系
景區(qū)AI行為識別系統(tǒng)作用


孚為智能的岸橋集裝箱箱號識別系統(tǒng)憑借>98%的高識別率,為港口物流提供高效精準(zhǔn)的解決方案#岸橋智能理貨系統(tǒng)


火車車號識別系統(tǒng)的工作原理 #火車車號識別系統(tǒng) #火車車號識別器 #火車車號識別裝置 #火車車號識別

OpenAI攻克Sora視頻創(chuàng)建錯誤率高難題
RFID識別系統(tǒng)

多目標(biāo)智能識別系統(tǒng)
基于OpenCV的人臉識別系統(tǒng)設(shè)計(jì)
車載語音識別系統(tǒng)語音數(shù)據(jù)采集標(biāo)注案例

評論