微軟致力于開發(fā)一種新的語音輸入接口,允許用戶在沒有聲音出現(xiàn)的情況下進(jìn)行說話和錄音。該研究由微軟研究院進(jìn)行,并在ACM CHI 2018中進(jìn)行了介紹。
這種技術(shù)被稱為SilentVoice通過錄制呼吸時發(fā)出的聲音來實(shí)現(xiàn)通信,這種允許類似耳語的聲音就足夠讓麥克風(fēng)錄制語音而不會打擾周圍的人。此外,該模塊還將過濾周圍的語音,因此即使有外界干擾,用戶也可以捕獲清晰的語音。
SilentVoice是一種新的語音輸入接口設(shè)備,可以在日常生活中利用基于語音的自然用戶界面(NUI)。
所提出的“漸進(jìn)式語音”方法能夠?qū)Ⅺ溈孙L(fēng)放置在非常靠近嘴的前部而不受噪聲的影響,捕獲具有良好S/N比的非常柔和的語音。它實(shí)現(xiàn)了超小(低于39dB(A))的語音泄漏,允許使用語音輸入,而不會在公共和移動情況以及辦公室和家庭中煩擾周圍的人。
通過測量氣流方向,SilentVoice可以輕松地讓外部聲音與正常話語分離,準(zhǔn)確度達(dá)98.8%,在語音通信啟動前不需要念激活詞。它還可以配合帶有經(jīng)過專門訓(xùn)練的語音識別器的語音激活系統(tǒng),評估結(jié)果產(chǎn)生的單詞錯誤率(WERs)為1.8%(說話者依賴條件),7.0%(說話者無條件),包含有85個命令句,這意味著類似耳語的自然語音也可用于實(shí)時語音通信。
-
微軟
+關(guān)注
關(guān)注
4文章
6686瀏覽量
105846 -
語音通信
+關(guān)注
關(guān)注
0文章
50瀏覽量
18904
原文標(biāo)題:GGAI 前沿 | 微軟展示詭異的Silent Voice無聲語音通信技術(shù)演示
文章出處:【微信號:ggservicerobot,微信公眾號:高工智能未來】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
汽車智能座艙ITU-T測試認(rèn)證,車載語音通信測試智慧解決方案

芯知識|語音芯片發(fā)碼無聲解析:上電無聲、連發(fā)指令才響的三大根源及解決之道

芯知識|語音芯片“無聲之謎”:當(dāng)DACL波形正常,功放開啟卻無聲音時……

芯資訊|廣州唯創(chuàng)電子錄音語音芯片應(yīng)用指南及常見問題解析

羅德與施瓦茨和村田推出NB-NTN語音測試平臺
MediaTek將于MWC 2025展示創(chuàng)新技術(shù)
語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用實(shí)例
詳解語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用

微軟與重要伙伴深化AI領(lǐng)域技術(shù)合作
語音識別技術(shù)的應(yīng)用與發(fā)展
ASR語音識別技術(shù)應(yīng)用
語音IC方案,在交通信號燈語音提示器的應(yīng)用解析,NV040D

評論