最新研究表明,蘋果公司正在研究HomePod或其他設備如何使用音頻來估計與講話用戶之間的距離,并識別周圍的聲音。
Apple的HomePod已經(jīng)非常擅長于聽到您的聲音,即使它正在大聲播放音樂。蘋果公司有兩項單獨的新專利申請表明,蘋果公司希望將其改進,并將設備的聆聽能力提高到一個新水平。
其中之一,“基于學習的距離估計”,不僅涉及使用音頻來識別用戶,而且要弄清楚他們在哪里。
專利申請說:“通常希望設備使用[其]緊湊型麥克風陣列來估算從設備到用戶的距離。” “例如,該設備可以基于用戶到該設備的估計距離來調(diào)整播放音量或來自智能輔助設備的響應。”
繼續(xù)說:“因此,如果用戶離設備非常近,則不會大量播放音樂或語音。” 或者,如果用戶離得很遠,則可以將媒體播放或來自智能助手設備的響應調(diào)整為更大的音量。”
同樣的想法也意味著將其引入蘋果公司目前令人印象深刻但有些瑕疵的系統(tǒng),在該系統(tǒng)中,所有設備都會嘗試確定您對“嘿,Siri”說的是什么。
蘋果公司說:“在有多個設備的應用程序中,這些設備可以在彼此之間進行協(xié)調(diào)或仲裁,以根據(jù)從每個設備到用戶的距離來決定應回答一個或多個設備的查詢。”
蘋果公司提出了簡單和更復雜的解決方案,它們都可以同時使用。更簡單的方法是讓設備先執(zhí)行HomePod的工作并首先繪制其環(huán)境圖。
然后,它實際上具有“在聲學環(huán)境中的測量點或模擬點的網(wǎng)格”。在這種情況下,可以將聲音與此“網(wǎng)格”進行比較,以大致了解說話者所在的位置。
但是,Apple認為這本身并不足夠好,并且還說它與Siri最少一起使用。那是因為一個人說話時可能會動彈,而且他們要求快速回應-此提議不適合。
備選地,然后,“如果至少兩個麥克風陣列可用”,則“可以使用三角測量方法來估計語音源的距離”。
但是,這里的關(guān)鍵部分是至少需要兩個帶麥克風的設備。因此,Apple提供了另一個涉及更多的解決方案,其中涉及“基于學習的系統(tǒng),如深度神經(jīng)網(wǎng)絡(DNN)”,并且不需要多個設備。
專利申請說:“深度學習系統(tǒng)可以根據(jù)緊湊型麥克風陣列接收到的語音信號來估計每個時間幀的語音源距離。”
這個DNN系統(tǒng)可以做的是確定什么是語音,什么是背景噪聲。然后,它可以計算“有關(guān)直接信號傳播的信息”以及“混響效果和噪聲”。
該申請歸功于三位發(fā)明者,包括Mehrez Souden和Joshua D. Atkins。他們先前的相關(guān)工作包括已獲專利的如何使用比普通麥克風少的聲音來錄制完整空間聲音的專利。
這特別涉及Apple AR中的音頻,該最新專利申請涉及真實環(huán)境中的物理設備。但是,如果只是為了避免用太大聲的HomePod mini炸毀別人的耳朵而感到很麻煩,那還有很多事情要做。
該專利申請說:“例如,助聽器之類的輔助和增強型助聽器可以根據(jù)語音源的距離來增強音頻信號。”
這也是第二個新公開的專利申請重點關(guān)注的內(nèi)容。
識別重要的聲音
“基于觀察到的聲音識別聲源的系統(tǒng)和方法”,是關(guān)于讓一些設備識別其他聲音并為我們做出反應。
“許多家用電器,例如微波爐,洗衣機,洗碗機和門鈴,會發(fā)出聲音來提醒用戶該器具的狀況已經(jīng)改變,”該專利申請開始。
它繼續(xù)說:“但是,由于各種原因,用戶可能無法聽到家用電器發(fā)出的聲音警報。” “例如,用戶可能有聽力障礙,用戶可能在外面或在另一個房間里,或者設備可能發(fā)出被家庭聲學場景遮擋的聲音。”
也不必是您的煮蛋計時器關(guān)閉。該專利同樣涉及“公共場所(政府大樓),半公共場所(辦公室大廳)和私人場所(住宅或辦公大樓)”中的聲音。
它說:“(這些)也有聲學場景,可以包含帶有信息的聲音。” “例如,鈴,鈴或蜂鳴器可能指示門已經(jīng)打開或關(guān)閉,或者警報器可能發(fā)出警報聲或其他聲音,警告附近的人有危險(例如,煙,火或一氧化碳)。”
總體而言,該專利申請主要詳述了可以“訓練”設備以識別“常見聲音”的方法。然后,它將繼續(xù)偵聽其中的任何一個,并且當聽到一個聲音時,可以發(fā)出“響應于確定聲音存在于聲學場景中的選定輸出”。
換句話說,如果是您的煮蛋計時器關(guān)閉,則該設備可能會使您的Apple Watch在手腕上輕按。或者,如果是防盜警報,則該設備可以通知當局。
蘋果公司表示:“聲音中包含大量的上下文信息。” “識別常見的聲音可以使電子設備響應于觀察到的環(huán)境(例如,根據(jù)觀察到的聲音確定)來適應其行為或提供服務,從而增加它們對用戶的相關(guān)性和價值,同時需要更少的用戶幫助或輸入。”
第二項專利申請歸功于包括丹尼爾·克林格(Daniel C. Klinger)在內(nèi)的四位發(fā)明家。他先前的工作包括一項專利申請,該專利用于通過HomePod或其他設備進行安全的電話呼叫。
責任編輯:lq
-
音頻
+關(guān)注
關(guān)注
30文章
3042瀏覽量
83437 -
蘋果公司
+關(guān)注
關(guān)注
2文章
448瀏覽量
23415 -
深度學習
+關(guān)注
關(guān)注
73文章
5561瀏覽量
122793
發(fā)布評論請先 登錄
電機、變頻器之間的距離多少為宜?·

CLRC663如何增強對RFID標簽ic的識別距離?
TIKOOL太酷信息無線內(nèi)部通話系統(tǒng)允許多個人一起講話,頻道內(nèi)會不會很吵?
音頻功放芯片:音頻設備的核心驅(qū)動力

TLV320aic3104怎么設置使耳機能聽到人講話的聲音?
8127+tlv320aic3104設置立體聲采集到音頻播放是快進音頻的聲音,怎么解決?
用PCM1804做音頻轉(zhuǎn)換,輸出聲音很難聽是什么原因?qū)е碌?
系統(tǒng)靜音時發(fā)現(xiàn)aic3254出來的音頻有隨機的pop音,pop音來自右聲道較強較明顯,為什么?
FSA8049連接耳麥L/R輸出聲音正常,耳麥話筒講話聲音沒有從FSA8049_B1腳輸出來是為什么?
TLV320AIC3100來做手持設備的音頻,聲音出不來,請問下還需要注意哪些配置?
TLV320DAC3100音頻播放偶爾出一聲比正常聲音響的聲音是怎么回事?
HT338 2×50W D類立體聲音頻功放特點與優(yōu)勢

物聯(lián)網(wǎng)系統(tǒng)中聲音拾取音頻方案_咪頭

評論