在一個癡迷于互聯(lián)網(wǎng)隱私的世界里,令人驚訝的是,我們很少談?wù)撓?Amazon Echo 這樣的始終在聽的設(shè)備。畢竟,一家想要了解你生活中的私密細(xì)節(jié)以便向你推銷更多東西的公司會在你的廚房里永久打開一個麥克風(fēng)。
如果您擁有 Echo 并且不知道此功能,請打開您的 Alexa 應(yīng)用程序,選擇“設(shè)置”菜單,然后選擇“歷史記錄”。聽一聽。所有這些錄音都是為 Echo 準(zhǔn)備的嗎?
我想隱私是現(xiàn)代消費主義中便利的代價。事情將變得更加方便。
雜音、雞尾酒會、便利和圣誕節(jié)
XMOS 是一家從布里斯托大學(xué)分離出來的無晶圓半導(dǎo)體公司,專注于語音和音樂處理 IC。在這些 IC 中,基于 32 位 xCORE MCU 架構(gòu)的設(shè)備在語音識別市場上取得了顯著的成功,提供了 16 個可編程內(nèi)核(分為 8 個內(nèi)核的兩個區(qū)塊,每個內(nèi)核共享一個地址空間),DSP 功能集成在相同的芯片。
XMOS 將 xCORE 架構(gòu)加入到用于亞馬遜 Alexa 語音服務(wù) (AVS) 的 VocalFusion 4-Mic 開發(fā)套件中。該套件圍繞英飛凌的 VocalFusion XVF3000 集成遠(yuǎn)場語音處理器和四個高信噪比 (SNR) MEMS 麥克風(fēng)而設(shè)計。XMOS 聲稱該套件是市場上第一個遠(yuǎn)場線性麥克風(fēng)陣列解決方案。
在范圍之外,在解決“雞尾酒會”問題或平臺需要將單個揚(yáng)聲器的聲音與嘈雜環(huán)境隔離的情況時,遠(yuǎn)場語音處理變得非常有趣。在 5 m 或更遠(yuǎn)的距離處,VocalFusion 4-Mic 開發(fā)套件使用聲學(xué)回聲消除 (AEC)、自適應(yīng)波束形成、動態(tài)去混響和自動增益控制 (AGC) 的組合來隔離和提取聲音信號主講者。除此之外,事情開始變得令人毛骨悚然。
今年早些時候,XMOS 收購了馬薩諸塞州波士頓的 Setem Technologies, Inc.,該公司開發(fā)了用于盲源信號分離的大規(guī)模傅立葉變換。這些盲源分離算法在數(shù)學(xué)上從一組信號中分解源信號的元素,然后單獨或作為組重構(gòu)它們(圖 1)。在語音識別中,這可以應(yīng)用于單個說話者,甚至是對話。
圖 1.現(xiàn)在隸屬于 XMOS 的 Setem Technologies 開發(fā)了盲源分離算法,可用于隔離嘈雜環(huán)境中的一個或多個揚(yáng)聲器。
現(xiàn)在,在理論上(或許在實踐中),盲源分離可用于隔離房間內(nèi)多個說話者的語音頻率,從而為每個說話者建立生物識別身份。正如你可以想象的那樣,這種技術(shù)的應(yīng)用可能會很廣泛,不僅僅是亞馬遜想知道你的每個家庭成員想要什么圣誕節(jié)。例如,監(jiān)視立即浮現(xiàn)在腦海中。
這讓我們回到了 VocalFusion 4-Mic Dev Kit 的線性麥克風(fēng)陣列。雖然 Amazon Echo 和 Google Home 等許多平臺使用圓形陣列的全向麥克風(fēng)來提供 360 度的房間覆蓋,但線性陣列設(shè)計用于 180 度的弧度。這很有趣,因為語音識別領(lǐng)域的領(lǐng)導(dǎo)者設(shè)想了一個未來,今天基于塔的虛擬助手將退居電視、冰箱、沙發(fā)、墻壁等日常物品中——你可以說出來。
這個未來被設(shè)計為超級方便,通過音節(jié)提供服務(wù)。但小心點。你可能不知道誰或什么在聽。
審核編輯:郭婷
-
處理器
+關(guān)注
關(guān)注
68文章
19798瀏覽量
233425 -
dsp
+關(guān)注
關(guān)注
555文章
8141瀏覽量
355053 -
揚(yáng)聲器
+關(guān)注
關(guān)注
29文章
1337瀏覽量
63875
發(fā)布評論請先 登錄
芯知識|廣州唯創(chuàng)電子WTR096錄音語音芯片IC深度解析

芯資訊|廣州唯創(chuàng)電子錄音語音芯片應(yīng)用指南及常見問題解析

芯知識|廣州唯創(chuàng)電子高品質(zhì)錄音IC語音芯片技術(shù)解析與應(yīng)用指南

廠家芯資訊|廣州唯創(chuàng)電子語音識別芯片技術(shù)解析

語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用實例
詳解語音識別技術(shù)在通信領(lǐng)域中的應(yīng)用

【「嵌入式系統(tǒng)設(shè)計與實現(xiàn)」閱讀體驗】+ 基于語音識別的智能杯墊
語音識別技術(shù)在醫(yī)療領(lǐng)域的應(yīng)用
語音識別與自然語言處理的關(guān)系
語音識別技術(shù)的應(yīng)用與發(fā)展
ASR與傳統(tǒng)語音識別的區(qū)別
ASR語音識別技術(shù)應(yīng)用
基于Arm Neoverse N2實現(xiàn)自動語音識別技術(shù)

評論