哥倫比亞大學的工程師們宣布一項實驗技術(shù),該技術(shù)可模仿大腦檢測和放大許多聲音的天生能力。這種由大腦控制的助聽器由人工智能驅(qū)動,可作為自動過濾器,監(jiān)控佩戴者的腦電波并增強他們想要關(guān)注的聲音。雖然仍處于早期開發(fā)階段,但該技術(shù)是邁向更好助聽器的重要一步,使佩戴者能夠無縫,高效地與周圍的人交談。
人類大腦具有非凡的能力,可以在嘈雜的環(huán)境中挑選出特定的聲音。比如,在嘈雜的酒吧里留意中意對象的說話、在車水馬龍的街道分辨身后來車等等。
這在人類來說很輕松就能做到,可連最先進的助聽器也無法實現(xiàn)。不過,哥倫比亞大學的工程師們正在改變這種情況。
他們宣布已經(jīng)實現(xiàn)一項技術(shù),可以模仿大腦天生具備的檢測并放大特定聲音的能力,并開發(fā)出一款由大腦控制的助聽器。
助聽器由AI驅(qū)動,可作為自動過濾器,監(jiān)控佩戴者的腦電波并增強他們想要關(guān)注的聲音,從而能夠讓佩戴者無縫并高效地與周圍的人交流。
論文發(fā)表在Science Advances上。據(jù)悉,一作Cong Han在杭州科技大學獲得學士學位,在哥倫比亞大學獲得碩士學位。
雞尾酒會難題
哥倫比亞大學Mortimer B. Zuckerman Mind Brain Behavior Institute的主要研究員和該論文的資深作者Nima Mesgarani博士說,處理聲音的大腦區(qū)域非常敏感,也非常強大,可以毫不費力的放大一個特定聲音而不牽扯其他聲音,今天的助聽器卻做不到。
那么通過創(chuàng)造一種利用大腦本能的助聽設(shè)備,有望使全球數(shù)億聽障人士能夠像普通人一樣輕松地進行交流。
現(xiàn)代助聽器在降噪方面已經(jīng)做的非常出色了,但實現(xiàn)的過程卻是通過提高特定種類的聲音,使其蓋過其它背景音。科學家稱之為雞尾酒會難題。
想象一下,我們在一個嘈雜的雞尾酒會,不僅每個人都在說話,大廳還放著BGM。為了讓身邊的人聽清楚你不得不提高嗓門說話,而旁邊的人為了讓你聽清楚也不得不提高自己的音量。
哥倫比亞工程公司電氣工程副教授Mesgarani博士說:“助聽器會立刻放大所有人的聲音,你仍然無法將你的談話對象和其他人區(qū)分出來”
用腦電波來放大特定聲音
為什么會想到利用腦電波呢?Mesgarani稱他們發(fā)現(xiàn)兩個人在交談的時候,講者的腦電波開始和聽著趨同。
于是該團隊將語音分離算法與神經(jīng)網(wǎng)絡(luò)、以及模仿大腦自然計算能力的復(fù)雜數(shù)學模型相結(jié)合,開發(fā)了一款腦控助聽器,使用腦電波來判斷哪些聲音應(yīng)該被放大,哪些聲音應(yīng)該被抑制。
具體實現(xiàn)方式如下:
首先從一個組中分離出每個說話者的聲音。設(shè)備自動將多個揚聲器分離成單獨的流,然后將每個揚聲器與來自用戶大腦的神經(jīng)數(shù)據(jù)進行比對。一旦某人的聲音模式與聽者的腦電波匹配度最高,他的聲音就會被放大。
其實團隊早在2年前就發(fā)布了這項技術(shù)的初代版本,但限于預(yù)訓(xùn)練數(shù)據(jù)集,效果剛開始不是很理想。比如一旦出現(xiàn)不在數(shù)據(jù)集的聲音,比如來個路人問路,系統(tǒng)就凌亂了。
好在哥倫比亞科技風險投資公司的資助下,團隊對原始算法進行了改進,Mesgarani博士、第一作者Cong Han和James O'Sullivan博士再次利用深度神經(jīng)網(wǎng)絡(luò),構(gòu)建了一個更加復(fù)雜的模型,從而能夠識別任何人聲,從而解決了上述問題。
室內(nèi)測試顯示,效果還不錯
為了測試該算法的有效性,研究人員與Northwell Health Institute for Neurology and Neurosurgery的神經(jīng)外科醫(yī)生Ashesh Dinesh Mehta合作,找來志愿患者聽取不同的講者發(fā)言,研究人員利用植入患者大腦的電極直接監(jiān)測他們的腦電波、
當患者專注于一個揚聲器時,系統(tǒng)會自動放大該聲音。當他們的注意力轉(zhuǎn)移到另一個揚聲器時,音量水平發(fā)生變化以反映這種轉(zhuǎn)變。
接下里,研究人員希望不用植入大腦這種太過簡單粗暴的方式,例如將其置于頭皮外部或耳朵周圍。
目前為止只在室內(nèi)環(huán)境中進行了測試,Mesgarani博士說未來有望在室外環(huán)境也實現(xiàn)相同的效果。
-
助聽器
+關(guān)注
關(guān)注
18文章
178瀏覽量
40946 -
AI
+關(guān)注
關(guān)注
88文章
35093瀏覽量
279502 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25440
原文標題:Sceince子刊:利用AI+腦電波,鎖定你想聽的聲音
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
研華榮登2025 AI+工業(yè)場景創(chuàng)新領(lǐng)軍企業(yè)榜
AMD攜手微軟共迎Windows 11 AI+ PC 生態(tài)新篇章

微軟推出全新Surface Windows11 AI+ PC Surface Laptop 13 英寸和Surface Pro 12英寸
國產(chǎn)低噪聲4/6/8通道24位模數(shù)轉(zhuǎn)換器軟硬件替換AD1299應(yīng)用于腦電波

用意念控制燈光亮度?這個樹莓派項目有點意思...

正點原子 AI BOX0 智能伴侶,1.54寸高清屏+長效續(xù)航,語音暢聊,情景對話,知識科普,多色可選,隨身攜帶!
軟通動力正式加入“AI+出海合作生態(tài)聯(lián)盟”

Normal Awake腦電波形時域分析參考

微軟推出全新Windows 11 AI+ PC產(chǎn)品
ADS1299EEGFE-PDK按照手冊里設(shè)置后,無法產(chǎn)生正常的腦電波波形是怎么回事?
ADS1299開發(fā)板怎么接線測腦電信號,用什么樣的線采集腦電波,在哪個位置?
共創(chuàng)AI+時代——2024中國移動全球合作伙伴大會

簡儀高性能平臺在小鼠腦電波實驗中的應(yīng)用

評論