12月20日,OPPO年度重磅音頻類產(chǎn)品OPPOEncoFree真無線耳機(jī)媒體溝通會(huì)在北京舉行。官方宣稱,該耳機(jī)是承載了OPPO聲學(xué)基因和技術(shù)沉淀的又一力作,不僅具備高音質(zhì)、低延遲的賣點(diǎn),同時(shí)采用了業(yè)內(nèi)先進(jìn)的通話降噪AI算法技術(shù)。在硬件上,則使用了雙麥克風(fēng)波束成形,通過軟硬協(xié)同對(duì)噪音進(jìn)行屏蔽處理。其中,通過機(jī)器深度學(xué)習(xí)技術(shù),AI算法通過對(duì)常見噪聲的功率圖譜分析,自動(dòng)識(shí)別并分離噪聲和人聲,就算面臨嘈雜的環(huán)境,對(duì)方也能聽清通話內(nèi)容,輕松自如交談。
近一兩年,隨著與智能手機(jī)協(xié)同使用的場(chǎng)景不斷增多,消費(fèi)者越來越關(guān)注TWS耳機(jī)的通話質(zhì)量。作為用戶的網(wǎng)友們甚至發(fā)聲:耳機(jī)音質(zhì)好已經(jīng)是標(biāo)配,無線通話降噪才是真本事!在生活里多樣的通話場(chǎng)景中,往往充斥著各種嘈雜的噪聲,如何給用戶提供一個(gè)高質(zhì)量的通話,成為了各大TWS耳機(jī)廠商面臨的攻堅(jiān)課題。
OPPOEncoFree真無線耳機(jī)就采用了智能聽覺領(lǐng)域的創(chuàng)新公司——聲加科技的SVEAI雙麥降噪技術(shù),是在傳統(tǒng)雙麥降噪的基礎(chǔ)之上加入了深度神經(jīng)網(wǎng)絡(luò),通過深度神經(jīng)網(wǎng)絡(luò)與雙麥克風(fēng)波束成形技術(shù)的強(qiáng)強(qiáng)結(jié)合,把業(yè)界非常棘手的尖銳噪音抑制的更加干凈,例如現(xiàn)實(shí)生活中頻繁刺耳的敲擊聲、地鐵進(jìn)站的剎車聲、工地噪聲、汽笛聲等,使得OPPOEncoFree通話降噪水平達(dá)到了令人振奮的新高度。
目前基于傳統(tǒng)信號(hào)處理的兩麥陣列方案,是通過波束成形的原理讓麥克風(fēng)拾取指定方向的目標(biāo)語音信號(hào),然后利用其空間信息削弱非語音方向的干擾噪聲。這種方案對(duì)于尖銳的高頻噪音的處理效果始終不盡人意。
為了使用戶在各種噪聲環(huán)境下都可以輕松暢聊,聲加科技潛心研發(fā)了SVE AI雙麥降噪方案。此方案融合了雙麥降噪與深度神經(jīng)網(wǎng)絡(luò)降噪模型,在訓(xùn)練集加入不同場(chǎng)景的噪聲,通過深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語音增強(qiáng),把尖銳的高頻噪聲抑制得更干凈。
SVE AI開啟前后對(duì)比(地鐵場(chǎng)景):
創(chuàng)新賦能:雙麥降噪+深度神經(jīng)網(wǎng)絡(luò)
得益于團(tuán)隊(duì)成員在通信聲學(xué)核心技術(shù)上十五年的經(jīng)驗(yàn)積累,聲加科技創(chuàng)新性地開發(fā)了SVE AI雙麥降噪技術(shù),充分利用了麥克風(fēng)信號(hào)的時(shí)域、頻域、空間域以及樣本空間中的統(tǒng)計(jì)信息的差異性進(jìn)行語音增強(qiáng),為通信終端提供高品質(zhì)的語音信號(hào)。
在算法開發(fā)階段,聲加科技發(fā)現(xiàn),單純利用深度神經(jīng)網(wǎng)絡(luò)進(jìn)行語音增強(qiáng)的方案存在局限性。對(duì)比手機(jī)、平板等高運(yùn)算力設(shè)備,TWS耳機(jī)這類可穿戴設(shè)備受限于極其有限的電池與運(yùn)算能力弱的藍(lán)牙芯片,深度神經(jīng)網(wǎng)絡(luò)模型也做的比較小,導(dǎo)致泛化能力不足。然而現(xiàn)實(shí)中的噪聲環(huán)境是極其復(fù)雜的,一旦在復(fù)雜聲學(xué)場(chǎng)景下算法運(yùn)算失效,會(huì)出現(xiàn)吃語音,再混進(jìn)周圍干擾語音,背景噪聲起伏等問題,讓語音可懂度急劇下降,嚴(yán)重影響用戶的語音通話。
為了解決上述問題,聲加科技在雙麥降噪基礎(chǔ)上,融合了深度神經(jīng)網(wǎng)絡(luò),補(bǔ)充了聲波的空間信息,還利用深度神經(jīng)網(wǎng)絡(luò)對(duì)高頻噪聲作為訓(xùn)練集,把對(duì)語音通話的干擾抑制的更干凈。在將二者的優(yōu)點(diǎn)融合,短板互補(bǔ)后,使得算法對(duì)于任何環(huán)境均保證穩(wěn)定而一致的性能。不僅通話品質(zhì)通過了嚴(yán)格的測(cè)試,表現(xiàn)優(yōu)異,其穩(wěn)定而深度的降噪效果在主觀體驗(yàn)上也得到了OPPO的青睞。
專注通信聲學(xué)核心技術(shù)提供全場(chǎng)景語音交互技術(shù)方案
聲加科技是依托于中科院聲學(xué)所雄厚的人才和科研資源,打造產(chǎn)學(xué)研一體化的創(chuàng)新型創(chuàng)業(yè)公司。團(tuán)隊(duì)專注于通信聲學(xué)核心技術(shù),為B端客戶提供復(fù)雜場(chǎng)景下的近場(chǎng)、中場(chǎng)、遠(yuǎn)場(chǎng)語音交互技術(shù)方案,以及從芯片、模組、PCBA到工業(yè)設(shè)計(jì)的一站式產(chǎn)品方案。憑借在聲學(xué)和語音領(lǐng)域的十余年的技術(shù)積累,其回聲抵消、噪聲抑制、聲源定位、混響消除、波束形成、語音喚醒等核心技術(shù)在行業(yè)內(nèi)一直處于領(lǐng)先水平。
在TWS耳機(jī)領(lǐng)域,聲加科技目前已完成了單麥通話降噪、雙麥通話降噪、三麥通話降噪、雙麥+AI通話降噪、FBmic+雙麥的多傳感器融合方案、低功耗關(guān)鍵詞喚醒/有限命令詞方案等多個(gè)方案的應(yīng)用落地。應(yīng)用產(chǎn)品除了本次發(fā)布的OPPO ENCO FREE,還有華為、小米、萬魔等的多款明星產(chǎn)品。
最后,聲加科技表示,未來還將為客戶提供模組、芯片等多種形態(tài)的產(chǎn)品,為人與人通信、人與機(jī)器交互提供更清晰、更舒適、更自由的使用體驗(yàn),最終實(shí)現(xiàn)人機(jī)完全交融的愿景。
發(fā)布評(píng)論請(qǐng)先 登錄
AI神經(jīng)網(wǎng)絡(luò)降噪算法在語音通話產(chǎn)品中的應(yīng)用優(yōu)勢(shì)與前景分析

華為AI通話反詐方案助力預(yù)防電信網(wǎng)絡(luò)詐騙

全面擁抱AI,AI賦能設(shè)備資產(chǎn)管理 歡迎一起探討 4001004168 @中設(shè)智控 #資產(chǎn)管理
首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手
Banana Pi 發(fā)布 BPI-AI2N & BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開發(fā)
直播預(yù)告| AI 玩偶爆款密碼:涂鴉 AI 玩偶方案如何賦能開發(fā)者伙伴?

華為AI Calling解決方案打造AI時(shí)代業(yè)務(wù)入口
AI賦能邊緣網(wǎng)關(guān):開啟智能時(shí)代的新藍(lán)海
珠海杰理AC/JL7006F, JL7018F頭戴耳機(jī)系列芯片
珠海杰理JL700N, JL701N ,TWS耳機(jī)系列芯片
聲智科技AI耳機(jī)有哪些功能
AI賦能新通話構(gòu)筑智能業(yè)務(wù)入口

tlv320Ai32在輸出音頻時(shí)總有絲絲聲,為什么?

評(píng)論