女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌擬用WaveNetEQ技術提高Duo的通話質量 可自動判斷且替換丟失的音頻數據

工程師鄧生 ? 來源:雷鋒網 ? 作者:雷鋒網 ? 2020-04-08 16:07 ? 次閱讀

隨著 4G5G通信技術發展,網絡通話越來越盛行。但是網絡不穩定是常態,所以通話中我們時不時可能會蹦出一句,“你能再重復一遍嗎,剛剛網絡不太好。”為了提高通話質量,谷歌近期在視頻聊天應用 Duo 中應用了一種新技術 WaveNetEQ ,在出現音頻丟包情況時,該技術會判斷丟失的音頻數據可能是什么,并替換掉它。

背后的技術支持來自谷歌聲名在外的 DeepMind 團隊。

一個完整的在線呼叫,數據經常會被分成多個小塊,每小塊就是一個數據包 packet 。然而,在這些“數據包”從發送方傳輸到接收方的過程中,數據包通常會以錯誤的順序到達,從而產生抖動相關問題,或者直接丟失,造成音頻空白。

谷歌給出一份資料顯示, Duo 99% 的通話都有數據包丟失、過度抖動或網絡延遲情況。20% 的通話丟失了超過 3% 的音頻,10% 的通話丟包率超過 8% ,也就是說每次通話都有很多音頻需要替換。

每個視音頻 app 都會用某種方式處理丟包。谷歌表示,這些數據包丟失隱藏 (PLC) 過程可能很難更好地填補 60 毫秒或更長時間的空白。過去常用算法是 NetEQ ,這是 webRTC 中音頻技術方面的兩大核心技術之一(另一核心技術是音頻的前后處理,包括AEC、ANS、AGC等)。webRTC 是谷歌收購 GIPS 再開源的,是目前影響力極大的實時音視頻通信解決方案,但用它處理丟包,大多情況下聽起來像機器人機械重復。

谷歌就用了大量的語音數據,訓練出了基于 DeepMind WaveRNN 技術的 WaveNetEQ 模型。訓練數據集來自 100 多名、48 種不同語言的志愿者,也就是說它可以自動填補 48 種語言的丟包情況。

WaveNetEQ 是一種用于語音合成的遞歸神經網絡模型,由兩部分組成,即自回歸網絡(autoregressive network)和條件網絡(conditioning network)。自回歸網絡的作用是保持信號的平穩流動,而條件網絡控制和影響自回歸網絡以保持音頻一致性。

谷歌用 WaveNetEQ 取代了原來的 NetEQ PLC 組件,相對于 NetEQ ,它在聲音質感方面無疑有提升,而且 WaveNetEQ 模型跑得足夠快,可以在手機上運行,如此也可以規避用戶可能擔心的數據隱私問題。谷歌稱所有的處理都是在設備上進行,因為 Duo 的通話默認情況下就是端到端加密。一旦通話的真實音頻恢復,將無縫地切換到現實對話。

不過,WaveNetEQ 替換的內容和時長有限制。目前是支持在 120 毫秒以內的空白,之后會逐漸消失并歸零;WaveNetEQ 不是生成完整的單詞,而是簡單的音節。

目前 WaveNetEQ 已經應用到 Pixel 4 手機上的 Duo APP 中,谷歌表示,它正在將其推廣到其他安卓手機上。

當然用機器學習處理音頻丟包并不是頭一遭,許多公司都在研究相關技術,以國內公司為例,有些是自身業務本就涉及視音頻,比如騰訊;有些是音視頻云服務商,比如阿里,還有一些是專門的音視頻第三方服務商如聲網等。
責任編輯:wv

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6223

    瀏覽量

    107485
  • 通話
    +關注

    關注

    0

    文章

    28

    瀏覽量

    9694
  • DeepMind
    +關注

    關注

    0

    文章

    131

    瀏覽量

    11360
收藏 人收藏

    評論

    相關推薦
    熱點推薦

    請問AD7768-4、ADAU1979的配套Evaluation Software能否進行原始音頻數據

    請問AD7768-4、ADAU1979的配套Evaluation Software能否進行原始音頻數據? 另外請問有沒有MCU+AD架構的高精度、多通道的聲卡的解決方案?
    發表于 04-15 07:53

    如何提高嵌入式代碼質量

    嵌入式系統的發展已經深刻地影響了我們日常生活的方方面面,從智能家居到汽車控制系統,再到醫療設備和工業自動化等領域,嵌入式系統無處不在。嵌入式軟件的質量直接關系到系統的安全性、穩定性和性能。因此,提高
    發表于 01-15 10:48

    即時通話軟件音頻傳輸質量測試方案

    使用過程中的音頻傳輸質量。即時通話軟件基于移動網絡鏈路傳輸信號,通過本套測試方案中配套的網絡損傷仿真設備對傳輸鏈路添加不同的網絡影響,模擬軟件在不同網絡環境下的使用情況,進而測得更接近真實應用場景下的
    的頭像 發表于 12-03 14:34 ?593次閱讀
    即時<b class='flag-5'>通話</b>軟件<b class='flag-5'>音頻</b>傳輸<b class='flag-5'>質量</b>測試方案

    請問TLV320AIC3254EVM-K怎么讀取音頻數據流?

    您好,我在學習TLV320AIC3254EVM-K開發板的過程中碰到一個這樣的問題,TI提供的軟件是否具備讀取I2S的音頻數據流的功能,或者是否有PC機軟件可以讀取音頻數據流,或者其它方法?請高手幫忙解決,萬分感謝!
    發表于 10-31 06:14

    請問TLV320AIC3254采樣后的音頻數據如何在電腦上播放?

    TLV320AIC3254采樣后的音頻數據如何在電腦上播放
    發表于 10-25 07:58

    使用兩片TLV320ADC3101芯片接到同一條i2s總線上,能實現音頻數據的同時采集嗎?

    我想 請問一下,使用兩片TLV320ADC3101芯片接到同 一條 i2s總線上,能實現音頻數據的同時采集嗎?目前只實現了兩個芯片音頻數據的分時采集,需要做到實時同步采集。
    發表于 10-24 07:03

    使用PCM4204進行音頻數據采集的過程中,如何把采集到的音頻數據通過USB傳輸到PC上呢?

    在使用PCM4204進行音頻數據采集的過程中,如何把采集到的音頻數據通過USB傳輸到PC上呢?USB控制命令和音頻數據如何做,麻煩大佬指點一下,謝謝!
    發表于 10-15 06:44

    PCM1860音頻數據傳輸格式不可控怎么處理?

    一.問題:PCM1860音頻數據傳輸格式不可控,音頻傳輸格式具有隨機性。 在使用PCM1860+TI28335電路板,采集駐極體麥克信號(連接pcm1860的VINL1和VINL2接口
    發表于 10-10 06:12

    PCM1865能否通過配置,同時采集4個立體聲(即8個聲道)的音頻數據

    一片PCM1865,能否通過配置,同時采集4個立體聲(即8個聲道)的音頻數據
    發表于 09-29 07:32

    TAS3108/TAS3108IA音頻數字信號處理器數據

    電子發燒友網站提供《TAS3108/TAS3108IA音頻數字信號處理器數據表.pdf》資料免費下載
    發表于 08-02 11:47 ?0次下載
    TAS3108/TAS3108IA<b class='flag-5'>音頻數</b>字信號處理器<b class='flag-5'>數據</b>表

    怎么判斷PLC程序丟失

    PLC(Programmable Logic Controller,可編程邏輯控制器)是一種廣泛應用于工業自動化領域的控制器。PLC程序丟失可能會導致設備無法正常運行,甚至造成生產中斷。因此,判斷
    的頭像 發表于 07-25 10:01 ?2334次閱讀

    如何設置I2S寄存器以接收32位字的24位音頻數據

    。I2S_FIFO_CONF寄存器的第 16-18 位的 Rx FIFO 模式設置為 2 (= 每通道 24 位,全數據中斷)。從從ADC接收的數據來看,當我將I2S_BITS_MOD設置為15時,似乎丟失了最高有效位。 如何設
    發表于 07-19 10:14

    請問如何輸出32bit的i2s音頻數據

    播放藍牙音樂的時候,接收到音頻是Receive music info from Bluetooth, sample_rates=44100, bits=16, ch=2。 但是我的功放是要使用bits=32的音頻數據。如何修改?。謝謝
    發表于 06-28 06:27

    ble和a2dp共存,進入ble掃描的時候,音頻數據接收會丟失怎么解決?

    ble和a2dp共存,進入ble掃描的時候。音頻數據接收會丟失。會卡卡頓 怎么解決?
    發表于 06-24 08:10

    上位機監控軟件如何提高質量

    。本文將從以下幾個方面詳細探討如何提高上位機監控軟件的質量: 需求分析與設計 軟件架構與模塊化 編程規范與代碼質量 數據采集與處理 用戶界面設計 系統性能與穩定性 安全性 可維護性與
    的頭像 發表于 06-07 09:14 ?630次閱讀