女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

設(shè)計(jì)非對(duì)稱式互信息估計(jì)器減少音頻向視頻模態(tài)表達(dá)的不確定性

牽手一起夢(mèng) ? 來(lái)源:中科院自動(dòng)化 ? 作者:佚名 ? 2020-05-09 14:51 ? 次閱讀

隨著近年來(lái)音視頻生成技術(shù)的不斷發(fā)展,“虛擬主播”逐漸走入人們視野,并以其在虛擬客服、遠(yuǎn)程會(huì)議、電影剪輯等現(xiàn)實(shí)應(yīng)用場(chǎng)景中的重要作用而獲得了社會(huì)各界的廣泛關(guān)注。該技術(shù)旨在對(duì)輸入的音頻預(yù)測(cè)相應(yīng)口型,從而生成指定或任意人物的自然而準(zhǔn)確的面部說(shuō)話視頻。近日,中科院自動(dòng)化所智能感知與計(jì)算研究中心為此提出了一種新穎的音視頻協(xié)同計(jì)算方法,并重點(diǎn)解決了此前難以達(dá)成的任意人物協(xié)同生成問(wèn)題。

該方法一方面實(shí)現(xiàn)了利用語(yǔ)音驅(qū)動(dòng)任意對(duì)象的高清視頻生成,另一方面在正臉、側(cè)臉等多種場(chǎng)景下均顯著提升了生成視頻質(zhì)量。目前,該成果已被IJCAI 2020大會(huì)接收。

由于音視頻模態(tài)之間差異性等問(wèn)題,這項(xiàng)技術(shù)目前仍然存在著眾多挑戰(zhàn)。以往的研究方法往往將重點(diǎn)放在了模態(tài)內(nèi)之間,如只關(guān)注了視頻幀之間的損失約束,卻忽略了音視頻模態(tài)間最重要的問(wèn)題之一:如何將音頻信息高效充分地表達(dá)入視頻模態(tài)?同時(shí)由于人物與人物之間的個(gè)體差異,將同一模型應(yīng)用于任意人物視頻生成也存在較大的挑戰(zhàn)。

為解決上述問(wèn)題,團(tuán)隊(duì)精心設(shè)計(jì)了一個(gè)非對(duì)稱式互信息估計(jì)器(Asymmetric Mutual Information Estimator, AMIE),以構(gòu)建音視頻模態(tài)間的約束。如圖1示,輸入一對(duì)音頻與人臉圖像數(shù)據(jù),互信息估計(jì)器輸出預(yù)測(cè)的互信息值。在這里,該方法使用Jensen-Shannon表示形式來(lái)改善互信息計(jì)算方式,使其更好地應(yīng)用于神經(jīng)網(wǎng)絡(luò)。通過(guò)這樣的互信息估計(jì)方式,該方法最大化音頻與視頻模態(tài)之間的互信息,減少音頻向視頻模態(tài)表達(dá)的不確定性,并以此獲得音頻和視頻信息之間的跨模態(tài)一致性,使得生成視頻中人物的口型更加準(zhǔn)確自然。

設(shè)計(jì)非對(duì)稱式互信息估計(jì)器減少音頻向視頻模態(tài)表達(dá)的不確定性

該方法在LRW和GRID基礎(chǔ)數(shù)據(jù)集上進(jìn)行了實(shí)驗(yàn)驗(yàn)證。圖2中的結(jié)果表明該方法生成的口型準(zhǔn)確度高,且能夠有效適應(yīng)不同膚色與嘴唇形狀差異。表1的量化結(jié)果顯示該方法在常用的對(duì)比指標(biāo)上的優(yōu)越性能。

該方法有能力對(duì)不存在于數(shù)據(jù)集中的任意人物進(jìn)行視頻合成,并能夠有效處理如姿態(tài)表情、性別差異等變化因素(見圖3)。例如,輸入一段女性語(yǔ)音(圖中第二行),該方法分別生成了現(xiàn)實(shí)場(chǎng)景的同性別人臉視頻(圖中第一行),和跨性別人臉視頻(圖中第三行)。

責(zé)任編輯:gt

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 音頻
    +關(guān)注

    關(guān)注

    29

    文章

    3022

    瀏覽量

    83039
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4807

    瀏覽量

    102772
  • 視頻
    +關(guān)注

    關(guān)注

    6

    文章

    1969

    瀏覽量

    73686
收藏 人收藏

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從科幻到現(xiàn)實(shí):智能家居如何重塑我們的生活方式?

    隨著城市化和經(jīng)濟(jì)不確定性加劇,智能家居市場(chǎng)快速增長(zhǎng),預(yù)計(jì)未來(lái)幾年將改變。
    的頭像 發(fā)表于 05-28 09:36 ?93次閱讀
    從科幻到現(xiàn)實(shí):智能家居如何重塑我們的生活方式?

    請(qǐng)問(wèn)OpenVINO?工具套件是否支持使用非對(duì)稱卷積的支持模型?

    無(wú)法確定使用非對(duì)稱卷積的模型是否受 OpenVINO? Toolkit 的支持
    發(fā)表于 03-06 07:58

    優(yōu)刻得:與DeepSeek模型適配,業(yè)績(jī)貢獻(xiàn)存不確定性

    全系列模型的適配工作。然而,目前相關(guān)業(yè)務(wù)的效果以及對(duì)公司未來(lái)業(yè)績(jī)的具體貢獻(xiàn)仍存在重大不確定性。 同時(shí),經(jīng)公司核實(shí),截至公告披露日,優(yōu)刻得并未直接或間接持有杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司的股權(quán)。這意味著,盡管雙方已展開合作
    的頭像 發(fā)表于 02-07 10:37 ?623次閱讀

    “國(guó)產(chǎn)雙系統(tǒng)”出爐!復(fù)旦微FMQL20SM非對(duì)稱AMP:Linux + 裸機(jī)

    Linux + RTOS/裸機(jī),但需一個(gè)主核心來(lái)控制整個(gè)系統(tǒng)以及其它從核心。每個(gè)處理核心相互隔離,擁有屬于自己的內(nèi)存,既可各自獨(dú)立運(yùn)行不同的任務(wù),又可多個(gè)核心之間進(jìn)行核間通信。 圖 1 FMQL20SM AMP異構(gòu)多核框架示意圖 “非對(duì)稱 AMP” 對(duì)工業(yè)的重大意義 更
    的頭像 發(fā)表于 01-24 13:46 ?511次閱讀
    “國(guó)產(chǎn)雙系統(tǒng)”出爐!復(fù)旦微FMQL20SM<b class='flag-5'>非對(duì)稱</b>AMP:Linux + 裸機(jī)

    AFE5808A串并變換之后數(shù)據(jù)錯(cuò)位,輸出結(jié)果具有不確定性,為什么?

    AFE5808A串并變換之后數(shù)據(jù)錯(cuò)位,輸出結(jié)果具有不確定性,求問(wèn)可能的原因有哪些?
    發(fā)表于 01-01 07:23

    全球首張!賽思時(shí)鐘系統(tǒng)賦能山東省確定性網(wǎng)絡(luò),夯實(shí)數(shù)字未來(lái)新基座

    全球首張確定性網(wǎng)絡(luò)的高精度時(shí)間同步,由賽思打造!
    的頭像 發(fā)表于 11-29 11:13 ?569次閱讀
    全球首張!賽思時(shí)鐘系統(tǒng)賦能山東省<b class='flag-5'>確定性</b>網(wǎng)絡(luò),夯實(shí)數(shù)字未來(lái)新基座

    “雙系統(tǒng)”出爐!瑞芯微RK3562J非對(duì)稱AMP:Linux+RTOS/裸機(jī)

    非對(duì)稱AMP”雙系統(tǒng)的應(yīng)用領(lǐng)域 隨著對(duì)嵌入系統(tǒng)要求的不斷提高,非對(duì)稱AMP架構(gòu)如今已成為一種新選擇,主要應(yīng)用于工業(yè)領(lǐng)域,如工業(yè)PLC、運(yùn)動(dòng)控制、機(jī)器人控制
    發(fā)表于 11-21 16:44

    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑

    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從不確定性確定性的關(guān)鍵路徑
    的頭像 發(fā)表于 11-16 16:52 ?662次閱讀
    科技云報(bào)到:數(shù)字化轉(zhuǎn)型,從<b class='flag-5'>不確定性</b>到<b class='flag-5'>確定性</b>的關(guān)鍵路徑

    對(duì)稱多處理器非對(duì)稱多處理器的區(qū)別

    (Symmetric Multi-Processing,簡(jiǎn)稱SMP)和非對(duì)稱多處理器(Asymmetric Multi-Processing,簡(jiǎn)稱AMP)。這兩種架構(gòu)在設(shè)計(jì)理念、資源管理、任務(wù)分配和性能優(yōu)化等方面存在顯著差異。 對(duì)稱多處理器(SMP) 定義
    的頭像 發(fā)表于 10-10 15:58 ?2006次閱讀

    計(jì)及多重不確定性的規(guī)模化電動(dòng)汽車接入配電網(wǎng)調(diào)度方法及解決方案

    摘要:規(guī)模日益增長(zhǎng)的電動(dòng)汽車和可再生能源帶來(lái)的不確定性給配電網(wǎng)的安全運(yùn)營(yíng)帶來(lái)了嚴(yán)峻挑戰(zhàn)。為綜合考慮多重不確定性、平衡運(yùn)營(yíng)成本與系統(tǒng)可靠性,首先,提出一種基于分布魯棒聯(lián)合機(jī)會(huì)約束的電動(dòng)汽車-配電網(wǎng)
    的頭像 發(fā)表于 09-14 15:26 ?785次閱讀
    計(jì)及多重<b class='flag-5'>不確定性</b>的規(guī)模化電動(dòng)汽車接入配電網(wǎng)調(diào)度方法及解決方案

    破局不確定性,SENSOR CHINA 2024解鎖產(chǎn)業(yè)發(fā)展新機(jī)遇

    2023年,隨著經(jīng)濟(jì)逐步復(fù)蘇,多元智能化終端的爆發(fā)式增長(zhǎng),推動(dòng)全球傳感市場(chǎng)規(guī)模高達(dá)1929.7億美元,增速顯著回升。延續(xù)這波增長(zhǎng)勢(shì)頭,全球傳感市場(chǎng)有望保持增長(zhǎng)勢(shì)頭,其中,亞太地區(qū)的增速將領(lǐng)跑全球
    發(fā)表于 09-04 15:00 ?281次閱讀
    破局<b class='flag-5'>不確定性</b>,SENSOR CHINA 2024解鎖產(chǎn)業(yè)發(fā)展新機(jī)遇

    請(qǐng)問(wèn)高頻放大器用非對(duì)稱電源供電會(huì)有什么影響?

    高頻放大器用非對(duì)稱電源供電會(huì)有什么影響?
    發(fā)表于 08-29 06:22

    OPA828運(yùn)放非對(duì)稱電源供電有什么好處嗎?

    看到一些精密儀器的電路運(yùn)放好像特意設(shè)計(jì)成非對(duì)稱電源供電,比如+14v、-17v這種,請(qǐng)問(wèn)運(yùn)放非對(duì)稱電源供電有什么好處嗎?信號(hào)擺幅不超過(guò)正負(fù)7v
    發(fā)表于 08-01 06:48

    TL084能否采用-5V和+ 32V的非對(duì)稱雙電源供電呢?

    看手冊(cè)雙電源最高支持到+-20V,單電源是4.5V到40V。請(qǐng)問(wèn)一下能否采用-5V和+ 32V的非對(duì)稱雙電源供電呢?
    發(fā)表于 07-29 06:50

     相對(duì)于人工的不確定性,機(jī)器人碼垛有何優(yōu)勢(shì)

    ?在現(xiàn)代工業(yè)生產(chǎn)中,碼垛是一項(xiàng)至關(guān)重要的任務(wù),它涉及到將不同形狀、大小和重量的物品進(jìn)行有序地堆疊,以便于后續(xù)的運(yùn)輸和儲(chǔ)存。然而,傳統(tǒng)的人工碼垛方式存在著諸多不確定性,這些不確定性可能源自工人的疲勞
    的頭像 發(fā)表于 06-19 14:45 ?459次閱讀