技術(shù)和算法的開發(fā)和精進(jìn)讓AI換臉、AI克隆都成了可實現(xiàn)的事情。近日,上海科技大學(xué)團(tuán)隊的一項新研究,再一擴(kuò)展了這一領(lǐng)域,其開發(fā)建立了人體圖像合成——人體圖像合成的目的是制作可信和逼真的人類圖像,包括運動模擬、外觀傳遞和新視圖合成等。
這意味著,模型一旦經(jīng)過訓(xùn)練,就可以用來處理所有這些任務(wù)。只要一張照片、一段視頻,就能讓特朗普跟著明星偶像“唱、跳、Rap”。
研究團(tuán)隊先是采集了30個研究對象的數(shù)據(jù),他們的體型、身高各不相同。每個研究對象穿著不同的衣服,完成一套指定動作和一套隨機(jī)動作。基于此,建立了一個具有多種樣式、不同人物穿不同衣服的數(shù)據(jù)集,稱為Impersonator(iPER)數(shù)據(jù)集。
隨后,研究人員使用三維人體網(wǎng)格恢復(fù)模塊,以分離姿勢和形狀。值得一提的是,現(xiàn)有任務(wù)特定方法主要利用二維關(guān)鍵點、對人體結(jié)構(gòu)進(jìn)行估計。但是,它們只表示位置信息沒有能力描述人的個性化形狀和肢體旋轉(zhuǎn)模型。
而三維人體網(wǎng)格不僅可以對關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模,還可以對關(guān)節(jié)的位置和旋轉(zhuǎn)進(jìn)行建模描述個性化的體型。
為了保存源信息,如紋理、樣式、顏色和人臉標(biāo)識,研究人員還提出了一種注意型液化GAN。比如,通過降噪卷積自動編碼器提取特朗普的身體特征,然后經(jīng)過GAN不斷地訓(xùn)練學(xué)習(xí)、微調(diào)、監(jiān)督、轉(zhuǎn)化,將低分辨率的模型轉(zhuǎn)變成高分辨率的模型,使輸出來的視頻圖像清晰。
人體圖像合成一經(jīng)開發(fā),將在角色動畫、角色再現(xiàn)、虛擬服裝試穿、電影或游戲制作等方面展示其巨大的潛在應(yīng)用前景。當(dāng)然,技術(shù)的使用永遠(yuǎn)需要合理的規(guī)制,“以假亂真”一旦泛濫,將對市場造成難以恢復(fù)的危害。
責(zé)任編輯:PSY
-
人體
+關(guān)注
關(guān)注
0文章
11瀏覽量
11516 -
圖像
+關(guān)注
關(guān)注
2文章
1092瀏覽量
41004 -
AI
+關(guān)注
關(guān)注
87文章
34146瀏覽量
275269 -
合成
+關(guān)注
關(guān)注
0文章
16瀏覽量
13846
發(fā)布評論請先 登錄
處理合成孔徑雷達(dá)圖像的極坐標(biāo)算法基礎(chǔ)
圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

DLPDLCR3310EVM如何添加1920*1080的圖像?
如何使用圖像采集卡

圖像處理器是什么意思
圖像語義分割的實用性是什么
圖像檢測和圖像識別的原理、方法及應(yīng)用場景
圖像識別算法的優(yōu)缺點有哪些
圖像識別算法的核心技術(shù)是什么
圖像識別技術(shù)的原理是什么
計算機(jī)視覺和圖像處理的區(qū)別和聯(lián)系
如何利用CNN實現(xiàn)圖像識別
圖像檢測與識別技術(shù)的關(guān)系
圖像檢測和圖像識別的區(qū)別是什么
深入理解渲染引擎:打造逼真圖像的關(guān)鍵

評論