女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

英偉達推出基于風格的生成器新結構,GAN 2.0橫空出世

DPVg_AI_era ? 來源:lq ? 2018-12-16 10:05 ? 次閱讀

英偉達推出基于風格的生成器新結構,由此得到的升級版GAN圖像生成效果逼真到可怕!將面部細節分離出來,由模型進行單獨調整,從而大幅度超越其他模型,GAN 2.0橫空出世?

GAN 2.0來了?!

我們知道GAN能夠生成逼真的圖片,但沒有想到字面意義上的“逼真”會如此快到來。

下面是一組完全由計算機生成的圖片,重復一遍:全部是計算機生成的圖片!

這組效果驚艷到可怕的成果,出自英偉達的研究人員最近提出的一種新的生成器架構,基于風格遷移,將面部細節分離出來,由模型進行單獨調整,從而大幅度超越傳統GAN等模型,生成的面部圖像結果簡直逼真到可怕,可以說是GAN 2.0。

這種生成器架構提取的圖像風格,不是筆劃或顏色空間,而是圖像的組成(居中,向左或向右看等)和臉部的物理特征(膚色,雀斑,頭發)。

該研究的論文已經發表在Arxiv上:

https://arxiv.org/pdf/1812.04948.pdf

連Ian Goodfellow也服氣!

圖像逼真到可怕,能生成世界萬物

有CV研究人員看過上圖效果以后表示,機器學習模型非常擅長生成逼真的人臉,但這個新架構生成的人臉圖像已經真實到讓我再也不敢相信機器。

英偉達研究人員在論文中寫道,他們提出的新架構可以完成自動學習,無監督地分離高級屬性(例如在人臉上訓練時的姿勢和身份)以及生成圖像中的隨機變化,并且可以對合成進行更直觀且特定于比例的控制。

換句話說,這種新的GAN在生成和混合圖像,特別是人臉圖像時,可以更好地感知圖像之間有意義的變化,并且在各種尺度上針對這些變化做出引導。

例如,研究人員使用的舊系統可能產生兩個“不同”的面部,這兩個面部其實大致相同,只是一個人的耳朵被抹去了,兩人的襯衫是不同的顏色。而這些并不是真正的面部特異性特征,不過系統并不知道這些是無需重點關注的變化,而當成了兩個人來處理。

在上面的動圖中,其實面部已經完全變了,但“源”和“樣式”的明顯標記顯然都得到了保留,例如最底下一排圖片的藍色襯衫。為什么會這樣?請注意,所有這些都是完全可變的,這里說的變量不僅僅是A + B = C,而且A和B的所有方面都可以存在/不存在,具體取決于設置的調整方式。

下面這些由計算機生成的圖像都不是真人。但如果我告訴你這些圖像是真人的照片,你可能也不會懷疑:

這個模型并不完美,但確實有效,而且不僅僅可用于人類,還能用于汽車、貓、風景圖像的生成。

所有這些類型的圖像都或多或少可以單獨隔離出來,再現小型、中型和大型特征的相同范例。

基于風格的生成器架構:生成圖像效果質的飛躍

英偉達研究人員介紹,新的生成器在傳統的分布質量指標方面改進了最先進的技術,使得插值特性明顯變好,并且更好地解決了變量隱因子問題。

傳統生成器架構和基于風格的生成器架構對比

傳統方式中,隱碼(latent code)是通過輸入層提供給生成器的,即前饋網絡的第一層(圖1a)。而英偉達團隊完全省略了輸入層,從一個學習的常量(learned constant)開始,從而脫離了傳統的設計(圖1b,右)。在輸入隱空間Z中,給定一個隱碼z,一個非線性網絡 f:Z→W首先生成w∈W(圖1b,左)。

英偉達團隊的發生器架構可以通過對樣式進行特定尺度的修改來控制圖像合成??梢詫⒂成渚W絡和仿射變換看作是一種從學習分布(learned distribution)中為每種樣式繪制樣本的方法,而將合成網絡看作是一種基于樣式集合生成新圖像的方法。修改樣式的特定子集可能只會影響圖像的某些方面。

樣式混合

英偉達團隊采用混合正則化,其中給定比例的圖像是使用兩個隨機隱碼生成的,而不是一個在訓練期間生成給定百分比的圖像。

在生成這樣的圖像時,只需在合成網絡中隨機選擇的一個點上,從一個隱碼切換到另一個——稱之為樣式混合的操作。

表2顯示了在訓練過程中啟用混合正則化是如何產生顯著改進的,在測試時混合了多個延遲的場景中,改進的FID表明了這一點。

表2

圖3給出了在不同尺度上混合兩個潛碼合成圖像的例子。可以看到,樣式的每個子集控制圖像的高級屬性。

圖3

隨機變化

人類肖像中有許多方面可以被視為隨機的,例如毛發,雀斑或皮膚毛孔的確切位置。只要它們遵循正確的分布,任何這些屬性都可以隨機化而不影響對圖像的感知。

圖4顯示了相同底層圖像的隨機實現,這些圖像是使用具有不同噪聲實現的生成器生成的。

圖4

可以看到,噪聲只影響隨機屬性,使整體組成和身份等高級屬性保持不變。

圖5進一步說明了將隨機變化應用于不同子層的效果。

圖5

整體效應與隨機性的分離

在基于樣式的生成器中,樣式會影響整個圖像,因為完整的特征圖像會被縮放并帶有相同的值。

因此,可以相干地控制姿態、燈光或背景風格等全局效果。同時,噪聲被獨立地添加到每個像素上,因此非常適合于控制隨機變化。

如果網絡試圖控制例如使用噪聲的擺姿,這將導致空間不一致的決定,然后將受到鑒別器的“懲罰”。因此,網絡學會了在沒有明確指導的情況下,適當地使用全局和本地通道(channel)。

兩種自動化方法,任何生成器都能升級

為了量化插值質量和分離,英偉達提出了兩種新的自動化方法,適用于任何生成器體系架構。

研究人員還發布了一個新的面部圖像數據集:數據收集自Flickr上的7萬張面部圖像,數據已經對齊和裁剪。研究人員使用亞馬遜Mechanical Turk來清除雕像、繪畫和其他異常圖像。

鑒于目前此類項目所使用的標準數據集主要是名人走紅毯的照片,本數據集應該能夠提供變化更豐富的面部圖像組合。

這些數據集不久后即將開放下載。

GAN 2.0已經如此,GAN 3.0將會如何?

使用基于風格的生成器的GAN,在各個方面都優于傳統的GAN,可以說是 GAN 2.0。

英偉達團隊相信,對高階屬性與隨機效應分離的研究,以及中間隱空間(intermediate latent space)的線性,將會對提高GAN合成的理解和可控性有很大的幫助。

可以注意到,平均路徑長度度量可以很容易地用作訓練中的正則化器,也許線性可分度量的某些變體也可以作為一個正則化器。

除了人像,GAN 2.0還可以生成房間、汽車等各種場景。有了這個利器,以后何愁圖像數據集?

看著這些計算機生成的“人”,是如此的真實但又虛擬。愛上一個不存在的人,似乎完全合情合理。

總的來說,在訓練期間直接塑造中間隱空間(intermediate latent space)的方法將為未來的工作提供有趣的途徑。

所以,期待一下全新的判別器架構,屆時得到的GAN 3.0,會如何沖擊我們的視覺和認知呢?

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • GaN
    GaN
    +關注

    關注

    19

    文章

    2179

    瀏覽量

    76208
  • 英偉達
    +關注

    關注

    22

    文章

    3924

    瀏覽量

    93139

原文標題:GAN 2.0!英偉達“風格遷移”面部生成器,世間萬物逼真呈現

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦
    熱點推薦

    Deepseek橫空出世!中美AI之間的差距逆轉了嗎?

    DeepSeek的橫空出世確實在中美AI競爭中引起了巨大反響,但要判斷中美AI之間的差距是否因此逆轉,還需從多個維度進行深入分析。 一、技術性能與成本 DeepSeek以其卓越的性能和低廉的成本
    的頭像 發表于 04-15 18:14 ?242次閱讀

    “Quantum Origin”成首個獲NIST驗證的軟件量子隨機數生成器

    -Quantinuum的“Quantum Origin”成為首個通過NIST驗證的軟件量子隨機數生成器 Quantum Origin獲得NIST SP 800-90B對其驗證熵源的批準 增強了聯邦
    的頭像 發表于 04-03 15:22 ?246次閱讀

    EB Tresos狀態顯示無法運行生成器是什么原因導致的?

    我正在嘗試集成 MCAL 包,但在生成過程中收到如下驗證錯誤:“無法為模塊”Dio_TS_T40D2M20I0R0“運行生成器
    發表于 04-02 08:06

    英偉、高通布局AI投資版圖,這些明星企業被收入囊中!

    電子發燒友原創 章鷹 今年以來,AI界新秀DeepSeek帶來的大模型平權推動AI應用,云計算市場景氣度上行,推動資本開支增長。對于DeepSeek的橫空出世,英偉CEO黃仁勛表示,像R1這樣
    的頭像 發表于 03-25 09:22 ?1227次閱讀

    DeepSeek大模型如何推動“AI+物流”融合創新

    在人工智能技術的迭代浪潮中,大模型(Large Language Models, LLM)正從文本生成、圖像創作走向垂直行業賦能。2025年新年,國產 AI 大模型 DeepSeek 橫空出世,憑借其低成本、高精度和多模態能力,迅速成為“新晉網紅”,并在各行各業引發廣泛討
    的頭像 發表于 02-28 16:36 ?595次閱讀

    Python中的迭代器與生成器

    Python迭代器與生成器 列表生成式 列表生成式也叫做列表推導式,它本身還是列表,只不過它是根據我們定義的規則來生成一個真實的列表。 ? ? list2 = [x for x in
    的頭像 發表于 02-20 10:43 ?328次閱讀

    開源隨機數生成器庫OpenRNG助力實現移植到Arm平臺時的最佳性能

    OpenRNG 實現了多種生成器和分布方式。生成器算法可生成“看似隨機”并具有某些統計特性的序列,我們將在下文進行討論。分布方式會將序列映射到常見的概率分布概念,如高斯分布或二項分布
    的頭像 發表于 02-08 09:24 ?1168次閱讀
    開源隨機數<b class='flag-5'>生成器</b>庫OpenRNG助力實現移植到Arm平臺時的最佳性能

    超詳細!FMU生成器用戶手冊來啦~

    FMU生成器是TSMaster中用于將模型打包生成FMU文件的一個工具,目前支持FMI3.0和FMI2.0版本,FMU類型僅支持Co-Simulation(CS),即聯合仿真FMU。本文將介紹FMU
    的頭像 發表于 01-17 20:02 ?756次閱讀
    超詳細!FMU<b class='flag-5'>生成器</b>用戶手冊來啦~

    EE-322:面向SHARC處理器的專家代碼生成器

    電子發燒友網站提供《EE-322:面向SHARC處理器的專家代碼生成器.pdf》資料免費下載
    發表于 01-07 14:04 ?0次下載
    EE-322:面向SHARC處理器的專家代碼<b class='flag-5'>生成器</b>

    微軟攜手英偉與GitHub推出生成式AI加速器

    近日,微軟宣布在英國推出一項重大合作項目——生成式人工智能加速器。這一項目由微軟、英偉和GitHub三家科技巨頭強強聯手,旨在加速生成式人
    的頭像 發表于 11-05 14:58 ?729次閱讀

    使用C2000?嵌入式模式生成器(EPG)進行設計

    電子發燒友網站提供《使用C2000?嵌入式模式生成器(EPG)進行設計.pdf》資料免費下載
    發表于 09-14 10:13 ?1次下載
    使用C2000?嵌入式模式<b class='flag-5'>生成器</b>(EPG)進行設計

    Freepik攜手Magnific AI推出AI圖像生成器

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著AI圖像創作領域邁入了一個全新的高度
    的頭像 發表于 08-30 16:23 ?1505次閱讀

    具有小數分頻器的CDCM6208 2:8時鐘生成器/抖動消除器數據表

    電子發燒友網站提供《具有小數分頻器的CDCM6208 2:8時鐘生成器/抖動消除器數據表.pdf》資料免費下載
    發表于 08-20 09:07 ?0次下載
    具有小數分頻器的CDCM6208 2:8時鐘<b class='flag-5'>生成器</b>/抖動消除器數據表

    英偉Cosmos AI項目曝光:構建先進視頻模型

    于一體的先進視頻模型,這一創新成果將有力支持Omniverse 3D世界生成器、自動駕駛汽車系統及數字人產品等前沿應用的發展。
    的頭像 發表于 08-07 16:51 ?791次閱讀

    TSMaster 測試報告生成器操作指南

    用戶在基于TSMaster軟件開發測試用例時,或需要使用TSMaster生成HTML報告時,需要使用TSMaster測試報告生成器。1Test_Report說明Test_Report是目前
    的頭像 發表于 08-03 08:21 ?940次閱讀
    TSMaster 測試報告<b class='flag-5'>生成器</b>操作指南