女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌大腦打造“以一當(dāng)十”的GAN:僅用10%標(biāo)記數(shù)據(jù),生成圖像卻更逼真

DPVg_AI_era ? 來源:YXQ ? 2019-03-22 08:53 ? 次閱讀

近日,谷歌大腦研究人員提出了一種基于自監(jiān)督和半監(jiān)督學(xué)習(xí)的“條件GAN”,使用的標(biāo)記數(shù)據(jù)量大降90%,生成圖像的質(zhì)量比現(xiàn)有全監(jiān)督最優(yōu)模型BigGAN高出20%(以FID得分計),有望緩解圖像生成和識別領(lǐng)域標(biāo)記數(shù)據(jù)量嚴(yán)重不足的問題。

生成對抗網(wǎng)絡(luò)(GAN)是一類強(qiáng)大的深度生成模型。GAN背后的主要思想是訓(xùn)練兩個神經(jīng)網(wǎng)絡(luò):生成器負(fù)責(zé)學(xué)習(xí)如何合成數(shù)據(jù),而判別器負(fù)責(zé)學(xué)習(xí)如何區(qū)分真實數(shù)據(jù)與生成器合成的虛假數(shù)據(jù)。目前,GAN已成功用于高保真自然圖像合成,改善學(xué)習(xí)圖像壓縮質(zhì)量,以及數(shù)據(jù)增強(qiáng)等任務(wù)。

對于自然圖像合成任務(wù)來說,現(xiàn)有的最優(yōu)結(jié)果是通過條件GAN實現(xiàn)的。與無條件GAN不同,條件GAN在訓(xùn)練期間要使用標(biāo)簽(比如汽車,狗等)。雖然數(shù)據(jù)標(biāo)記讓圖像合成任務(wù)變得更容易實現(xiàn),在性能上獲得了顯著提升,但是這種方法需要大量標(biāo)記數(shù)據(jù),而在實際任務(wù)中很少有大量標(biāo)記數(shù)據(jù)可用。

隨著ImageNet上訓(xùn)練過程的持續(xù),生成的圖像逼真度進(jìn)步明顯

谷歌大腦的研究人員在最近的《用更少的數(shù)據(jù)標(biāo)簽生成高保真圖像》中,提出了一種新方法來減少訓(xùn)練最先進(jìn)條件GAN所需的標(biāo)記數(shù)據(jù)量。文章提出結(jié)合大規(guī)模GAN的最新進(jìn)展,將高保真自然圖像合成技術(shù)與最先進(jìn)技術(shù)相結(jié)合,使數(shù)據(jù)標(biāo)記數(shù)量減少到原來的10%。

在此基礎(chǔ)上,研究人員還發(fā)布了Compare GAN庫的重大更新,其中包含了訓(xùn)練和評估現(xiàn)代GAN所需的所有組件。

利用半監(jiān)督和自監(jiān)督方式提升預(yù)測性能

條件GAN與基線BigGAN的FID分?jǐn)?shù)對比,圖中黑色豎線為BigGAN基線模型(使用全部標(biāo)記數(shù)據(jù))得分。S3GAN在僅使用10%標(biāo)記數(shù)據(jù)的情況下,得分比基線模型最優(yōu)得分高20%

在條件GAN中,生成器和判別器通常都以分類標(biāo)簽為應(yīng)用條件。現(xiàn)在,研究人員建議使用推斷得出的數(shù)據(jù)標(biāo)簽,來替換手工標(biāo)記的真實標(biāo)簽。

上行:BigGAN全監(jiān)督式學(xué)習(xí)生成的128×128像素最優(yōu)圖像樣本。下行為S3GAN生成的圖像樣本,標(biāo)記數(shù)據(jù)量降低了90%,F(xiàn)ID得分與BigGAN表現(xiàn)相當(dāng)

為了推斷大型數(shù)據(jù)集中多數(shù)未標(biāo)記數(shù)據(jù)的高質(zhì)量標(biāo)簽,可以采取兩步方法:首先,僅使用數(shù)據(jù)集的未標(biāo)記部分來學(xué)習(xí)特征表示。

為了學(xué)習(xí)特征表示,需要利用新方法,以不同的方法利用自我監(jiān)督機(jī)制:將未標(biāo)記的圖像進(jìn)行隨機(jī)旋轉(zhuǎn),由深度卷積神經(jīng)網(wǎng)絡(luò)負(fù)責(zé)預(yù)測旋轉(zhuǎn)角度。這背后的思路是,模型需要能夠識別主要對象及其形狀,才能在此類任務(wù)中獲得成功。

對一幅未標(biāo)記的圖像進(jìn)行隨機(jī)旋轉(zhuǎn),網(wǎng)絡(luò)的任務(wù)是預(yù)測旋轉(zhuǎn)角度。成功的模型需要捕捉有意義的語義圖像特征,這些特征可用于完成其他視覺任務(wù)

研究人員將訓(xùn)練網(wǎng)絡(luò)的一個中間層的激活模式視為輸入的新特征表示,并訓(xùn)練分類器,以使用原始數(shù)據(jù)集的標(biāo)記部分識別該輸入的標(biāo)簽。由于網(wǎng)絡(luò)經(jīng)過預(yù)訓(xùn)練,可以從數(shù)據(jù)中提取具有語義意義的特征,因此,訓(xùn)練此分類器比從頭開始訓(xùn)練整個網(wǎng)絡(luò)更具樣本效率。最后使用分類器對未標(biāo)記的數(shù)據(jù)進(jìn)行標(biāo)記。

為了進(jìn)一步提高模型質(zhì)量和訓(xùn)練的穩(wěn)定性,最好讓判別器網(wǎng)絡(luò)學(xué)習(xí)有意義的特征表示。通過這些改進(jìn)手段,在加上大規(guī)模的訓(xùn)練,使得新的條件GAN在ImageNet圖像合成任務(wù)上達(dá)到了最優(yōu)性能。

給定潛在向量,由生成器網(wǎng)絡(luò)生成圖像。在每行中,最左側(cè)和最右側(cè)圖像的潛在代碼之間的線性插值導(dǎo)致圖像空間中的語義插值

CompareGAN:用于訓(xùn)練和評估GAN的庫

對GAN的前沿研究在很大程度上依賴于經(jīng)過精心設(shè)計和測試的代碼庫,即使只是復(fù)制或再現(xiàn)先前的結(jié)果和技術(shù),也需要付出巨大努力。

為了促進(jìn)開放科學(xué)并讓研究界從最近的進(jìn)步中獲益,研究人員發(fā)布了Compare GAN庫的重大更新。該庫包括現(xiàn)代GAN中常用的損失函數(shù),正則化和歸一化方案,神經(jīng)架構(gòu)和量化指標(biāo),現(xiàn)已支持:

GPU和TPU訓(xùn)練

通過Gin進(jìn)行輕量級配置(含實例)

通過TensorFlow數(shù)據(jù)集庫提供大量數(shù)據(jù)集

未來方向:自監(jiān)督學(xué)習(xí)會讓GAN更強(qiáng)大

由于標(biāo)記數(shù)據(jù)源和未標(biāo)記數(shù)據(jù)源之間的差距越來越大,讓模型具備從部分標(biāo)記的數(shù)據(jù)中學(xué)習(xí)的能力變得越來越重要。

目前來看,自監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)的簡單而有力的結(jié)合,有助于縮小GAN的這一現(xiàn)實差距。自監(jiān)督是一個值得研究的領(lǐng)域,值得在該領(lǐng)域開展面向其他生成建模任務(wù)的研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6223

    瀏覽量

    107535
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    19

    文章

    2177

    瀏覽量

    76174

原文標(biāo)題:谷歌大腦打造“以一當(dāng)十”的GAN:僅用10%標(biāo)記數(shù)據(jù),生成圖像卻更逼真

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    利用NVIDIA 3D引導(dǎo)生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進(jìn),從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在
    的頭像 發(fā)表于 06-05 09:24 ?190次閱讀

    Gemini API集成Google圖像生成模型Imagen 3

    開發(fā)者現(xiàn)在可以通過 Gemini API 訪問 Google 最先進(jìn)的圖像生成模型 Imagen 3。該模型最初僅對付費(fèi)用戶開放,不久后也將面向免費(fèi)用戶推出。
    的頭像 發(fā)表于 05-14 16:53 ?299次閱讀

    技術(shù)分享 | 高逼真合成數(shù)據(jù)助力智駕“看得更準(zhǔn)、學(xué)得更快”

    自動駕駛研發(fā)如何高效獲取海量訓(xùn)練數(shù)據(jù)?高逼真合成數(shù)據(jù)技術(shù)正在提供新解法。通過仿真平臺可生成多場景、多傳感器的精準(zhǔn)標(biāo)注數(shù)據(jù)。文章詳解如何構(gòu)建符
    的頭像 發(fā)表于 04-29 10:47 ?2740次閱讀
    技術(shù)分享 | 高<b class='flag-5'>逼真</b>合成<b class='flag-5'>數(shù)據(jù)</b>助力智駕“看得更準(zhǔn)、學(xué)得更快”

    如何使用離線工具od SPSDK生成完整圖像

    SDSDK)會生成個缺少前 4KB 的文件。 這些將由 flashloader 直接在目標(biāo)上填充,使用將要傳達(dá)給它的參數(shù),對吧? 我需要離線工作。我需要生成個 “完整
    發(fā)表于 03-28 06:51

    ?Diffusion生成式動作引擎技術(shù)解析

    Diffusion生成式動作引擎 Diffusion生成式動作引擎是種基于擴(kuò)散模型(Diffusion Models)的生成式人工智能技術(shù),專注于
    的頭像 發(fā)表于 03-17 15:14 ?1592次閱讀

    使用DLPC350投射格雷碼時,當(dāng)切換pattern頻率&gt;10frame/s,出現(xiàn)了圖像重疊的問題怎么解決?

    你好,我在使用DLPC350 投射格雷碼(8bit深度)時,當(dāng) 切換pattern頻率 &gt; 10frame/s,出現(xiàn)了圖像錯誤或者說 圖像重疊的問題: 從
    發(fā)表于 02-21 16:03

    管廊、排澇、路燈接入數(shù)據(jù)中臺助力打造“智慧城市大腦

    問題,往往不能快速高效形成對城市宏觀層面的科學(xué)決策,嚴(yán)重制約城市智慧化發(fā)展步伐。 通過將管廊、排澇、路燈等系統(tǒng)接入數(shù)據(jù)中臺,無疑是打造“智慧城市大腦”的重要環(huán)。這
    的頭像 發(fā)表于 01-20 17:25 ?319次閱讀
    管廊、排澇、路燈接入<b class='flag-5'>數(shù)據(jù)</b>中臺助力<b class='flag-5'>打造</b>“智慧城市<b class='flag-5'>大腦</b>”

    借助谷歌Gemini和Imagen模型生成高質(zhì)量圖像

    在快速發(fā)展的生成式 AI 領(lǐng)域,結(jié)合不同模型的優(yōu)勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細(xì)且富有創(chuàng)意的提示,然后使用 Imagen 3 模型根據(jù)這些提示生成高質(zhì)量的圖像
    的頭像 發(fā)表于 01-03 10:38 ?813次閱讀
    借助<b class='flag-5'>谷歌</b>Gemini和Imagen模型<b class='flag-5'>生成</b>高質(zhì)量<b class='flag-5'>圖像</b>

    谷歌:超四分之新代碼由人工智能生成

    10月30日最新消息顯示,谷歌正積極投身于系列人工智能產(chǎn)品的開發(fā)中,并且在其構(gòu)建過程中,人工智能也扮演著舉足輕重的角色。谷歌首席執(zhí)行官桑達(dá)爾?皮查伊在公司2024年第三季度財報電話會
    的頭像 發(fā)表于 10-30 15:13 ?680次閱讀

    生成式AI工具作用

    生成式AI工具是指那些能夠自動生成文本、圖像、音頻、視頻等多種類型數(shù)據(jù)的人工智能技術(shù)。在此,petacloud.ai小編為您整理生成式AI工
    的頭像 發(fā)表于 10-28 11:19 ?640次閱讀

    霍尼韋爾攜手谷歌云,在工業(yè)領(lǐng)域引入生成式AI Gemini

    10月21日新聞,霍尼韋爾(Honeywell)攜手谷歌云(Google Cloud)達(dá)成合作,旨在將生成式人工智能Gemini引入工業(yè)領(lǐng)域,共同推動工業(yè)智能化進(jìn)程。
    的頭像 發(fā)表于 10-23 14:20 ?623次閱讀

    高通與谷歌達(dá)成多年技術(shù)合作,共推汽車行業(yè)數(shù)字化轉(zhuǎn)型

    北京時間10月23日,高通技術(shù)公司宣布與谷歌達(dá)成項為期多年的技術(shù)合作,旨在加速c行業(yè)的數(shù)字化轉(zhuǎn)型。   基于雙方長期的合作關(guān)系,高通和谷歌將共同利用驍龍數(shù)字底盤、Android
    的頭像 發(fā)表于 10-23 11:53 ?1375次閱讀

    沃達(dá)豐與谷歌深化年戰(zhàn)略合作

    沃達(dá)豐近日宣布,其與全球科技巨頭谷歌的戰(zhàn)略合作伙伴關(guān)系得到了進(jìn)步深化。這為期年的協(xié)議,總價值超過10億美元,旨在將
    的頭像 發(fā)表于 10-09 16:22 ?468次閱讀

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設(shè)計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這里程碑式的發(fā)布標(biāo)志著AI圖像創(chuàng)作領(lǐng)域邁入了
    的頭像 發(fā)表于 08-30 16:23 ?1493次閱讀

    深入理解渲染引擎:打造逼真圖像的關(guān)鍵

    在數(shù)字世界中,圖像渲染是創(chuàng)造逼真視覺效果的核心技術(shù)。渲染引擎,作為這過程中的關(guān)鍵組件,負(fù)責(zé)將二維或三維的模型、紋理、光照等數(shù)據(jù)轉(zhuǎn)化為人們?nèi)庋劭梢姷亩S
    的頭像 發(fā)表于 06-29 08:28 ?594次閱讀
    深入理解渲染引擎:<b class='flag-5'>打造</b><b class='flag-5'>逼真</b><b class='flag-5'>圖像</b>的關(guān)鍵