女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)的StyleGAN僅需小樣本就可以做到圖像到圖像的轉(zhuǎn)換!

DPVg_AI_era ? 來源:lq ? 2019-05-11 09:13 ? 次閱讀

前一陣子英偉達(dá)的StyleGAN可謂是火了一把,近日又出大招了!以往圖像到圖像轉(zhuǎn)換需要大量的圖像做訓(xùn)練樣本,但是在英偉達(dá)的這項(xiàng)工作中,僅需小樣本就可以做到圖像到圖像的轉(zhuǎn)換(代碼已開源)!

小樣本,大成就!

當(dāng)我們看到一只站著的老虎時(shí),我們很容易想象出來它躺著的樣子。

這是因?yàn)槲覀兏鶕?jù)其它動(dòng)物平躺的姿勢就是可以做聯(lián)想。

然而,對于機(jī)器來說就沒有這么簡單了。在現(xiàn)存的非監(jiān)督圖像到圖像轉(zhuǎn)換模型需要大量的訓(xùn)練圖像。

不僅如此,一個(gè)模型能夠轉(zhuǎn)換圖像的另一個(gè)前提是圖像中的對象必須在訓(xùn)練集中存在。

近期,英偉達(dá)、康納爾大學(xué)和阿爾托大學(xué)聯(lián)合發(fā)表了一篇文章——小樣本(few-shot)非監(jiān)督圖像到圖像轉(zhuǎn)換。

論文地址:

https://arxiv.org/pdf/1905.01723.pdf

簡單來說,就是輸入一只金毛,在訓(xùn)練過程當(dāng)中,即便第一次看到一種新動(dòng)物,也能讓它像金毛那樣吐舌頭、閉嘴巴、歪頭。

若是輸入一張炒面的圖,該模型也可以讓其它食物變成炒面。

這項(xiàng)工作還提供了在線測試,新智元小編們便拿自家的貓主子“西瓜”和“多比”做了一下測試:

輸入“西瓜”得到的結(jié)果

輸入“多比”得到的結(jié)果

在線測試連接如下,讀者們快快玩起來吧:

https://nvlabs.github.io/FUNIT/petswap.html

該項(xiàng)目的代碼也已開源,地址如下:

https://github.com/NVlabs/FUNIT

FUNIT:2階段圖像轉(zhuǎn)換,非常有趣!

我們提出的FUNIT框架旨在通過利用在測試時(shí)可用的幾個(gè)目標(biāo)類圖像,將源類的圖像映射到目標(biāo)類的類似圖像。

為了訓(xùn)練FUNIT,我們使用來自一組對象類(例如各種動(dòng)物物種的圖像)中的圖像,稱為源類(source classes)。我們不假設(shè)任何兩個(gè)類之間存在配對的圖像(即,不同物種的任何兩個(gè)動(dòng)物都不會(huì)是完全相同的姿勢)。

我們使用源類里的圖像來訓(xùn)練一個(gè)multi-class無監(jiān)督圖像到圖像轉(zhuǎn)換模型。

在測試過程中,我們從一個(gè)稱為目標(biāo)類(target class)的新對象類中提供少量幾張圖像。模型必須利用少量的目標(biāo)圖像來將源類里的任何圖像轉(zhuǎn)換為目標(biāo)類里的類似圖像。

圖1

訓(xùn)練。訓(xùn)練集由各種對象類(源類)的圖像組成。我們訓(xùn)練了一個(gè)模型在這些源對象類之間轉(zhuǎn)換圖像。

部署。我們向訓(xùn)練模型顯示極少量目標(biāo)類里的圖像,這就足以將源類的圖像轉(zhuǎn)換為目標(biāo)類的類似圖像了,即使模型在訓(xùn)練期間從未見過目標(biāo)類的任何圖像。

需要注意的是,F(xiàn)UNIT生成器有兩個(gè)輸入:1)一個(gè)內(nèi)容圖像;2)一組目標(biāo)類圖像。它的目的是生成與目標(biāo)類圖像相似的輸入圖像的轉(zhuǎn)換。

我們的框架由一個(gè)有條件的圖像發(fā)生器G和一個(gè)多任務(wù)對抗性鑒別器D組成。

與現(xiàn)有無監(jiān)督image-to-image translation框架中有條件的圖像生成器不同,它們是將一張圖像作為輸入,而我們的生成器G需要同時(shí)將一張內(nèi)容圖像x和一組K類圖像{y1, ..., yK}作為輸入,生成輸出圖像xˉ,公式如下:

實(shí)驗(yàn)結(jié)果:姿態(tài)和種類一起轉(zhuǎn)換,超越基準(zhǔn)模型

主要結(jié)果

如表1所示,F(xiàn)UNIT框架在Animal Faces和North American Birds兩個(gè)數(shù)據(jù)集的所有性能指標(biāo)都優(yōu)于用于小樣本無監(jiān)督圖像到圖像轉(zhuǎn)換任務(wù)的基線模型。

FUNIT在Animal Faces數(shù)據(jù)集的1-shot和5-shot設(shè)置上分別達(dá)到82.36和96.05 的Top-5 測試精度,以及在North American Birds數(shù)據(jù)集上分別達(dá)到60.19和75.75的Top-5 測試精度。

這些指標(biāo)都明顯優(yōu)于相應(yīng)的基準(zhǔn)模型。

表1:FUNIT與基線模型的性能比較。↑表示數(shù)值越大越好,↓表示越小越好。

在圖2中,我們對FUNIT-5計(jì)算的few-shot translation的結(jié)果進(jìn)行了可視化。

圖2:無監(jiān)督圖像-圖像轉(zhuǎn)換結(jié)果的可視化。計(jì)算結(jié)果采用FUNIT-5模型。

從上到下分別是來自動(dòng)物面孔、鳥、花和食物數(shù)據(jù)集的結(jié)果。每個(gè)示例隨機(jī)展示了2張目標(biāo)類中的圖像,輸入內(nèi)容圖像x,以及轉(zhuǎn)換后的輸出圖像xˉ。

結(jié)果表明,模型能夠成功地將源類的圖像轉(zhuǎn)換為新的類中的相似圖像。對象在輸入內(nèi)容圖像x和相應(yīng)輸出圖像xˉ中的姿態(tài)基本保持不變。輸出圖像也非常逼真,類似于目標(biāo)類中的圖像。

圖3提供FUNIT與基線模型的結(jié)果比較。可以看到,F(xiàn)UNIT生成了高質(zhì)量的圖像轉(zhuǎn)換輸出。

圖3:小樣本圖像到圖像轉(zhuǎn)換效果的比較。

從左到右的列分別是輸入內(nèi)容圖像x,兩個(gè)輸入目標(biāo)類圖像y1,y2,來自不公平的StarGAN基線的轉(zhuǎn)換結(jié)果,來自公平的StarGAN基線的轉(zhuǎn)換結(jié)果,以及來自FUNIT框架的結(jié)果。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1092

    瀏覽量

    41035
  • 代碼
    +關(guān)注

    關(guān)注

    30

    文章

    4887

    瀏覽量

    70266
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    22

    文章

    3922

    瀏覽量

    93134

原文標(biāo)題:一圖生萬物!英偉達(dá)推超強(qiáng)圖像轉(zhuǎn)換神器,小樣本一秒貓變狗

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    圖像采集卡:現(xiàn)代圖像處理技術(shù)的關(guān)鍵組件

    在現(xiàn)代科技快速發(fā)展的背景下,圖像處理技術(shù)已成為信息技術(shù)領(lǐng)域不可或缺的一部分。圖像采集卡,作為連接計(jì)算機(jī)與各種圖像采集設(shè)備的重要硬件組件,扮演著至關(guān)重要的角色。它不僅涉及圖像信號的
    的頭像 發(fā)表于 02-20 10:42 ?369次閱讀
    <b class='flag-5'>圖像</b>采集卡:現(xiàn)代<b class='flag-5'>圖像</b>處理技術(shù)的關(guān)鍵組件

    圖像采集卡的核心組成與功能

    、GigEVision等),根據(jù)應(yīng)用場景選擇。例如,CameraLink適合工業(yè)高速傳輸,而GigEVision適用于遠(yuǎn)距離需求。模數(shù)轉(zhuǎn)換(ADC):模擬采集
    的頭像 發(fā)表于 02-19 11:27 ?405次閱讀
    <b class='flag-5'>圖像</b>采集卡的核心組成與功能

    AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像

    電子發(fā)燒友網(wǎng)站提供《AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像.pdf》資料免費(fèi)下載
    發(fā)表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將3D<b class='flag-5'>圖像</b><b class='flag-5'>轉(zhuǎn)換</b>成2D<b class='flag-5'>圖像</b>

    傅立葉變換在圖像處理中的作用

    傅里葉變換在圖像處理中發(fā)揮著至關(guān)重要的作用。以下是傅里葉變換在圖像處理中的幾個(gè)主要作用: 一、圖像增強(qiáng)與去噪 去噪 :圖像中的噪聲通常表現(xiàn)為高頻分量。通過傅里葉變換,
    的頭像 發(fā)表于 12-06 16:55 ?2000次閱讀

    百問FB顯示開發(fā)圖像處理 - 圖像調(diào)整

    的坐標(biāo)就可以了。 旋轉(zhuǎn)后的圖像的長和寬會(huì)發(fā)生變化,因此要計(jì)算新圖像的長和寬。 由幾何關(guān)系可知,新圖像的長和寬分別是旋轉(zhuǎn)后,對角坐標(biāo)相見后的最大值 2.4.2.2 源碼編寫:
    發(fā)表于 12-02 09:34

    百問FB顯示開發(fā)圖像處理 - JPEG圖像處理

    參數(shù) jpeg_read_header(&cinfo, TRUE); 當(dāng)調(diào)用完這個(gè)參數(shù)之后,我們就可以通過cinfo中的image_width,image_height等成員來獲得
    發(fā)表于 11-28 13:57

    英偉達(dá)超越蘋果成為市值最高 英偉達(dá)取代英特爾加入道指

    在AI浪潮下英偉達(dá)被各路資本競相追逐,2024年英偉達(dá)公司的股價(jià)累計(jì)上漲高達(dá)180%。在11月4日,英偉
    的頭像 發(fā)表于 11-05 15:22 ?717次閱讀

    圖像傳感器的原理是什么?

    圖像傳感器是一種將光信號轉(zhuǎn)換為電信號的設(shè)備,廣泛應(yīng)用于攝影、視頻監(jiān)控、醫(yī)學(xué)成像、天文觀測等領(lǐng)域。圖像傳感器的原理涉及光電效應(yīng)、電荷存儲(chǔ)、信號放大、模數(shù)
    的頭像 發(fā)表于 10-12 10:48 ?1391次閱讀

    英偉達(dá)推出Eagle系列模型

    英偉達(dá)最新推出的Eagle系列模型,以其1024×1024像素的高分辨率處理能力,重新定義了視覺信息處理的邊界。該模型通過多專家視覺編碼器架構(gòu),每個(gè)編碼器專注于特定任務(wù)訓(xùn)練,極大地增強(qiáng)了圖像理解的深度和廣度。這一創(chuàng)新不僅提升了
    的頭像 發(fā)表于 09-03 16:13 ?768次閱讀

    英偉達(dá)Blackwell架構(gòu)揭秘:下一個(gè)AI計(jì)算里程碑?# 英偉達(dá)# 英偉達(dá)Blackwell

    英偉達(dá)行業(yè)資訊
    jf_02331860
    發(fā)布于 :2024年08月26日 10:58:09

    DSP教學(xué)實(shí)驗(yàn)箱_數(shù)字圖像處理操作_案例分享:5-13 灰度圖像二值化

    一比較就可以了。 程序流程 程序流程設(shè)計(jì)中首先讀取工程目錄下的BMP圖像,接著進(jìn)行二值化處理,最后保存圖像。 三、操作現(xiàn)象 實(shí)驗(yàn)設(shè)備 本實(shí)驗(yàn)所需硬件為實(shí)驗(yàn)板、仿真器、LCD和電源。 先來了解一下DSP
    發(fā)表于 07-25 15:03

    英偉達(dá)TITAN AI顯卡曝光,性能狂超RTX 4090達(dá)63%!# 英偉達(dá)# 顯卡

    顯卡英偉達(dá)
    jf_02331860
    發(fā)布于 :2024年07月24日 17:18:28

    圖像識(shí)別技術(shù)的原理是什么

    圖像識(shí)別技術(shù)是一種利用計(jì)算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)對圖像進(jìn)行分析和理解的技術(shù)。它可以幫助計(jì)算機(jī)識(shí)別和理解圖像中的對象、場景和活動(dòng)。 圖像預(yù)處理
    的頭像 發(fā)表于 07-16 10:46 ?2325次閱讀

    FPGA設(shè)計(jì)經(jīng)驗(yàn)之圖像處理

    可以說是類似于CPU里面的Cache,但Cache不是你能完全控制的,但Block Ram是完全可控的,可以用它實(shí)現(xiàn)各種靈活的運(yùn)算處理。這樣FPGA通過緩存若干行圖像數(shù)據(jù)就可以
    發(fā)表于 06-12 16:26