女人自慰AV免费观看内涵网,日韩国产剧情在线观看网址,神马电影网特片网,最新一级电影欧美,在线观看亚洲欧美日韩,黄色视频在线播放免费观看,ABO涨奶期羡澄,第一导航fulione,美女主播操b

<dfn id="od0oh"><i id="od0oh"></i></dfn>

<samp id="od0oh"><rt id="od0oh"></rt></samp>

<fieldset id="od0oh"><rp id="od0oh"><thead id="od0oh"></thead></rp></fieldset>

<samp id="od0oh"><i id="od0oh"><nobr id="od0oh"></nobr></i></samp>

<fieldset id="od0oh"></fieldset>

<fieldset id="od0oh"><rp id="od0oh"><dd id="od0oh"></dd></rp></fieldset><samp id="od0oh"><rt id="od0oh"><nobr id="od0oh"></nobr></rt></samp>

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

漲點！FreeMask：用密集標(biāo)注的合成圖像提升分割模型性能

在這里分享一下我們NeurIPS 2023的工作"FreeMask: Synthetic Images with Dense Annotations Make Stronger Segmentation Models"。在本工作中，我們從語義分割的mask產(chǎn)生大量的合成圖像，并利用這些合成的訓(xùn)練圖像以及他們對應(yīng)的mask提升在全量真實數(shù)據(jù)上訓(xùn)練的語義分割模型的性能, e.g., 在ADE20K上，可以將Mask2Former-Swin-T從48.7提升至52.0(+3.3 mIoU)。

代碼：github.com/LiheYoung/FreeMask 論文：https://arxiv.org/abs/2310.15160

在上面的repo中我們也提供了處理過后的ADE20K-Synthetic數(shù)據(jù)集（包含ADE20K的20倍的訓(xùn)練圖像）和COCO-Synthetic數(shù)據(jù)集（包含COCO-Stuff-164K的6倍的訓(xùn)練圖像），以及結(jié)合合成數(shù)據(jù)訓(xùn)練后更好的Mask2Former、SegFormer、Segmenter模型的checkpoints。

TL;DR

不同于以往的一些工作利用合成數(shù)據(jù)提升few-shot performance（只用少量的真實數(shù)據(jù)），我們希望利用合成數(shù)據(jù)直接提升fully-supervised performance（用全量的真實數(shù)據(jù)），這更有挑戰(zhàn)性。

我們利用semantic image synthesis模型來從semantic mask產(chǎn)生diverse的合成圖像。然而，直接將這些合成圖像加入訓(xùn)練，其實并不能提升real-image baseline，反而會損害性能。

因此，我們設(shè)計了一個noise filtering策略以及一個image re-sampling策略來更有效地學(xué)習(xí)合成數(shù)據(jù)，最終在ADE20K（20,210張真實圖像）和COCO-Stuff（164K張真實圖像）的各種模型上都能取得提升。此外，我們發(fā)現(xiàn)結(jié)合我們的策略后，只利用合成數(shù)據(jù)也可以取得和真實數(shù)據(jù)comparable的效果。

Take-home Messages

在全量真實數(shù)據(jù)的基礎(chǔ)上，有效地利用合成數(shù)據(jù)并不容易，需要生成模型足夠好以及設(shè)計合適的學(xué)習(xí)合成數(shù)據(jù)策略。

在初始階段我們嘗試了多個GAN-based從mask生成image的模型 (e.g., OASIS[1])，盡管他們的FID指標(biāo)還不錯，但遷移到真實數(shù)據(jù)集上的表現(xiàn)很差（這里的遷移性能，指在合成數(shù)據(jù)集上訓(xùn)練但在真實驗證集上測試，ADE20K上的mIoU只有～30%）。

基于Stable Diffusion的mask-to-image synthesis model是更好的選擇，如FreestyleNet[2]。

在生成質(zhì)量比較高以及篩選策略比較合理的情況下，joint train合成數(shù)據(jù)和真實數(shù)據(jù)會優(yōu)于先用合成數(shù)據(jù)pre-train再用真實數(shù)據(jù)fine-tune的效果。

Introduction

FreestyleNet基于semantic mask產(chǎn)生的合成圖像，非常diverse以及逼真

Stable Diffusion (SD)等模型已經(jīng)取得了非常好的text-to-image生成效果，過去一年里，semantic image synthesis領(lǐng)域的工作也開始結(jié)合SD的預(yù)訓(xùn)練來從semantic mask生成對應(yīng)的image。其中，我們發(fā)現(xiàn)FreestyleNet[2]的生成效果非常好，如上圖所示。因此，我們希望用這些合成圖像以及他們condition on的semantic mask組成新的合成訓(xùn)練樣本對，加入到原有的真實訓(xùn)練集中，進(jìn)一步提升模型的性能。

簡單的失敗嘗試

我們首先檢查了這些合成圖像到真實圖像的遷移性能，即用合成圖像訓(xùn)練但在真實圖像的驗證集上測試。我們用SegFormer-B4在真實圖像上訓(xùn)練可以取得48.5的測試mIoU，然而用比真實訓(xùn)練集大20倍的合成數(shù)據(jù)訓(xùn)練后，只得到了43.3 mIoU。此外，我們也嘗試混合真實數(shù)據(jù)和合成數(shù)據(jù)（會對真實數(shù)據(jù)上采樣到和合成數(shù)據(jù)一樣多，因為其質(zhì)量更高），然而也只取得了48.2 mIoU，依然落后于僅用真實圖像訓(xùn)練的結(jié)果。

因此，我們希望能更有效地從這些合成數(shù)據(jù)中進(jìn)行學(xué)習(xí)。

Motivation

由于上述合成數(shù)據(jù)的結(jié)果并不好，我們更仔細(xì)地觀察了一下合成數(shù)據(jù)集，發(fā)現(xiàn)其中存在著很多合成錯誤的區(qū)域，如下圖所示的紅色框區(qū)域。這些合成錯誤的區(qū)域加入到訓(xùn)練集中后會嚴(yán)重?fù)p害模型的性能。

紅色框內(nèi)的合成結(jié)果是錯誤的

此外，不同的semantic mask對應(yīng)著不同的場景，不同的場景的學(xué)習(xí)難度其實是不一樣的，因此它們所需的合成訓(xùn)練圖像的數(shù)量也是不一樣的。如下圖所示，大體上來看，從左至右semantic mask對應(yīng)的場景的難度是逐漸增加的，如果對每張mask產(chǎn)生同樣數(shù)量的合成圖像去學(xué)習(xí)的話，那么這些簡單的mask對應(yīng)的圖像就可能會主導(dǎo)模型的學(xué)習(xí)，模型的學(xué)習(xí)效率就會很低。

不同的semantic mask對應(yīng)的場景的難度是不一樣的，大體上來看，從左至右難度逐漸增加

Method

有了上述的兩個motivation，具體的做法是非常簡單的。

Filtering Noisy Synthetic Regions

針對第一點motivation，我們設(shè)計了一個noise filtering的策略，來忽略掉合成錯誤的區(qū)域。具體來說，我們利用一個在真實圖像上訓(xùn)練好的模型去計算每張合成圖像和它對應(yīng)的semantic mask之間的pixel-wise loss，直觀來看，合成錯誤的區(qū)域 (pixels)會呈現(xiàn)比較大的loss。此外，loss的大小也跟不同類別本身的難度有關(guān)。

Hardness-aware Re-sampling

針對第二點motivation，我們設(shè)計了一個hardness-aware re-sampling策略，來讓我們的數(shù)據(jù)合成以及訓(xùn)練更加偏向比較難的場景 (semantic mask)，如下圖所示。

為harder的semantic mask產(chǎn)生更多的合成圖像，而減少簡單的mask的合成圖像

Learning Paradigms

我們探討了兩種從合成圖像中進(jìn)行學(xué)習(xí)的范式，分別是：

Pre-training: 用合成圖像pre-training，然后用真實圖像進(jìn)一步fine-tuning

Joint training: 混合真實圖像和合成圖像（會對真實圖像上采樣到與合成圖像同樣的數(shù)量）一起訓(xùn)練

簡單來說，我們發(fā)現(xiàn)在生成質(zhì)量比較高以及篩選策略比較合理的情況下，joint training的表現(xiàn)會更好一些。

Experiment

對比合成圖像和真實圖像遷移到真實測試集的性能

用真實圖像或合成圖像進(jìn)行訓(xùn)練，并在真實驗證集上測試

可以看到，在多種模型上，用合成圖像遷移到真實驗證集都可以取得和真實訓(xùn)練集comparable的效果。

用合成圖像進(jìn)一步提升全監(jiān)督的分割模型性能

Joint training on ADE20K

當(dāng)加入了合成數(shù)據(jù)后，真實圖像的全監(jiān)督性能獲得了顯著的提升，特別是對于Mask2Former-Swin-T，我們將mIoU從48.7提升至了52.0(+3.3)；對于SegFormer-B4，從48.5提升至了50.6 (+2.1)。

Joint training on COCO-Stuff-164K

COCO-Stuff-164K由于原本的真實數(shù)據(jù)量很大，所以更難提升，但我們在Mask2Former-Swi-T上仍然取得了+1.9 mIoU的提升。

Pre-training with synthetic images on ADE20K

Ablation Studies

我們的noise filtering和hardness-aware re-sampling的必要性

在沒有filtering和re-sampling的情況下，F(xiàn)reestyleNet產(chǎn)生的合成圖像在ADE20K和COCO的真實集上只能得到43.3和48.0的遷移性能，遠(yuǎn)遠(yuǎn)劣于真實訓(xùn)練圖像的遷移性能(ADE20K: 48.5和COCO: 50.5)，而應(yīng)用我們的策略后，純合成圖像的遷移性能可以提升至48.3 (ADE20K)和49.3 (COCO)，十分接近真實訓(xùn)練圖像的表現(xiàn)。

在joint training下，我們的兩項策略也是十分有效的，如果沒有這兩個策略，混合合成圖像和真實圖像只能取得48.2的mIoU （真實圖像：48.5），而加入我們的策略后，可以將真實圖像48.5的baseline提升至50.6。

合成圖像的數(shù)量

Nmax 控制單張mask最多產(chǎn)生多少張合成圖像，在沒有filtering和re-sampling的情況下，增加合成圖像的數(shù)量反而帶來了更差的遷移性能；而在經(jīng)過filtering和re-sampling后，Nmax從6增加到20可以帶來穩(wěn)定的遷移性能的提升。

更多的ablation studies請參考我們的文章。

Conclusion

在本工作中，我們通過從semantic mask產(chǎn)生合成圖像，組成大量的合成訓(xùn)練數(shù)據(jù)對，在ADE20K和COCO-Stuff-164K上顯著提升了多種語義分割模型在全監(jiān)督設(shè)定下的性能。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7239

瀏覽量
90990
圖像

圖像

+關(guān)注

關(guān)注
2

文章
1092

瀏覽量
41016
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1222

瀏覽量
25275

原文標(biāo)題：NeurIPS 2023 | 漲點！FreeMask：用密集標(biāo)注的合成圖像提升分割模型性能

文章出處：【微信號：CVer，微信公眾號：CVer】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

CVer
專欄

0 文章 0 閱讀 0 粉絲 0 點贊

關(guān)注個人主頁

Hot DDFM：首個使用擴散模型進(jìn)行多模態(tài)圖像融合的方法
Hot DepGraph：任意架構(gòu)的結(jié)構(gòu)化剪枝，CNN、Transformer、GNN等都適用！

New SegVG視覺定位方法的各個組件
New 詳解E2E-MFD多模態(tài)融合檢測端到端算法

精選推薦
更多

文章

資料

帖子

射頻前端模塊中使用的集成無源元件技術(shù)

中科院半導(dǎo)體所
11小時前

161 閱讀

鰭式場效應(yīng)晶體管的原理和優(yōu)勢

中科院半導(dǎo)體所
11小時前

164 閱讀

Taro on Harmony C-API 版本正式開源

京東云
12小時前

182 閱讀

Qorvo新型波束成形IC如何應(yīng)對毫米波FWA部署中的挑戰(zhàn)

Qorvo半導(dǎo)體
12小時前

149 閱讀

芯片制造中的化學(xué)鍍技術(shù)研究進(jìn)展

深圳市賽姆烯金科技有限公司
12小時前

222 閱讀

MAST語法規(guī)則簡介

樓斌
157

10積分

57下載

linux嵌入式主要學(xué)什么,學(xué)嵌入式linux，用什么開發(fā)板，請大家推薦一下

硬件工程師1
115.71KB

3積分

17下載

Flapjack監(jiān)控通知路由系統(tǒng)

聽風(fēng)說夢
1.29 MB

免費

0下載

Gryphon加密貨幣交易框架

從未擁有
1.80 MB

2積分

1下載

zendea開源社區(qū)系統(tǒng)

張浩
0.40 MB

免費

0下載

RISC-V開發(fā)板！微五科技CF5010RBT60開發(fā)板免費試用

ElecFans小喇叭
1天前

218 閱讀

ATMEGA16單片機尋跡小車程序及其原理圖

jf_79711045
1天前

193 閱讀

【RA-Eco-RA4M2開發(fā)板評測】UART測試實驗

jf_45191354
1天前

434 閱讀

鴻蒙5開發(fā)寶藏案例分享---一多斷點開發(fā)實踐

jf_83680738
1天前

346 閱讀

大功率開關(guān)管放大器的短路故障親身經(jīng)歷記錄

dgvib
1天前

459 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

華秋（原“華強聚豐”）：

電子發(fā)燒友

華秋開發(fā)

華秋電路(原"華強PCB")

華秋商城(原"華強芯城")

華秋智造

My ElecFans

APP
網(wǎng)站地圖

設(shè)計技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設(shè)備

機器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計資源

設(shè)計技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

華秋電路

華秋商城

華秋智造

nextPCB

BOM配單

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設(shè)計大賽

華秋

關(guān)于我們

投資關(guān)系

新聞動態(tài)

加入我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

硬聲APP

WAP

聯(lián)系我們

廣告合作

王婉珠：[email protected]

內(nèi)容合作

黃晶晶：[email protected]

內(nèi)容合作（海外）

張迎輝：[email protected]

供應(yīng)鏈服務(wù) PCB/IC/PCBA

江良華：[email protected]

投資合作

曾海銀：[email protected]

社區(qū)合作

劉勇：[email protected]

關(guān)注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

電子工程師社區(qū)

1-32層PCB打樣·中小批量

元器件現(xiàn)貨·全球代購·SmartBOM

SMT貼片·PCBA加工

PCB Manufacturer

華秋簡介

企業(yè)動態(tài)

聯(lián)系我們

企業(yè)文化

企業(yè)宣傳片

加入我們

版權(quán)所有 ? 湖南華秋數(shù)字科技有限公司

長沙市望城經(jīng)濟技術(shù)開發(fā)區(qū)航空路6號手機智能終端產(chǎn)業(yè)園2號廠房3層（0731-88081133）
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023018690號-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
久久久久免费看黄a级毛片试看