本文提出一種有效的基于視覺Transformer的弱監(jiān)督視頻異常檢測架構(gòu)來實(shí)現(xiàn)精準(zhǔn)檢測結(jié)直腸息肉。這也是首篇利用弱監(jiān)督視頻標(biāo)簽來進(jìn)行腸息肉檢測的研究, 文章基于之前數(shù)據(jù)集整理合并提出了一個(gè)全新的大型結(jié)直腸視頻數(shù)據(jù)集用于息肉檢測的研究。性能表現(xiàn)SOTA!代碼和數(shù)據(jù)即將開源!
結(jié)直腸鏡是一種有效的檢測手段來早起篩查結(jié)直腸癌。然后, 在腸鏡過程中醫(yī)生往往會遺漏細(xì)小的不引人注意的腸息肉, 給病人的健康留下嚴(yán)重的隱患。所以利用AI系統(tǒng)來輔助醫(yī)生精準(zhǔn)檢測是十分重要的。
比較常用的方法是利用全監(jiān)督的方法來逐幀標(biāo)注。這種方法需要專業(yè)醫(yī)生很多的精力和時(shí)間, 所以之前的論文通常利用無監(jiān)督異常檢測來解決。無監(jiān)督異常檢測只需要利用正常數(shù)據(jù)來進(jìn)行訓(xùn)練, 然后通過對比正常和異常的特征區(qū)別達(dá)到檢測腸息肉的功能。這些工作因?yàn)闆]有利用異常數(shù)據(jù)訓(xùn)練 往往很容易忽略掉很多微笑的或者只有部分可見的腸息肉。所以本文首次提出利用弱監(jiān)督視頻異常檢測的方法來解決這個(gè)問題, 即只使用視頻級的標(biāo)注而不需要逐幀標(biāo)注。這樣做大大減少了標(biāo)注的繁瑣過程和時(shí)間 并且能夠有效的檢測細(xì)微不引人注意的息肉。
之前的弱監(jiān)督視頻異常檢測方法通常利用multiple instance learning, 即正常視頻中所有幀視為正常幀, 異常視頻內(nèi)至少有一或多幀為異常。基于MIL的方法經(jīng)常很難準(zhǔn)確檢測出異常視頻中哪一幀存在異常, 尤其是當(dāng)異常幀和正常幀很像的時(shí)候。
在這篇文章, 我們首次探索了利用弱監(jiān)督異常檢測如何在結(jié)腸鏡視頻中檢測異常幀 通過一個(gè)新穎的基于視覺transformer的架構(gòu)。為了evaluate我們方法的準(zhǔn)確性, 我們整理了已知的幾種結(jié)腸鏡數(shù)據(jù)集 整合成了一個(gè)大型的視頻結(jié)腸鏡數(shù)據(jù)集來測試弱監(jiān)督和全監(jiān)督視頻幀異常檢測。這個(gè)新數(shù)據(jù)集為后面的研究提供一個(gè)全新的benchmark去測試和發(fā)展。
實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)結(jié)果表明,我們的方法在這個(gè)全新的結(jié)腸鏡視頻數(shù)據(jù)集上明顯優(yōu)于其他網(wǎng)絡(luò)。例如, 我們的方法超過RTFM和MIST 10%-15% AP, 證明了方法的穩(wěn)定性和準(zhǔn)確性。
下圖可以看出我們方法可以有效的降低正常幀的異常分?jǐn)?shù)并且提高異常幀(帶息肉)的異常分?jǐn)?shù)。
-
檢測
+關(guān)注
關(guān)注
5文章
4604瀏覽量
92532 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1222瀏覽量
25275 -
Transformer
+關(guān)注
關(guān)注
0文章
148瀏覽量
6391
原文標(biāo)題:MICCAI 2022 | 基于對比學(xué)習(xí)和視覺Transformer的弱監(jiān)督視頻腸息肉檢測
文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
基于transformer和自監(jiān)督學(xué)習(xí)的路面異常檢測方法分享

基于深度學(xué)習(xí)的異常檢測的研究方法
基于深度學(xué)習(xí)的異常檢測的研究方法
基于視頻的智能交通異常檢測系統(tǒng)

基于隱馬爾可夫模型的視頻異常檢測模型

智能監(jiān)控視頻異常事件檢測

淺談機(jī)器學(xué)習(xí)中的異常檢測應(yīng)用

如何使用Transformer來做物體檢測?

基于車輛軌跡特征的視頻異常事件檢測算法
使用跨界模型Transformer來做物體檢測!

使用MATLAB進(jìn)行異常檢測(上)
使用MATLAB進(jìn)行異常檢測(下)
基于 Transformer 的分割與檢測方法

哈工大提出Myriad:利用視覺專家進(jìn)行工業(yè)異常檢測的大型多模態(tài)模型

語言模型的弱監(jiān)督視頻異常檢測方法

評論