昨天,百度研究院宣布他們開發(fā)了一種深度學(xué)習(xí)算法,在檢測乳腺癌的微轉(zhuǎn)移方面超過了人類病理學(xué)醫(yī)生的表現(xiàn)。以下是論智對該項目的編譯報道。
癌癥是目前醫(yī)學(xué)領(lǐng)域的重大挑戰(zhàn)之一,應(yīng)對癌癥最有效的方法之一就是早發(fā)現(xiàn)、早治療,這對提高病人的生存率有著重要意義。早期檢測的主要方法就是檢查淋巴結(jié)是否有癌細胞的微轉(zhuǎn)移。目前,對活組織檢查的病理研究通常被視作金標準。然而,檢查病理片子也并不容易,很多時候需要經(jīng)驗豐富的病理醫(yī)生進行診斷。放大40倍的數(shù)字化病理圖片通常含有數(shù)十億個像素,可能會占用好幾個G的磁盤空間。在這些大型文件里,病理醫(yī)生們有時還需要找到癌癥的微轉(zhuǎn)移,或者象征癌癥早期的小范圍腫瘤細胞。這些腫瘤細胞群的直徑可能還不到1000個像素。所以想在醫(yī)學(xué)影像中不放過任何細微并且有價值的標記,是非常復(fù)雜且耗時的工作。如下圖,就展示了這一過程的難度。
注:在放大40倍的數(shù)字化病理圖像中,一個像素約為0.243微米。而微轉(zhuǎn)移的判斷標準通常為最大直徑為200微米以上的腫瘤細胞群,大約相當(dāng)于823個像素。
目前為止,有許多科學(xué)家提出用基于深度學(xué)習(xí)的算法幫助病理醫(yī)生進行醫(yī)學(xué)影像分析,檢測癌癥是否轉(zhuǎn)移。由于原始電子影像體積非常大,大多數(shù)算法目前只是將影像分割成更小的圖像塊,例如256×256像素的小圖。之后,人們會訓(xùn)練一個深度卷積神經(jīng)網(wǎng)絡(luò),將包含腫瘤細胞的圖像和正常組織圖像區(qū)分開來。但是,有些時候如果不參考周圍的組織,就很難判斷某張圖片中是否含有腫瘤細胞,誤報也會經(jīng)常出現(xiàn)。下圖就是這樣難以判斷的例子:
最近,百度研究院的科學(xué)家們提出了一種新的深度學(xué)習(xí)算法,在輸入時不只輸入單一的圖像,而是將其分割成網(wǎng)格狀,連同周圍的圖像一同作為輸入,用神經(jīng)條件隨機場(NCRF)對周圍圖像的空間關(guān)系進行建模,預(yù)測它們是腫瘤細胞還是正常細胞。這種技術(shù)可以看做是病理醫(yī)生將醫(yī)學(xué)影像縮小,視野進一步擴大,從而能做出更可靠的判斷。相鄰幾張圖片之間的空間關(guān)系通過一種特殊的概率圖形模型進行建模,該模型成為“條件隨機場(conditional random fields)”。而整個深度學(xué)習(xí)框架可以在端到端GPU上進行訓(xùn)練,并且不需要任何后期處理。
算法的基本架構(gòu)如下圖所示:
NCRF有兩個主要部分組成:CNN和CRF。CNN主要作為特征提取器,將網(wǎng)格一樣的圖像輸入CNN中后,它會將每個圖像塊編碼成固定長度的向量表示(即嵌入)。這些嵌入之后被輸入到CRF中,并對它們的空間關(guān)系進行建模。CRF最后輸出的是每個圖像塊的邊緣分布(marginal distribution),用來表示這是正常組織還是腫瘤細胞的圖像。
在實驗過程中,百度所提出的NCRF方法與其他沒有CRF的傳統(tǒng)算法有三點不同:
NCRF有著更光滑的概率圖,其中邊界更清晰
NCRF的分類準確度更高
NCRF在檢測癌癥轉(zhuǎn)移時,比普通方法表現(xiàn)得更好
通過分析相鄰圖像間的空間關(guān)系,研究人員所提的算法產(chǎn)生的誤報率更少。下圖展示了該算法所預(yù)測出的腫瘤區(qū)域,以及和之前不考慮相鄰區(qū)域的算法之間的對比。可以看到基于NCRF的算法有更少的誤報情況:
(a)原始影像圖片;(b)經(jīng)過病理醫(yī)生標注過的圖像,白色區(qū)域表示腫瘤細胞轉(zhuǎn)移;(c)傳統(tǒng)算法預(yù)測的腫瘤區(qū)域;(d)我們的算法預(yù)測的腫瘤區(qū)域
第二,NCRF通過在訓(xùn)練時結(jié)合周圍圖像之間的空間關(guān)系,提高了CNN特征提取器的準確度。下圖顯示了在ResNet-18架構(gòu)上,傳統(tǒng)方法和NCRF方法的不同。
可以看到,NCRF在訓(xùn)練時的精確度比傳統(tǒng)方法要高。
另外,在評估NCRF檢測腫瘤轉(zhuǎn)移性能的實驗上,研究人員得到了以下結(jié)果:
最后,在Camelyon16挑戰(zhàn)賽的測試集上,該算法在腫瘤定位分數(shù)(FROC)上取得了0.8096的成績,不僅比上一次挑戰(zhàn)賽的冠軍算法(0.8074)優(yōu)秀,還比一位專業(yè)病理學(xué)醫(yī)生更準確(0.7240)。目前,這一算法已經(jīng)在GitHub上開源,希望能促進AI在病理分析的發(fā)展。
這項新的腫瘤檢測算法能讓醫(yī)生更多的關(guān)注算法高亮區(qū)域,而不是大海撈針似的在整幅圖像中搜尋腫瘤的痕跡。這對于提高病理檢測的效率和準確性都有重要意義。未來我們將在更大的數(shù)據(jù)集上系統(tǒng)地評估這一算法,并且嘗試使用大于3×3的圖像網(wǎng)格作為輸入,因為它能應(yīng)對更大的接受域,并能在癌癥轉(zhuǎn)移檢測中表現(xiàn)出更好地性能。
-
百度
+關(guān)注
關(guān)注
9文章
2326瀏覽量
91821 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5554瀏覽量
122484
發(fā)布評論請先 登錄
百度在AI領(lǐng)域的最新進展
上汽大眾與百度地圖達成戰(zhàn)略合作
百度地圖與雅迪推出組合屏智能導(dǎo)航解決方案
請問AFE4400 SPO2精度和準確率如何?
百度百科啟動“繁星計劃”
百度正式回應(yīng)進軍短劇領(lǐng)域
如何提升人臉門禁一體機的識別準確率?

評論