圖像分割是計算計視覺研究中的經典難題,已成為圖像理解領域關注的一個熱點,
圖像分割作為圖像技術領域的一個經典難題,自上世紀七十年代以來吸引了眾多研究人員的研究熱情并為之付出了巨大努力,提出了很多圖像分割算法。這些分割算法分割性能的優劣,是用相關圖像分割質量測度來進行評價的。但由于對算法分割是否成功的客觀判定標準至今未得到解決,因此圖像分割算法分割質量得評價成為一項頗具研究意義的課題。有關圖像分割評價的方法已有少數的初步探討,但目前仍未有很好的歸納和整理。這不僅和圖像分割技術的研究應用現狀不相稱,也不利于圖像分割技術的發展。
圖像分割是圖像分析的第一步,是計算機視覺的基礎,是圖像理解的重要組成部分,同時也是圖像處理中最困難的問題之一。所謂圖像分割是指根據灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個互不相交的區域,使得這些特征在同一區域內表現出一致性或相似性,而在不同區域間表現出明顯的不同。簡單的說就是在一副圖像中,把目標從背景中分離出來。對于灰度圖像來說,區域內部的像素一般具有灰度相似性,而在區域的邊界上一般具有灰度不連續性。 關于圖像分割技術,由于問題本身的重要性和困難性,從20世紀70年代起圖像分割問題就吸引了很多研究人員為之付出了巨大的努力。雖然到目前為止,還不存在一個通用的完美的圖像分割的方法,但是對于圖像分割的一般性規律則基本上已經達成的共識,已經產生了相當多的研究成果和方法。
圖像分割是指將圖像中感興趣區域(ROI)的邊界找到,使得邊界內部和外部的像素分別具備相似的特征(強度、紋理等)。醫學圖像分割是對醫學圖像進行其他后續處理的基礎。對圖像中目標區域的準確分割對于計算機輔助診斷、制訂手術計劃、目標3維重建以及放射性治療評價等都具有重要意義。近幾十年來,隨著醫學成像設備的不斷完善,醫學圖像的分割算法也層出不窮,但是很少能夠在臨床上得到廣泛應用。用一個全面的醫學圖像數據集合來客觀評價醫學圖像分割算法是將該算法向臨床應用推進的關鍵一步
傳統的圖像分割方法
基于閥值的圖像分割方法
閥值分割法是一種傳統的圖像分割方法,因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和應用最廣泛的分割技術。閥值分割法的基本原理是通過設定不同的特征閥值,把圖像像素點分為具有不同灰度級的目標區域和背景區域的若干類。它特別適用于目標和背景占據不同灰度級范圍的圖,目前在圖像處理領域被廣泛應用,其中閥值的選取是圖像閥值分割中的關鍵技術。
灰度閥值分割方法是一種最常用的并行區域技術,是圖像分割中應用數量最多的一類。圖像若只用目標和背景兩大類,那么只需要選取一個閥值,此分割方法稱為單閥值分割。單閥值分割實際上是輸入圖像f到輸出圖像g的如下變換:
在上述表達式中,T為閥值,對于目標物體的圖像元素g(i,j)=1,對于背景的圖像元素g(i,j)=0。但是如果圖像中有多個目標需要提取,單一的閥值分割就會出錯。就需要選取多個閥值將每個目標分割開,這種分割方法稱為多閥值分割。
閥值分割的結果取決于閥值的選擇。由此可見,閥值分割算法的關鍵是確定閥值。閥值確定后,將閥值與像素點的灰度值比較以及對各像素的分割并行地進行。常用的閥值選擇方法有利用圖像灰度直方圖的峰谷法、最小誤差法、基于過渡區法、利用像素點空間位置信息的變化閥值法、結合連通信息的閥值方法、最大相關性原則選擇閥值和最大熵原則自動閥值法。
圖1是利用單閥值方法和局部閥值方法對細胞圖像分隔的結果,結果表明,在很多情況下,目標物體和背景的對比度在圖像的不同位置并不是一樣的,這是如果用一個統一的單閥值將目標與背景分開,效果是不理想的。如果根據圖像的局部特征分別用不同的閥值對圖像進行分割,即局部閥值分割,則效果要比單閥值分割要好得多。
閥值分割方法的優點是圖像分割的速度快,計算簡單,效率較高。但是這種方法只考慮像素點灰度值本身的特征,一般不考慮空間特征,因此對噪聲比較敏感。雖然目前出現了各種基于閥值分割的改進算法,圖像分割的效果有所改進,但在閥值的設置上還是沒有很好的解決方法,若將智能遺傳算法應用在閥值篩選上,選取能最優分割圖像的閥值,這可能是基于閥值分割的圖像分割法的發展趨勢。
基于區域的圖像分割方法
基于區域的分割方法是以直接尋找區域為基礎的分割技術,具體算法有區域生長和區域分離與合并算法。基于區域提取方法有兩種基本形式:一種是區域生長,從單個像素出發,逐步合并以形成所需要的分割區域;另一種是從全局出發,逐步切割至所需的分割區域。
區域生長
區域生長是串行區域技術,其分割過程后續步驟的處理要根據前面步驟的結果進行判斷而確定。常見的區域生長算法包括:同倫的區域生長方式、對稱區域生長方式和模糊連接度方法與區域生長相結合等算法。
區域生長的基本思想是將具有相似性質的像素集合起來構成區域。具體是先對每個需要分割的區域找一個種子像素點作為生長的起點,然后將種子像素周圍領域中與種子像素有相同或相似性質的像素合并到種子像素所在的區域中。將這些新像素當作新的種子像素繼續進行上面的過程,直到再沒有滿足條件的像素可被包括進來。這樣一個區域就長成了。
區域生長的優點是計算簡單,對于較均勻的連通目標有較好的分割效果。它的缺點是需要人為的選取種子,對噪聲較敏感,可能會導致區域內有空洞。另外它是一種串行算法,當目標較大時分割速度較慢,因此在算法設計時應盡量提高運行效率。
區域分裂合并
區域生長是從某個或者某些像素點出發,最后得到整個區域,進而實現目標的提取。而分裂合并可以說是區域生長的逆過程。它是從整個圖像出發,不斷分裂得到各個子區域,然后再把前景區域合并,得到前景目標,繼而實現目標的提取。分裂合并的假設是對于一幅圖像,前景區域是由一些相互連通的像素組成的,因此如果把一幅圖像分裂到像素級,那么就可以判定該像素是否為前景像素。當所有像素點或者子區域完成判斷以后,把前景區域或者像素合并就可以得到前景目標。
四叉樹分解法就是一種典型的區域分裂合并法。對Lena圖的分割效果如圖2所示。設R代表整個正方形圖像區域,P代表邏輯謂詞。基本分裂合并算法步驟如下:
(1)對于任一區域,如果H(Ri)=FALSE就將其分裂成不重疊的四等分;
(2)對相鄰的兩個區域Ri和Rj,它們也可以大小不同(即不在同一層),如果條件H(RiURj)=TURE滿足,就將它們合并起來;
(3)如果進一步的分裂或合并都不可能,則結束。 分裂合并法的關鍵是分裂合并準則的設計。這種方法對復雜圖像的分割效果較好,但算法較復雜,計算量大,分裂還可能破壞區域的邊界。
在實際應用中,通常是將區域生長算法和區域分裂合并算法這兩種基本形式結合使用。該類算法對某些復雜物體定義的復雜場景的分割或者對某些自然景物的分割等類似先驗知識不足的圖像分割,效果較為理想。
基于邊緣檢測的圖像分割方法
基于邊緣檢測的分割方法試圖通過檢測包含不同區域的邊緣來解決分割問題,它可以說是人們研究的最多的方法之一。通常不同的區域之間的邊緣上像素灰度值的變化往往比較劇烈,這是邊緣檢測方法得以實現的主要假設之一。邊緣檢測方法一般利用圖像一階導數的極大值或二階導數的過零點信息來提供判斷邊緣點的基本依據。
邊緣檢測技術通常可以按照處理的技術分為串行邊緣檢測和并行邊緣檢測。串行邊緣檢測是要想確定當前像素點是否屬于檢測邊緣上的一點,取決于先前像素的驗證結果。并行邊緣檢測是一個像素點是否屬于檢測邊緣上的一點取決于當前正在檢測的像素點以及與該像素點的一些相鄰像素點。
最簡單的邊緣檢測方法是并行微分算子法,它利用相鄰區域的像素值不連續的性質,采用一階或二階導數來檢測邊緣點。近年來還提出了基于曲面擬合的方法、基于邊界曲線擬合的方法、基于反應-擴散方程的方法、串行邊界查找、基于變形模型的方法。
常用的一階導數算子有梯度算子、Prewitt算子和Sobel算子。二階導數算子有Laplacian算子、Kirsch算子和Wallis算子。
圖3是分別用Sobel、LoG和Canny算子對Lena圖做的邊緣檢測。有圖3可以看出,Canny算子的分割效果比Sobel和LoG算子的好。
雖然邊緣檢測的優點是邊緣定位準確、運算速度快,但它有兩大難點限制了其在圖像分割中的應用,即:a不能保證邊緣的連續性和封閉性;b在高細節區存在大量的碎邊緣,難以形成一個大區域,但是又不宜將高細節區分為小碎片。由于上述兩個難點,因此無論采用什么方法,單獨的邊緣檢測只能產生邊緣點,而不是完整意義上的圖像分割過程。這也就是說,邊緣點信息需要后續處理或與其它相關算法相結合,才能完成分割任務。常用的方法是邊緣生長技術最大程度的保證邊緣的封閉性,或用有向勢能函數(DPF)將有缺口的兩邊緣強制連接,得到封閉邊緣圖。
在未來的研究中,用于提取初始邊緣點的自適應閥值選取、用于圖像的層次分割的更大區域的選取以及如何確認重要邊緣以去除假邊緣將變得非常重要。
結合特定工具的圖像分割算法
基于小波分析和小波變換的圖像分割方法
小波變換是近年來得到廣泛應用的數學工具,它在時域和頻域都具有良好的局部化性質,能將時域和頻域統一于一體來研究信號。而且小波變換具有多尺度特性,能夠在不同尺度上對信號進行分析,因此在圖像分割方面得到了應用。
二進小波變換具有檢測二元函數的局部突變能力,因此可作為圖像邊緣檢測工具。圖像的邊緣出現在圖像局部灰度不連續處,對應于二進小波變換的模極大值點。通過檢測小波變換模極大值點可以確定圖像的邊緣小波變換位于各個尺度上,而每個尺度上的小波變換都能提供一定的邊緣信息,因此可進行多尺度邊緣檢測來得到比較理想的圖像邊緣。圖4是運用小波變換方法對圖像進行的有效分割。
另外,將小波方法與其他方法結合起來處理圖像分割也得到廣泛研究。文獻[8]提出把Hilbert圖像掃描方法和小波變換相結合,獲得了連續光滑的閥值曲線,從而建立了一種局部自適應閥值法進行圖像分割。
基于馬兒可夫隨機場模型的圖像分割方法
馬兒可夫隨機場(Markov Random Field)方法建立在馬爾可夫模型和Bayes理論基礎上,根據統計決策和估計理論中的最優化準則確定分割問題的目標函數,求解滿足這些約束條件下的最大可能分布,從而將分割問題轉化為優化問題。MRF最重要的一個特點是,圖像中每個點的取值由其領域像素決定,其本質上是一種基于局部區域的分割方法。
如果我們把圖像理解為定義在矩形點陣上的隨即過程,則Markov性很好的描述了各個像素之間的空間依賴性,即一個像素可以由它周圍的像素確定。而事實表明,圖像像素的這種空間相關性總是存在的。因此可以使用馬爾可夫隨機場對圖像進行建模。文獻[9]討論了基于馬爾可夫隨機場的圖像分割方法,建立了相應的基于馬爾可夫隨機場的圖像分割模型,以實現復雜遙感圖像的快速分割,并由此將圖像分割問題轉化為圖像標記問題,進而轉化成求解圖像的最大后驗概率估計的問題。利用此方法得到的效果圖如圖5、6所示:
基于遺傳算法的圖像分割方法
遺傳算法(Genetic Algorithms,簡稱GA)是1973年由美國教授Holland提出的,是一種借鑒生物界自然選擇和自然遺傳機制的隨機化搜索算法。是仿生學在數學領域的應用。其基本思想是,模擬由一些基因串控制的生物群體的進化過程,把該過程的原理應用到搜索算法中,以提高尋優的速度和質量。此算法的搜索過程不直接作用在變量上,而是在參數集進行了編碼的個體,這使得遺傳算法可直接對結構對象(圖像)進行操作。整個搜索過程是從一組解迭代到另一組解,采用同時處理群體中多個個體的方法,降低了陷入局部最優解的可能性,并易于并行化。搜索過程采用概率的變遷規則來指導搜索方向,而不采用確定性搜索規則,而且對搜索空間沒有任何特殊要求(如連通性、凸性等),只利用適應性信息,不需要導數等其他輔助信息,適應范圍廣。
遺傳算法擅長于全局搜索,但局部搜索能力不足,所以常把遺傳算法和其他算法結合起來應用。將遺傳算法運用到圖像處理主要是考慮到遺傳算法具有與問題領域無關且快速隨機的搜索能力。其搜索從群體出發,具有潛在的并行性,可以進行多個個體的同時比較,能有效的加快圖像處理的速度。但是遺傳算法也有其缺點:搜索所使用的評價函數的設計、初始種群的選擇有一定的依賴性等。要是能夠結合一些啟發算法進行改進且遺傳算法的并行機制的潛力得到充分的利用,這是當前遺傳算法在圖像處理中的一個研究熱點。
基于人工智能的圖像分割方法
基于人工神經網絡的圖像分割方法
在20世紀80年代后期,在圖像處理、模式識別和計算機視覺的主流領域,受到人工智能發展的影響,出現了將更高層次的推理機制用于識別系統的做法,于是出現了基于人工神經網絡模型(Artificial Neural Networks, ANN)的圖像分割方法。人工神經網絡是由大規模神經元互聯組成的高度非線性動力系統,是在認識、理解人腦組織機構和運行機制的基礎上模擬其結構和智能行為的一種工程系統。
基于神經網絡分割的基本思想是:通過訓練多層感知機來得到線性決策函數,然后用決策函數對像素進行分類來達到分割的目的。近幾年神經網絡在圖像分割中的應用按照處理數據類型大致上可以分為兩類:一類是基于像素數據的神經網絡算法;另一類是基于特征數據的神經網絡算法也即特征空間的聚類分割方法。基于像素數據分割的神經網絡算法用高維的原始圖像數據作為神經網絡訓練樣本,比起基于特征數據的算法能夠提供更多的圖像信息,但是各個像素是獨立處理的,缺乏一定的拓撲結構而且數據量大,計算速度非常慢,不適合實時數據處理。目前有很多神經網絡算法是基于像素進行圖像分割的,如Hopfield神經網絡、細胞神經網絡、概率自適應神經網絡等。
隨著技術的不斷發展,第三代脈沖耦合網絡PCNN的研究,為圖像分割提供了新的處理模式,它能克服圖像中物體灰度范圍值有較大重疊的不利影響,達到較好的分割效果。
基于聚類的分割方法
對灰度圖像和彩色圖像中的相似灰度或色度合并的方法稱之為聚類,通過聚類將圖像表示為不同區域即所謂的聚類分割方法。此方法的實質是將圖像分割問題轉化為模式識別的聚類分析,如k均值、參數密度估計、非參數密度估計等方法都能用于圖像分割。實際中受到普遍歡迎的是基于目標函數的模糊C-均值算法(Fuzzy C-Means),簡稱FCM。由Bezdek于1981年提出,利用初始化方法確定聚類中心、聚類數,通過不斷迭代循環,調整和優化聚類中心,最終使類內方差達到最小,從而實現聚類。
目前常用的還有基于支持向量機聚類、基于遺傳算法聚類等以及與其他算法相結合的聚類方法。
基于主動輪廓模型的分割方法
主動輪廓模型(active contours)是圖像分割的一種重要方法,具有統一的開放式的描述形式,為圖像分割技術的研究和創新提供了理想的框架。在實現主動輪廓模型時,可以靈活的選擇約束力、初始輪廓和作用域等,以得到更佳的分割效果,所以主動輪廓模型方法受到越來越多的關注。
該方法是在給定圖像中利用曲線演化來檢測目標的一類方法,基于此可以得到精確的邊緣信息。其基本思想是,先定義初始曲線C,然后根據圖像數據得到能量函數,通過最小化能量函數來引發曲線變化,使其向目標邊緣逐漸逼近,最終找到目標邊緣。這種動態逼近方法所求得的邊緣曲線具有封閉、光滑等優點。
傳統的主動輪廓模型大致分為參數主動輪廓模型和幾何主動輪廓模型。參數主動輪廓模型將曲線或曲面的形變以參數化形式表達,Kass等人提出了經典的參數活動輪廓模型即“Snake”模型[10],其中Snake定義為能量極小化的樣條曲線,它在來自曲線自身的內力和來自圖像數據的外力的共同作用下移動到感興趣的邊緣,內力用于約束曲線形狀,而外力則引導曲線到特征此邊緣。參數主動輪廓模型的特點是將初始曲線置于目標區域附近,無需人為設定曲線的的演化是收縮或膨脹,其優點是能夠與模型直接進行交互,且模型表達緊湊,實現速度快;其缺點是難以處理模型拓撲結構的變化。比如曲線的合并或分裂等。而使用水平集(level set)的幾何活動輪廓方法恰好解決了這一問題。文獻[11]針對Snake模型在弱邊緣處容易溢出等不足,通過引入區域信息、粒子群優化算法等優化特性和良好的數值穩定性來對Snake模型的分割結果進行優化。
圖像分割的系統研究
根據已有的研究成果和最近的研究趨勢來看,對圖像分割的研究其實應該包括如圖 2.1所示的三個層次:關于圖像分割算法的研究、關于圖像分割算法性能的研究、關于圖像分割算法性能研究的研究。關于圖像分割算法的研究是對分割算法思想進行研究,即對圖像進行分割的技術的研究。關于圖像分割算法的性能的研究是對分割算法的評價方法進行研究,研究內容主要是對圖像分割技術的性能進行刻畫和比較,從而幫助更好的把握分割算法的特點和優點,目前已得到廣泛重視但并未獲得可喜的研究成果。關于圖像分割算法性能研究的研究是對分割評價方法和評價所使用的相關準則測度進行系統研究,從而保證能選取恰當的評價方法和評價測度來正確評估相應的分割技術,也就是對分割評價方法的評價。研究圖像分割評價方法是為了更好的研究圖像分割技術本身,而對圖像分割評價的研究則是為了進一步的研究分割評價方法,以便對分割技術本身起到引導和督促作用,從而從更深層次上實現對分割算法的指導作用。三者從“上”到“下”在不同層面上實現了一體式促進圖像分割技術發展的目標。
據統計,多年來學術界研究熱點和重點集中在最低層次;對第二個層次,研究投入的精力相對要少很多,但也已取得少數研究成果;至于第三個層次,目前國內外對圖像分割算法的評價方法和評價測度的系統研究十分缺乏。事實上,甚至與第二層次對分割評價的研究相比,這方面的研究和發表的文獻都非常少。總體說來,在圖像分割系統研究的三個層次都有許多有待深入的地方。對圖像分割技術本身進行比較理論和精確的研究仍有待提高,對分割技術的評價仍很缺乏,而對評價方法的研究幾乎為零。
圖像分割主觀評價
圖像分割主觀評價方法就是以人類視覺效果作為評判標準,讓觀察者根據事先規定的應用要求或者自身經驗、興趣、愛好,對測試圖像的分割質量進行評價,并以給出質量分數的形式完成評價工作的。評價過程中要求有多位觀察者參與,綜合考慮所有觀察者的觀察結果,作為圖像分割結果圖像的最終質量分數,最常用的綜合處理方法是平均主觀分數法。
準備工作
① 觀察者的選擇
為使主觀評價結果具有統計意義,參與評價的觀察者有以下幾點要求:首先是人數,要求不少于 20 名。其次是代表人群,要求觀察者應分別選自兩個不同背景的人群:一種是從未從事過圖像、視頻、計算機視覺等領域工作的、未經過訓練的“外行”觀察者;另一種是專門從事圖像相關技術研究的,受過專門訓練的“內行”觀察者,他們能用挑剔的眼光注意到圖像分割圖像的關鍵和細微變化,對圖像分割質量提出嚴格的判斷。最后是對候選人生理特性的要求,無論是“內行”觀察者和“外行”觀察者,都應有各年齡層次和性別的代表人物。條件允許的話,還應有來自不同地域和種族的代表人物。
② 評價尺度的選擇
主觀質量評價的尺度隨著觀察者對圖像技術的熟悉程度不同而加以選擇。一般來講,普通觀察者(“外行”)多憑借直觀映像判斷分割質量,因此多采用質尺度,而對圖像專業人員(“內行”)多憑借其對圖像內容的理解而挑剔性地評價分割圖像的質量,因此多采用干擾評價尺度。
主觀評價法
① 絕對評價
絕對評價是由觀察者們根據事先規定的應用要求或者自身經驗、興趣、愛好,對測試圖像按視覺效果進行評價,并選擇觀察結果的平均質量作為該分割結果圖像的最終質量。這雖是一項費時費力的步驟,但在嚴格的實驗條件下可從一定程度上減小評價過程的主觀隨意性。具體實施過程和步驟可參考聯合國國際電信聯盟ITU(International Telecommunication Union)倡導的視頻圖像質量評價指南。
除了上述獨立的評價方式(stand-alone)外,還可采取有對比的方式(subjective comparable)進行主觀評價。以提供的標準圖像為據,觀察者逐個對比和分析算法分割的結果圖像中的區域與標準分割結果圖像的目標區域,整合為對整幅算法分割結果圖像的全局感觀映像,進而給出最終質量分數。必須指出的是,這種有對比的主觀評價方式雖然還未正式提出,但已經常被某些組織或個人使用。觀察者對分割圖像質量的優劣用數字打分,通常有 5 個圖像級別,如表 2.1所示。
② 相對評價
相對評價是由觀察者將分割相同原始圖像而得的一批圖像從好到壞進行質量排序,通常有 7 個圖像級別,如表 2.2所示。
③ 平均主觀評價
如果m 為評價圖像質量的級別 m=1,2,。。。,M , Sm為m 級圖像質量的得分,Hm為判定圖像屬于m級的觀察者人數,則被觀察的分割結果圖像總得分為:
圖像分割客觀評價
從 2.2 節敘述可知,在實際應用中,主觀評價方法的評價結果因人而異,無法用數學模型對圖像分割的質量進行定量描述,且過于費時費力,因而其應用受到很大限制,在某些場合甚至無能為力。相反,借助理論分析及科學計算對算法進行客觀性能評價的方法,擺脫人為主觀因素對評價過程的束縛,評價結果客觀、穩定,是一類可靠的分割評價方法。注意,主觀評價只能對分割結果進行評判,因此,必須將分割算法在計算機上進行實際分割獲得分割圖像才能實現對分割算法的性能評價。客觀評價方法不但可以對分割結果進行評判,還可以不借助計算機而直接對算法進行分析和評判。因此研究一種在一定程度上能替代主觀評價,并能實現定量測定圖像分割質量的客觀方法具有重要的意義,并必將成為圖像分割評價方法研究的必然趨勢。
客觀評價法研究內容及評價準則
圖像分割客觀評價主要有兩方面的研究內容:
一是對特定的圖像分割算法進行研究,通過對該算法在不同應用情況、不同參數組合情況以及輸入圖像的類型、內容、復雜度等不同時所表現出的性能進行評估,掌握如何選擇及修正算法參數,以恰當地應對不同的應用場景,稱為性能刻畫。通常包含兩種形式的性能刻畫方法,分別是充分性性能刻畫和診斷性性能刻畫。充分性性能刻畫著重對分割算法的適用領域的研究,診斷性性能刻畫重點在對分割算法有效性的研究。以存在標準參考圖像為前提,后者通過計算算法處理的結果圖像與標準參考圖像的相似性,完成對分割算法某次分割結果質量的評價,即部分有效性評價。分割算法全局有效性評價則是以統計該算法在包含大量數據的圖像數據庫中能取得較好分割質量的圖像的比率為依據的,整個過程步驟如圖 2.2 所示。
二是分析比較多個算法在相同應用情況下的分割性能,比較各算法的優劣,并進行排序以便在給定情況下選擇合適的分割算法或者改進現有算法來滿足應用要求,稱為性能比較。
這兩方面內容是相互影響和關聯的。性能刻畫使得對算法的研究和理解更為全面和深刻,性能比較使得對算法的刻畫更具目的性。為達到分割評價的目的,對進行分割評價的研究方法有以下幾點基本要求:
通用:分割評價的方法必須對各種類型的分割算法都能進行準確而客觀地評價,適用不同應用領域的各種情況;
客觀:分割評價的方法必須擺脫對人為因素的依賴性,進行客觀真實地評價;
定量:分割評價的方法必須能以量化的形式給出直觀的評價結果,方便不同的評價結果進行比較;
典型:分割評價時采用的輸入圖像必須能代表真實世界里各種應用場景的特點,使評價結果具有較好的可移植性。
不管是對算法進行理論分析還是設計實驗進行評價,都需要一定的評價準則做指導,也稱評價指標或測度。事實上,對任何技術進行評價都要采用有效的評價方法和客觀的評價指標。因為評價方法的性能主要取決于所采用的評價準則,在圖像分割技術的評價中,性能評判準則可以說是最重要的因素,因此對各種評價準則的分析、比較和討論成為分割評價方法研究的重點。一方面,理論上分析算法思想、特點,需要刻畫算法某方面的特性,而這些特性是否得到滿足牽涉到評價準則;另一方面,通過實驗的方法評價算法特性及分割質量,需要將待評估算法在計算機上實現對輸入圖像的分割,對分割結果進行客觀定量地評價,進而決定分割算法的性能,在缺乏評價準則的情況下該過程中仍無法開展。可見,在分割評價過程中所依據的評價準則(指標),在整個性能評判過程中起著關鍵性的作用,具有重要的研究意義。
一個好的分割評價準則應該滿足如下四個要求:
非退化性(Nondegeneracy):也稱為普適性,即對各種類型的輸入圖像的分割結果進行評價都能給出恰當的結論,避免對某種分割結果分辨不清給出錯誤評價結論的問題。例如,每個像素獨立成一個區域(原始圖像)或者所有像素劃分到一個區域(將原始圖像作為一個區域)的極端分割情況,評價準則應給出的判斷結果是“最差等級”。
數據無假設(No assumptions about data generation):即對評價對象(分割算法及其分割的圖像數據)不做任何人為假設。
自適應判別精細劃分(Adaptive accommodation of refinement):假設對某幅原始圖像有兩種不同的分割結果圖像S1 和S2 , S1的每個區域或者與S2的對應區域重疊,或者與S2的多個區域的并集重疊,即S2是S1的細分結果,則稱 S2是S1的一種精細劃分。不同的人由于各自的視覺習慣或者對事物的理解不同,對S1的精細劃分的認識也不同,也就是說可能有多種精細劃分結果同時存在,但都認為是可取的、正確的,如圖 2.3所示。對這類精細劃分結果,評價準則要能準確識別并判定二者的分割效果一致
可比性(Comparable scores):即評價結果必須用數字等形式量化表示,以便在不同評價結果間進行比較和評估。
圖像分割評價準則切入點不同,原理不同,各有所長。根據評價過程所采用的方式不同,有實驗性的準則,用于評價分割算法的分割結果圖像,亦即借助實驗結果去評判分割算法的性能;也有分析性的準則,用于直接分析分割算法的性能。因此,這些評價準則可分成分析的和實驗的兩大類。而且,這些準則中有些只可以定性的評價分割算法性能,也就是說分割算法的性能的評價結果以定性的方式表達;有些又可以定量地評判分割算法的性能,亦即以定量的方式表達和刻畫算法的性能及分割結果的質量。因此,根據評價準則的自身特性,以及最終表達形式的不同,又可將這些準則分成定量準則和定性準則兩大類。綜合上面兩種關于分割評價的準則的分類,除了一些特殊的評價準則以外,多數的評價準則均可劃分到以下四類,如表 2.3所示。
從分割評價方法的使用結果來看,對所評價的算法利用分析性的準則進行評價相比利用實驗性的準則進行評價,它不要求將待測算法在計算機上實現實地分割獲得分割圖像,因此評價結果不會受到不同安排的評價實驗帶來的影響。另外,采用定量性的評價準則可獲得比定性性的準則更豐富更精確的信息,更容易獲得較為直觀的評價結果。由此可知,評價準則具備不同的用途與特點,需要對他們有一個全面的了解和掌握,才能因地制宜選擇合適的評價方法評價待研究的算法。
展望
隨著圖像分割技術在諸多工業領域的廣泛應用以及理論研究的不斷發展,對其分割性能和分割效果的評估已成為一項很有意義而又亟待解決的研究課題。有監督的評價方法雖能獲得較為準確和可靠的評價結果,但是評價過程嚴重依賴標準分割圖像,但實際應用中獲取標準參考圖像并不容易,甚至不可能;無監督評價方法雖無需標準分割,但目前為止都是低級的基于圖像特征的數據驅動的評價方法,又難以同時具備準確性和通用性等特點。因此,能利用圖像的高級信息如語義信息來進行算法的性能評價應是未來發展的趨勢。例如圖像骨架,是對圖像內容的綜合描述,因此結合骨架信息的評價方法有望獲得對分割結果圖像的準確理解。另外,如果能將期望達到的分割效果結合到評價過程中,這樣一來,評價方法最大限度地代表了人類主觀意愿,因此其評價結果將更為準確和可靠。
評論