在工業場景中,網絡結構決定了下限,數據決定著上限,要想模型有好的表現,數據是至關重要的。下面就這個項目來說一說,工業缺陷檢測在標注數據時需要注意的幾個事項:
1、離得比較近的缺陷就合并在一個框里
以上兩個圖里的缺陷都是可以合并的,一是為了保持缺陷的完整性,同一個缺陷被標注成好多個,會給神經網絡造成誤解,同時也避免出現多個小目標。
2、盡量不要有太細長的目標
神經網絡的卷積基本上都是3*3的,而且先驗框anchor在設計寬高比時一般也是在1左右,回歸非常細長的目標,需要比較大的感受野和寬高比,不一定能做得很好。如圖左邊那塊目標,可以合并一下,稍微標大一點,把長寬比例搞得居中一點。
3、不要打太小的目標,比如低于10x10像素的
模型一般都對小目標不敏感,除非采用比較好的trick,就拿YOLOv4來說,到第三次下采樣的特征圖才拿去后面做檢測,也就是在原圖上最小都有8個像素,才能在特征圖上體現為1個像素。有人會杠了,那我的目標就是小目標啊,小哥,我說了,另外還有很多trick的,不在本文討論范圍,打標簽這個環節你要么打大點,要么不要打,或者把局部區域放大成大圖,再打標簽,不然送到模型里頭,也是沒用的。這跟嚴謹不嚴謹沒有任何關系。
YOLOv4網絡結構圖
4、不要標注特別不明顯的特征
這一條相信都能理解,特征連人都認不出來,哪個網絡都不好識別吧。像這種標注框,恐怕誰都不好認吧。
5、框的位置盡量準確一點,把缺陷部分剛好框進去
像右下角那個框,完全可以打大點吧。
6、需要檢測的缺陷在訓練集中至少要出現一次相似的
另外,需要多說一句,跟標注無關的。就是雖然都是缺陷,但實際上也分很多種的,如果訓練集里都沒有出現過相似的,就基本上別指望測試時能夠檢測出來了。比如下圖中,雖然只劃分了一類缺陷,但是從特征的角度來說,實際上已經是好幾類了,比如劃痕、凸起、裂開。還是回到開頭那句話:網絡結構決定了下限,數據決定上限。目前的技術,不靠大量的數據喂,是訓練不出很好的模型的。
版權聲明:本文為CSDN博主「雪地(>^ω^<)」的原創文章,遵循CC 4.0 BY-SA版權協議,轉載請附上原文出處鏈接及本聲明。
審核編輯:劉清
-
神經網絡
+關注
關注
42文章
4809瀏覽量
102831
原文標題:工業缺陷檢測中數據標注需要注意的幾個事項
文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
買電動車需要注意什么及注意事項
變頻電源使用前需要注意些什么?
在選購數字源表時有哪些事項需要注意
選購視覺缺陷檢測設備時需要注意哪些事項
工業平板電腦在使用時通常需要注意哪些事項

評論