2015年,YOLO之后,另外一個直接回歸的方法SSD,以state-of-the-art的檢測效果和檢測效率橫空出世;
SSD,single shot multibox detector
直接看下圖吧,可以看出,YOLO是在卷積層后加了FC,然后預估2*7*7共49個位置98BBox;而SSD顯著的不同就是多尺度:1) 多尺度的feature map上提取特征,通過3*3的卷積核,保證特征的細粒度和豐富性; 2) 多尺度feature map上抽取anchor,每張圖共有7308個BBox,遠大于YOLO的98;
上圖中,Conv4_3上面的Conv: 3*3(4*(classes+4)),前面的3*3是卷積核,后面的4是每個點的有4個anchor,所以這一層共有38*38*4個BBox,把7個卷積層加起來,一共就是7308個BBox;
另外,每個正例BBox學習的并不是絕對位置或者相對grid的位置,而是相對于ground truch的偏移,如下圖:
因此,其loss function包括兩部分,分類的confidence+回歸相對ground truth的位置偏移,如下:
在VOC和COCO上的效果
1. 準確率上:VOC達到最高80%,COCO這個小物體也是最高26.8%;
2. 速度上,500尺寸下,SSD和YOLO基本持平,20幀,但是mAP高10點;
另外,16年的YOLOv2在檢測效果和速度上更高一層,在效果保持state-of-the-art的基礎上,FPS能達到50+,是SSD的2倍+,但是!小物體檢測依然是YOLO的短板,COCO上的依然低于SSD5個百分點,如下:
SSD: Single Shot MultiBox DetectorWei Liu, Dragomir Anguelov, Dumitru Erhan, Christian Szegedy, Scott Reed, Cheng-Yang Fu, Alexander C. Berg
-
SSD
+關注
關注
21文章
2955瀏覽量
119204 -
voc
+關注
關注
0文章
106瀏覽量
15881
發布評論請先 登錄
評論