深度学习【25】物体检测:Tiny SSD

论文:Tiny SSD: A Tiny Single-shot Detection Deep Convolutional Neural Network for
Real-time Embedded Object Detection

记录这篇论文的原因主要是想记录一下在优化yolov2时所用的网络。

该论文将SSD模型优化到只有2.3M,同时在voc 2007[评测数据集上面的mAP比tiny yolo还要多出4个百分点。Tiny SSD的优化思想是基于squeezeNet的设计思想:
1、尽量减少3×3卷积的通道
2、尽量减少3×3卷积的输入通道
3、尽量将下采样往后推迟
基于这样的设计思想,Tiny SSD将前面的基础网络改成由10个fire model构成的网络。结构如下:
这里写图片描述

好了,现在谈谈当时优化 yolov2模型的一些东西。

当时由于项目需要,要求将物体检测系统移植到手机端使用。基于速度上的考虑,我们直接选用了yolov2作为基础网络。同时在coco数据集上面进行评测,因此我们的物体检测数目是80类,不是voc的20类。记得当时对tiny yolo用coco的评测数据集评测了一下,好像mAP(iou=0.5,接下来的mAP都是在这个指标下的)是19左右,具体也记不大清了。tiny yolo的模型大小是60M左右。直接说一下最后的优化效果,最终模型的大小是8M,mAP是30。在加上了Focal loss后mAP达到了32。同时在移动端(三星s7 edge,NCNN框架)上面的速度是300ms左右。
模型的优化主要是速度、大小和性能。在速度上主要是尽量减少前面几层的计算量;在大小上尽量减少3×3的通道数;而性能上主要是采用了同一层卷积中包含了1×1和3×3的卷积核(3×3的通道数一般会比1×1的少非常多),以及采用了resnet的思想(不过不是相加,而是拼接)。在feature map大小一样的几个卷积核中都会加入前面几层的输入,特别是在要下采样之前会加入更多的层。

猜你喜欢

转载自blog.csdn.net/linmingan/article/details/79430604
今日推荐