目标检测笔记(1116)

1.object detection的模型:
R-CNN,Fast RCNN ,YOLO,Detectron,SSD,YOLOv4,YOLOR

2.步骤
One-stage:直接在图象中检测,eg:YOLO
after 2014 two stages:
判断区域是否有物体,有物体的区域做proposal region 给神经网络进行分类及bounding box regression。(分类器有四个神经元,代表四个顶点)

3.rcnn:选取若干个大小不一比例不同的区域,用分类模型判断是否有检测目标。最直接的方法为滑动窗口法,cnn用特征提取,分类用线性svm分类,效率较低。(selected search,opencv)

4.fast-rcnn:分矩形框用selected search在feature map上产生roi。roi按image及featuremap大小比例投射回输入image区域。在feature map上分矩形框。

5.faster-rcnn:用rpn代替selected search生成object proposal。
•rpn工作:用滑动窗口生成个ankar box。对于每个ankor box,rpn预测是否有物体;另外用bounding box regressor来调整ankor box。分类用的是vgg16。

6.YOLOv4:基于darknet开发,提高了准确率,速度变化不大。训练成本增加了,coco数据集,评价标准:map。(github:github.com/AlexeyAB/darknet)
•数据格式:文本文件,5个数据(sword gun):类别 后面四个数包围框顶点坐标

7.YOLOv5:基于pytorch实现,并非darknet。v5的权重文件比v4小很多(27MB:244MB)

8.PP-YOLO:基于peddlepeddle开发。将
YOLOv3的darknet53 backbone换成resnet backbone,训练的batchsize也有变,64变成192。contribution:better balance between effectiveness and efficiency.

9.Darknet
detect格式:detect 模型配置 权重位置 图片位置。

10.数据的标注工具:
•LabelingImg,做标签,用鼠标设置bounding box
•VoTT:目录中所有图像的标记放在一个json文件。
•LabelMe:除了目标检测还支持示例分割。支持pascal voc和coco。
•VIA

11.homework :sword & gun

猜你喜欢

转载自blog.csdn.net/ChaoyingL/article/details/121362775