目标检测之两阶段算法--Fast R-CNN详解

论文题目:《Fast R-CNN》
论文地址:Fast R-CNN

1. 概述

       之所以提出Fast R-CNN,主要是因为R-CNN存在以下几个问题:1、训练分多步。通过上一篇博文我们知道R-CNN的训练先要fine tuning一个预训练的网络,然后针对每个类别都训练一个SVM分类器,最后还要用regressors对bounding-box进行回归,另外region proposal也要单独用selective search的方式获得,步骤比较繁琐。2、时间和内存消耗比较大。在训练SVM和回归的时候需要用网络训练的特征作为输入,特征保存在磁盘上再读入的时间消耗还是比较大的。3、测试的时候也比较慢,每张图片的每个region proposal都要做卷积,重复操作太多。

在这里插入图片描述
Fast R-CNN算法主要步骤为:

1)Feature Extraction:使用ConvNet只对图像进行一次计算得到特征图。
2)Sample ROIs:在原图上使用selective search算法生成2000个region proposal。
3)POI Projection:将selective search生成的region proposal投影到CNN提取到的特征图上。
4)ROI Pooling:将POI Projection过程得到的特征图变成固定大小的特征图输出。
5)分类和回归:最后,通过后续的FC层分别生成bounding box和classes。

猜你喜欢

转载自blog.csdn.net/Roaddd/article/details/114157261