版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/shinetzh/article/details/84825090
R-CNN
整体结构
- Region proposal -> warped region -> CNN -> FC -> linear SVM、regression
训练步骤
- 对CNN进行Supervised pre-training
在有大量数据的ILSVRC 2012数据集上进行分类训练,达到较好的效果 - Domain-specific fine-tuning
使用selective search得到VOC数据集中的候选框,处理得到warped region。将处理得到的warped region组合成32个正样本、96个负样本构成的batch。其中正样本为和ground truth的IOU大于指定的阈值(比如0.5或者0.3)的region,其他的为负样本。送入模型进行fine-tuning,选取较小的学习率,否则预训练也就没有用了。
测试步骤
- 使用selective search得到测试样本的候选框, 处理得到warped region。
- 送入模型进行类别预测和回归
- 将预测结果按照概率大小排序,采用NMS(非极大值抑制),也就是选出概率最大的region,然后删除和它的region的IOU超过指定阈值的其他region,重复这个步骤直到没有候选框。筛选出最终得到的检测框