SPP Net网络结构学习

SPP:Spatial Pyramid Pooling(空间金字塔池化)

创新点

  • 结合空间金字塔方法实现CNNs对尺度输入。(一般CNN后连接全连接层或分类器,它们都需要固定的输入尺寸,因此不得不对数据进行crop或warp,这些预处理都会造成数据的丢失或几何的失真。SPP Net的第一个贡献是将金字塔思想加入到CNN,实现了数据的多尺度输入。)

如下图所示,在卷积层和全连接层之间加入了SPP layer,此时网络的输入可以是任意尺度的,在SPP layer中每一个Pooling的filter会根据输入调整大小,而SPP的输出尺度始终是固定的。
在这里插入图片描述

  • 只对原图提取一次卷积特征(在R-CNN中,每个候选框先resize到统一大小,然后分别作为CNN的输入,这样是很低效的。所以SPP Net根据这个缺点做了优化:只对原图进行一次卷积得到整张图的feature map,然后找到每个候选框在feature map上的映射patch,将次patch作为每个候选框的卷积特征输入到SPP layer和之后的层。节省了大量的计算时间,比R-CNN有一百倍左右的提速。)
    在这里插入图片描述

为什么全连接层输入需要固定尺度
全连接层的计算其实相当于输入的特征图矩阵和全连接层权值矩阵进行内积,在配置一个网络时,全连接层的参数维度是固定的,所以两个矩阵要能够进行内积,则输入的特征图的数据矩阵维数也需要固定。

发布了352 篇原创文章 · 获赞 31 · 访问量 6万+

猜你喜欢

转载自blog.csdn.net/strawqqhat/article/details/103310164
SPP