【深度学习】——如何处理输入图像大小不一样的情况

这里一般有常见的几种方法:

1)将图像缩放成大小一致后再输入,如RCNN算法

2)roi pooling:这里允许输入图像的大小不一样,后续根据指定的固定大小来求解池化的核大小,以此来得到相同大小的特征图,如我目标是得到7*7的特征图,这时候我有一个图像是14*14,有一个图像是21*21,则前一个图像的池化卷积核为2*2,后一个池化卷积核为3*3这样就保证了最后得到的特征图都是7*7,这种方法称之为roi pooling,但是会出现浮点数,这种方法直接取整,导致特征不完整,主要用在FASTER RCNN,在MASKrcnn中有所改进,用的是roi align算法,保留了浮点数然后根据双线性插值后取值。

猜你喜欢

转载自blog.csdn.net/qq_45769063/article/details/120254850