RoIPooling、RoIAlign的最直观理解

RoIPooling、RoIAlign的简单、直观理解

禁止任何形式的转载!!!

在两阶段的目标检测中RoIPooling、RoIAlign经常被用到,都是在特征图上截取感兴趣的区域,本文打算以最简洁的方式展示两者的区别:

  • RoIPooling
    在这里插入图片描述
    或者:
    在这里插入图片描述

由图可见,在一开始进行crop的时候为了取整,截取到的特征与计算的位置有偏差;接下来进行pooling的时候,同样为了取整,直接舍弃了部分特征信息。

  • RoIAlign
    如下图,不进行crop,先保留小数进行划分;划分完之后显然都不是完整的小格子(特征图像素),但是接下来要进行pooling,所以就在划分后的大格子里选取n个代表性的点(双线性插值得到);最后把这些代表性的点像之前特征图一样进行pooling即可。

这样做,就可以不偏不倚、不丢失信息的将感兴趣的特征图区域的信息都利用上。
在这里插入图片描述

既然是pooling那么就是每个通道分别都是进行这样的操作。

最后再给大家安利一个详细版:一文读懂 RoIPooling、RoIAlign 和 RoIWarp

猜你喜欢

转载自blog.csdn.net/qq_41917697/article/details/122830015