VGG中2个3*3卷积核对AlexNet中5*5卷积核以及感受野计算公式

看网上写了一些,都不太清楚,自己看了一个视频上讲的这个,才终于搞清楚。所以写给大家分享一下。
首先介绍下感受野的概念,我看一些介绍也不是太清楚。所以这里说一下定义:
感受野就是卷积神经网络的每一层的一个像素点对应于原始输入图像上区域的大小。
转载于视频
比如这个图,这个conv1是33的卷积核,conv1的左上角的第一个像素点,对应的就是原始图像上红框所代表的33的区域大小,所以它的感受野就是3(一般都说3,不说33),第2个3就是绿线对应的部分,也是33.所以感受野也是3.同理,黑线黑框就是第三个3.
以此类推,如果现在假设conv1是55的卷积核的话,那么它对应的感受野就是5了。
对于一个的很好理解。那么如果两层呢?下面我们看一下:
转载于视频
conv2图像上写的5,就代表每一个像素点的感受野是5,也就意思是两个3
3的卷积核等价于一个55.下面看下为什么?
首先看conv2的一个点,比如左上角的点是不是对应conv1的3
3?然后接下来,conv1的33实际上对应的可不是原始图像上的99,这个不是乘的关系,因为conv1的整个33的卷积核对应的是原始图像55的大小,你可以看下,红框,绿框和黑框加起来宽是不是一共就5个像素点。因为他们conv1上虽然每一个点映射原始输入图像的3个,但是红绿黑三个框其实是有重复的,去掉重复之后,conv2上的1个点就对应原始输入5*5的大小,也就是感受野是5的意思。

然后我看着网上一些计算感受野公式是从后向前算的,那也太麻烦。这里附上从前向后算的:转载于视频
就是假设开始原图感受野为1.
那么我们算下两个3*3感受野
R2=1+(3-1)*1=3;
R3=3+(3-1)*1=5;
OK了。

猜你喜欢

转载自blog.csdn.net/Asure_AI/article/details/103130357