卷积神经网络中感受野的详细介绍

原文链接: https://blog.csdn.net/program_developer/article/details/80958716

输入图像通过特定卷积核完成卷积处理后,卷积结果就是你需要提取的特征,也就是感受野,通过叫局部感受野。就好像人通过眼睛找一个特定东西一样。

一、感受野的概念

在卷积神经网络中,感受野(Receptive Field)的定义是卷积神经网络每一层输出的特征图(feature map)上的像素点在输入图片上映射的区域大小
再通俗点的解释是,特征图上的一个点对应输入图上的区域,如图1所示
在这里插入图片描述

二、感受野的例子

  1. 两层33的卷积核卷积操作之后的感受野是55,其中卷积核(filter)的步长(stride)为1、padding为0,如图2所示:
    在这里插入图片描述
  2. 三层33卷积核操作之后的感受野是77,其中卷积核的步长为1,padding为0,如图3所示:
    在这里插入图片描述

三、感受野的计算

感受野计算时有下面几个知识点需要知道:

  1. 最后一层(卷积层或池化层)输出特征图感受野的大小等于卷积核的大小。
  2. 第i层卷积层的感受野大小和第i层的卷积核大小和步长有关系,同时也与第(i+1)层感受野大小有关。
  3. 计算感受野的大小时忽略了图像边缘的影响,即不考虑padding的大小。
    关于感受野大小的计算方式是采用从最后一层往下计算的方法,即先计算最深层在前一层上的感受野,然后逐层传递到第一层,使用的公式可以表示如下:
    在这里插入图片描述

四、计算VGG16网络每层的感受野

  1. 引例
    VGG16网络有点复杂,我们先来计算一个简单的例子,先学会计算感受野,在来分析复杂的网络
    在这里插入图片描述
    在这里插入图片描述
  2. VGG16网络每层感受野计算
    在这里插入图片描述
    在这里插入图片描述
    因此我们可以得出:pool5输出的特征图在输入图片上的感受野为212212;conv5_3输出的特征图在输入图片上的感受野为196196,其它层依次类推。
    在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/nanhuaibeian/article/details/100535147
今日推荐