为什么倾向于使用3*3 小卷积核堆叠代替大卷积核

  • 3x3 是最小的能够捕获像素八邻域信息的尺寸。

  • 两个 3x3 的堆叠卷基层的有限感受野是 5x5 ;三个 3x3 的堆叠卷基层的感受野是7x7,故可以通过小尺寸卷积层的堆叠替代大尺寸卷积层,并且感受野大小不变

  • 多个 3x3 的卷基层比一个大尺寸 filter卷基层有更多的非线性(更多层的非线性函数),使得判决函数更加具有判决性。

we incorporate three non-linearrectification layers instead of a single one, which makes the decision function more discriminative

  • 多个 3x3的卷积层比一个大尺寸的 filter更少的参数,假设卷基层的输入和输出的特征图大小相同为 C,那么三个 3x3 的卷积层参数个数 3x(3x3xCxC)=27C2;一个7x7的卷积层参数为49C2;所以可以把三个3x3的filter看成是一个7x7 filter的分解(中间层有非线性的分解, 并且起到隐式正则化的作用。



猜你喜欢

转载自blog.csdn.net/qq_16792139/article/details/86507791