Dilated Convolution —— 空洞卷积(膨胀卷积)

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/qq_30241709/article/details/88080367

目录

 

Dilated Convolution概述

Dilated Convolution存在的问题

HDC (Hybrid Dilated Vonvolution)


Dilated Convolution概述

Dilated Convolution是在标准卷积的Convolution map的基础上注入空洞,以此来增加感受野(reception field)。因此,Dilated Convolution在Standard Convolution的基础上又多了一个超参数(hyper-parameter)称之为膨胀率(dilation rate),该超参数指的是kerne的间隔数量。

下面两张动图解释了膨胀卷积(Dilated Convolution)和标准卷积(Standard Convolution)之间的区别:

Standard Convolution with a 3*3 kernel (and padding)
Standard Convolution with a 3*3 kernel (and padding)
Dilated Convolution with a 3*3 kernel and dilation rate 2

之所以提出了Dilated Convolution,是因为Deep CNN存在一些主要的问题:

  •  上采样和池化层存在一些知名的问题(Hinton在演讲中提出)
  • 内部数据结构丢失,空间层级化信息丢失
  • 小物体无法重建

Dilated Convolution存在的问题

Dilated Convolution的优点在于可以保留内部数据结构以及可以避免使用下采样这样的特性。但是完全基于Dilated Convilution设计模型也会存在一些问题:

  1. Dilated Convolution的kernel并不连续,也就是并不是所有的像素都用来计算了,因此这里将信息看作checker-board的方式将会损失信息的连续性。(即栅格效应,膨胀卷积不能覆盖所有的图像特征,如下图所示)
    The Gridding Effect
  2. Dilated Convolution的设计更像是用于获取long-range information,这样或许对一些大物体有较好的分隔效果,而对于小物体来说可能是有弊无利了。如何同时处理好大小物体的关系,则是设计好dilated convolution网络的关键。

HDC (Hybrid Dilated Vonvolution)

混合膨胀卷积是针对膨胀卷积存在的问题所提出的,对比膨胀卷积,主要包含以下三方面的特征:

  1. 叠加的膨胀卷积的膨胀率dilated rate不能有大于1的公约数(比如[2, 4, 6]),不然会产生栅格效应
  2. 膨胀率dilated rate设计成了锯齿状结构,例如[1, 2, 5, 1, 2, 5]这样的循环结构
  3. 膨胀率dilated rate需要满足:M_i = \max\left [ M_{i+1} -2r_i, M_{i+1}-2(M_{i+1}-r_i), r_i\right ]. 其中r_i是第i层的膨胀率dilated rate,M_i是指在i层的最大dilation rate,假设总共有n层,那么M_n = r_n.一个简单的例子是:
dilated rate[1, 2, 5] with 3*3 kernel

 Dilated Convolution和HDC的对比试验:

猜你喜欢

转载自blog.csdn.net/qq_30241709/article/details/88080367