一卷积神经网络基础

本节以二维卷积为例，二维卷积常用于处理图像数据。

二 leNet

卷积神经网络就是含卷积层的网络。 LeNet交替使用卷积层和最大池化层后接全连接层来进行图像分类。

神经网络的结构如下

Image Name

干净的数据、有效的特征非常重要。特征可以学习得到，比如神经网络的第一层识别出图像的边边角角，第二层组合成花纹，轮廓，第三层就可以识别出物体，第四层就可以完成分类任务，将一个hard的任务分成几个步骤一点点学习到。

Image Name

maxpool相对avepool来说有稀疏参数的作用

用Dropout来控制全连接层的模型复杂度

relu的大于1的时候梯度恒为1，计算比sigmoid快；小于0的时候梯度为0，有起到了正则化、稀疏化的作用

缺点：没有提出简单的规则来指导后来的研究者如何设计新的网络，结构比较死板，很难复杂化或简单化

多个VGG block（重复的模块）+全连接。通过增减VGG block来使模型复杂或简单化。

在VGG block中，3*3，stride=2的池化层使得尺寸大小减半；3*3，pad=1的卷积层使得图像大小不变

没经过一个VGG block，长宽都会减半

LeNet、VGG和Alexnet大同小异，主要由卷积层（充分抽取空间特征）和全连接层（输出分类结果）两个结构构成。

Nin Block：没有使用全连接层，而是用1*1的卷积来代替，这样就不需要做flatten操作（全部都用卷积更方便，不需要在卷积和全连接之间转化），参数量减少，有防止过拟合的作用，但训练时间会增加？

没有用全连接层得出分类结果而是用global avepooling，为了和分类数相同，只能在通道数做手脚达到类似效果

1*1卷积核的作用：

1.放缩通道数：通过控制卷积核的数量达到通道数的放缩。
2.增加非线性。1×1卷积核的卷积过程相当于全连接层的计算过程，并且还加入了非线性激活函数，从而可以增加网络的非线性。
3.计算参数少

Inception块组成

Image Name

1*1卷积核是为了减少通道数，降低模型复杂度？

gbl5555

发布了34 篇原创文章 · 获赞 20 · 访问量 6万+

私信关注