卷积神经网络 ——卷积神经网络的结构

卷积神经网络的基本思想

在这里插入图片描述

卷积神经网络的基本结构

卷积神经网络是一种多层的、前馈型网络。从结构上,可以分为特征提取阶段和分类识别阶段。
在这里插入图片描述
在特征提取阶段,通常由多个特征层堆叠而成,每个特征层又由卷积层和池化层组成。
在这里插入图片描述
处于网络前端的特征层,用来捕捉图像局部细节信息,而后面的特征层则用来捕捉图像中更加抽象的信息。

在分类识别阶段,通常是一个简单的分类器,例如全连接网络或支持向量机,它接收最后一个特征层的输出,完成分类和识别。

特征提取阶段

卷积层

卷积层也叫做特征提取层,使用卷积核来提取图像中的特征。
在这里插入图片描述
要注意的是,这里的卷积运算是有偏置项的,一个卷积核在整张图片上提取到的特征构成特征图,在一个卷积层中,往往包含多个卷积核,用来提取图像中的不同特征。

每个卷积核都输出一张特征图,在卷积核之后,一般会定义一个激活函数,卷积神经网络通常使用 Relu 神经网络作为激活函数,在实际任务中,也可能会使用其他激活函数,或者不使用激活函数。

池化层

池化层也叫做特征映射层

池化是一种下采样运算,可以在减少数据的处理量的同时,保留有用的信息。

例如,图片尺寸为 6 x 6 ,在这里插入图片描述
对其进行最大池化,池化模板为 2 x 2 ,步长为 2 。

就是把它按照 2 x 2 的小区域进行分块,
在这里插入图片描述
然后取每个块中的最大值作为合并后的像素值。
在这里插入图片描述
采用 n x n 的池化模板进行步长为 n 的池化操作就是对这个图像进行下采样,把它的尺寸减少到 1/n 。

例如,下图为 MNIST 手写数字数据集中的手写数字图片,
在这里插入图片描述
对他们进行最大池化,得到的结果图片是 7 x 7 的,
在这里插入图片描述
可以看到,最大池化就是在缩小图像的同时,对每个块中最亮的像素采样,可以得到图像的主要轮廓。因此,池化相当于又进行了一次特征提取,从而更进一步获取更高层、更抽象的信息。使得网络能够对输入的微小变化(例如少量的平移、旋转以及缩放等) 产生更大的容忍,从而提高了泛化性,防止过拟合。

在网络前端的卷积层中,每个神经元只连接输入图像中很小的一个范围,感受也比较小,能够捕获图像中局部细节的信息。
在这里插入图片描述
而经过多层卷积层和池化层的堆叠后,后面的卷积层中,神经元的感受也逐层加大,可以捕获图像中更高层、更抽象的信息,从而得到图像在各个不同尺度上的抽象表示 。

除了最大池化,还有一些其他的池化方法,如下图所示。
在这里插入图片描述
在这里插入图片描述

池化层在卷积神经网络中并不是一个必须的组件,在目前一些新的卷积网络中,就没有池化层的出现。

卷积神经网络是一种监督学习的神经网络,训练过程与传统的人工神经网络相似。首先,从训练集中取出样本输入网络,经过逐级变换,传送到输出层。
在这里插入图片描述
计算输出层与样本标签之间的误差,然后反向传播误差,采用梯度下降法更新权值,最小化损失,反复迭代,在网络收敛并达到预期的精度后,结束训练。最后保存训练好的模型参数,以后就可以直接使用来进行分类了。

猜你喜欢

转载自blog.csdn.net/xuechanba/article/details/125103638