深度篇—— Deep Learning 经典网络 model 发展史(四) 细说 VGG16 结构和特点

上一章：深度篇—— Deep Learning 经典网络 model 发展史(三) 细说 ZF-Net 结构和特点

下一章：深度篇—— Deep Learning 经典网络 model 发展史(五) 细说 GoogleNet 结构和特点 (包括 v1, v2, v3)

本小节，细说 VGG16 结构和特点，下一小节细说 GoogleNet 结构和特点 (包括 v1, v2, v3)

VGG16 论文：Very Deep Convolutional Networks for Large-Scale Image Recognition

二. 经典网络(Classic Network)

4. VGG16

VGG16 是由牛津大学 VGG (Visual Geometry Group, VGG) 提出的，是 2014 年 ImageNet 竞赛定位任务的第一名和分类任务的第二名中的基础网络。观察以往的 AlexNet 和 ZF-Net 的经验，发现，卷积核变小，网络加深，有利于提高精度，所以，VGG16 就是奔着这个方向去发展而得的。

(1). 网络描述: $\large input(-1, \; 224,\; 224,\; 3)$

扫描二维码关注公众号，回复： 10251058 查看本文章

vgg16网络结构图

(2). VGG16 的新特点：

①. 在 VGG16 中，所有的卷积核大小都为 $\large 3 \times 3$ ，步幅都为 $\large 1 \times 1$ ，padding 都为 SAME；所有的池化都为 max_pool()，池化核大小都为 $\large 2 \times 2$ ，步幅都为 $\large 2 \times 2$ ，padding 都为 VALID。

②. VGG16 相比于 AlexNet 的一个改进是采用连续的几个 $\large 3 \times 3$ 的卷积核代替 AlexNet 中较大的卷积核 ( $\large 11 \times 11, 5\times 5$ )。对给定的感受野(与输出有关的输入图像的局部大小)，对给定的感受野(与输出有关的输入图像的局部大小)，采用堆积的小卷积核是优于采用大的卷积核，因为多层非线性层可以增加网络深度来保证学习更复杂的模式，而且代价还比较小(参数更少，5 x 5 > 3 x 3 + 3 x 3)