【64】可视化理解卷积神经网络

1. 学习内容
深度卷积网络到底在学什么？

来看一个例子，假如训练了一个卷积神经网络，是一个Alexnet，轻量级网络
希望将看到不同层之间隐藏单元的计算结果

可以这样做，从第一层的隐藏单元开始，假设遍历了训练集
然后找到那些使得单元激活最大化的一些图片或者图片块
换句话说，将训练集经过神经网络
然后弄明白哪一张图片最大限度地激活特定的单元

这里使用的所有例子来自于Matthew Zener和Rob Fergus的这篇论文
题目是（Zeiler M D, Fergus R. Visualizing and Understanding Convolutional Networks[J]. 2013, 8689:818-833.）《可视化理解卷积神经网络》
这里会使用一种更简单的方法来可视化神经网络隐藏单元的计算内容
如果读过他们的论文，会发现他们提出了一些更复杂的方式来可视化卷积神经网络的计算

2. 第一层
注意在第一层的隐藏单元，只能看到小部分卷积神经
如果要画出来哪些激活了激活单元，只有一小块图片块是有意义的
因为这就是特定单元所能看到的全部

选择一个隐藏单元，发现有9个图片最大化了单元激活，可能找到这样的9个图片块（编号1）
似乎是图片浅层区域显示了隐藏单元所看到的，找到了像这样的边缘或者线（编号2）
这就是那9个最大化地激活了隐藏单元激活项的图片块

然后可以选一个另一个第一层的隐藏单元，重复刚才的步骤
这是另一个隐藏单元，似乎第二个由这9个图片块（编号1）组成
看来这个隐藏单元在输入区域，寻找这样的线条（编号2），也称之为接受域

其他隐藏单元也进行处理，会发现其他隐藏单元趋向于激活类似于这样的图片
这个似乎对垂直明亮边缘左边有绿色的图片块（编号1）感兴趣
这一个隐藏单元倾向于橘色，这是一个有趣的图片块（编号2）
红色和绿色混合成褐色或者棕橙色，但是神经元仍可以激活它

以此类推，这是9个不同的代表性神经元，每一个不同的图片块都最大化地激活了
可以这样理解，第一层的隐藏单元通常会找一些简单的特征，比如说边缘或者颜色阴影

3. 第二层
在深层部分，一个隐藏单元会看到一张图片更大的部分
在极端的情况下，可以假设每一个像素都会影响到神经网络更深层的输出
靠后的隐藏单元可以看到更大的图片块
画出和这页中的大小相同的图片块：

但如果重复这一过程
这（Layer 1所示图片）是之前第一层得到的
这（Layer 2所示图片）是可视化的第2层中最大程度激活的9个隐藏单元

解释一下这个可视化
这是（编号1所示）使一个隐藏单元最大激活的9个图片块
这是另一组（编号2），使得一个隐藏单元被激活的9个图片块

这个可视化（Layer 2所示图片）展示了第二层的9个隐藏单元
每一个又有9个图片块使得隐藏单元有较大的输出或是较大的激活

在更深的层上，可以重复这个过程

这里很难看清楚，这些微小的浅层图片块，放大一些，这是第一层
这是第一个被高度激活的单元
能在输入图片的区域看到，大概是这个角度的边缘（编号1）放大第二层的可视化图像

第二层似乎检测到更复杂的形状和模式，比如说：
这个隐藏单元（编号1），它会找到有很多垂线的垂直图案
这个隐藏单元（编号2）似乎在左侧有圆形图案时会被高度激活
这个隐藏单元（编号3）是很细的垂线
以此类推，第二层检测的特征变得更加复杂

4. 第三层

看看第三层将其放大，放得更大一点，看得更清楚一点，这些东西激活了第三层
这个隐藏单元（编号1）似乎对图像左下角的圆形很敏感，所以检测到很多车
这个隐藏单元（编号2）似乎开始检测到人类
这个隐藏单元（编号3）似乎检测特定的图案，蜂窝形状或者方形，类似这样规律的图案
有些很难看出来，需要手动弄明白检测到什么，但是第三层明显，检测到更复杂的模式

5. 第四层

这是第四层，检测到的模式和特征更加复杂
这个隐藏单元（编号1）学习成了一个狗的检测器
但是这些狗看起来都很类似，并不知道这些狗的种类，但是知道这些都是狗，他们看起来也类似
这个隐藏单元（编号2）隐藏单元它好像检测水及其水上的动物
这个隐藏单元（编号3）似乎检测到鸟的脚等等

6. 第五层

第五层检测到更加复杂的事物
这个隐藏单元（编号1）也有一个神经元，似乎是一个狗检测器，但是可以检测到的狗似乎更加多样性
这个隐藏单元（编号2）可以检测到键盘，或者是键盘质地的物体，可能是有很多点的物体
这个隐藏单元（编号3）可能检测到文本，但是很难确定
这个这个隐藏单元（编号4）检测到花

现在已经有了一些进展，从检测简单的事物，比如说：
第一层的边缘，第二层的质地，到深层的复杂物体

【64】可视化理解卷积神经网络

猜你喜欢