2020-10-15 Network In Network——卷积神经网络的革新

其他 2020-10-16 07:13:20 阅读次数: 0

Network In Network——卷积神经网络的革新

原文： https://www.cnblogs.com/yinheyi/p/6978223.html

Network In Network 是13年的一篇paper

引用：Lin M, Chen Q, Yan S. Network in network[J]. arXiv preprint arXiv:1312.4400, 2013.

文章的新点：

1. 采用 mlpcon 的结构来代替 traditional 卷积层；

2. remove 卷积神经网络最后的全连接层，采用 global average pooling 层代替；

mplconv 结构的提出：

conventional 的卷积层可以认为是linear model , 为什么呢，因为局部接收域上的每每一个tile 与卷积核进行加权求和，然后接一个激活函数；它的 abstraction 的能力不够，对处理线性可分的的 concept 也许是可以的，但是更复杂的 concepts 它有能力有点不够了，所以呢，需要引入 more potent 的非线性函数；

基于此，提出了 mlpcon 结构，它用多层的感知器（其实就是多层的全连接层）来替代单纯的卷积神经网络中的加权求和； mlpcon 指的是： multilayer perceptron + convolution;

两者的结构如下所示：其中下图的 Mlpconv 的有两层的隐含层；



说明：在mlpconv中的每一层的后面都跟着一个 ReLU激活函数；用于加入更多的nonlinearity;

global average pooling 结构：

卷积神经网络最后的全连接层可以说作为了一个分类器，或者作为了一个 feature clustering.   它把卷积层学习到的特征进行最后的分类；   intuitively, 根本不了解它是怎么工作的，它就像一个黑盒子一样，并且它也引入了很多的参数，会出现 overfitting 现象；   （我认为其实最后的全接层就是一个分类器）

本文，remove掉了全连接层，使用 global average pooling 来代替；举个例子更容易说明白：假设分类的任务有100 classes，所以设置网络的最后的 feature maps 的个数为 100，把每一个feature map 看作成对应每一类的概率的相关值，然后对每一个 feature map 求平均值（即 global average pooling), 得到了 100维的向量，把它直接给 softmax层，进行分类；（其实100个数中最大值对应的类别即为预测值，之所以再送给 softmax层是为了求 loss，用于训练时求梯度）

网络的整体结构：

（原 paper 中的图）

（该图来自：http://blog.csdn.net/hjimce/article/details/50458190 ，加入了相关的参数。我怎么找到这个图呢？？？？难道楼主自己根据 caffe 中的 .prototxt 文件的加上的？？）

mlpconv 的细节：

输入为一个feature map, 输出为一个feature map 时：

输入为多个feature map, 输出为一个feature map 时：

输入为多个feature map, 输出为多个feature map 时：

发现了什么？

在卷积神经网络中，无论是输入还是输出，不同的 feature map 之间的卷积核是不相同的；

在mlpconv中，不同的 feature map 之间的开头与能结尾之间的权值不一样，而在隐含层之间的权值是共享的；

另外：

全连接层之间可以看作一特殊的卷积层，其中卷积核的大小为 1*1， feature maps的个数即为全连接层中的每一层的units的数目；

所以呢，假设上面的第三个图中的输入为2*（4 *4），输出为2 * （3*3）时：

    第一层的卷积核大小为2*2，步长为1，输入为2*（4 *4），输出为 4*（3*3）；

    第二层的卷积核大小为1*1，步长为1，输入为4*（3 *3），输出为 3*（3*3）；

    第三层的卷积核大小为1*1，步长为1，输入为3*（3 *3），输出为 2*（3*3）；

global average pooling 的细节：

当分类的类别有4种时，则最后的 global average pooling 应该是这样的：

NIN结构的caffe实现：

因为我们可以把全连接层当作为特殊的卷积层，所以呢， NIN在caffe中是非常容易实现的：

https://github.com/BVLC/caffe/wiki/Model-Zoo#network-in-network-model

这是由BVLC（Berkeley Vision Learning Center）维护的一个caffe的各种model及训练好的参数权值，可以直接下载下来用的；

其它：

文中的观点：通过实验说明了 global average pooling 也可以起到很好的 regular的作用。

另外，一个比较有趣地地方就是：在可视化最后一层 feature maps时，它的激活区域与原始图片中目标所在的区域竟然相似；amazing!

补充：

文中大量用到了文献：Maxout networks. (引用：Goodfellow I J, Warde-Farley D, Mirza M, et al. Maxout networks[J]. arXiv preprint arXiv:1302.4389, 2013.）

文中也说明了 NIN比 maxout networks 更 non-linearity;

猜你喜欢

转载自blog.csdn.net/weixin_41366701/article/details/109093929

2020-10-15 Network In Network——卷积神经网络的革新

2020-10-15 YJango的卷积神经网络——介绍

10、Convolutional Neural Network（卷积神经网络）

李宏毅机器学习笔记-10 卷积神经网络（Convolutional Neural Network-RNN）

10、【李宏毅机器学习（2017）】Convolutional Neural Network（卷积神经网络）

卷积神经网络 — Convolutional Neural Network

经典卷积神经网络结构--Network In Network

[Lecture 10 ]Recurrent Neural Network（循环神经网络）

【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow

2020-10-15 1*1卷积核的作用（CNN卷积网络）---很好的介绍

卷积神经网络的网络结构——Siamese Network

卷积神经网络（Convolutional Neural Network，CNN）

什么是卷积神经网络CNN (Convolutional Neural Network)

“卷积神经网络（Convolutional Neural Network，CNN）”之问

可变形卷积神经网络 | Deformable Network

[Lecture 5] Convolutional Neural Network（卷积神经网络）

卷积神经网络（Convolutional Neural Network, CNN）

卷积神经网络——RPN(Region Proposal Network)介绍

AIGC实战——卷积神经网络(Convolutional Neural Network, CNN)

神经网络：Residual Network

Neural Network(神经网络)

神经网络（Neural Network)

神经网络(Neural Network)

神经网络Neura Network

2020-10-15 【AI不惑境】网络宽度对模型性能有什么影响？

【干货】卷积神经网络Alex-Net、VGG-Nets、Network-In-Network案例分析

卷积神经网络（Network in Network）识别Fashion-MNIST数据集（Pytorch版）

2020-10-15

[DeeplearningAI笔记]卷积神经网络2.5-2.7 Network in Network/1*1卷积/Inception网络/GoogleNet

机器学习——神经网络Neural Network(2020最新版)

今日推荐

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

OOP第二次作业

java web 乱码问题

android 禁止scrollview 因控件变化自动滚动到底的方法

mysql服务解压版的安装(5.7)

centos7 nginx+tomcat配置https 安装免费SSL Let’s Encrypt

使用Mosquitto遗嘱机制实现感知客户端上下线功能的方法

面向对象之------多态与多态性

开发Teams Tabs应用程序

C# 希尔排序

第2章 Jupyter Notebooks

每日归档

更多

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)