神经网络训练的一些建议（Batch Normalization） - 代码天地

神经网络训练的一些建议（Batch Normalization）

其他 2018-08-11 14:06:18 阅读次数: 0

数据的归一化

先放上宏毅大神的图，说明一下我们为什么要做数据的归一化

说明：x2的变化比较大，使用w2方向上就显得比较陡峭（梯度），学习率就不能设置得过大。

Batch Normalization

为什么要有batch normalization

主要是避免internal covariate shift，如图所示，输出上下波动太大（如同第二个人）的话会影响整个模型的训练，第二个人告诉第二个人话筒放低点，第三个人告诉第二个人放高点，如果你的步长过大的话就会变成第二个图，跟没训练一样，所以最开始为了解决这样的状况，会考虑把学习率放小点，但这样网络就会变得比较慢。所以bn就可以把每一层的输出的变化都变小。训练也会变快，我们也就能训练更加深层的神经网络。

这边吴恩达的解释也是异曲同工：
Batch归一化减少了输入值改变的问题，它的确使这些值变得更稳定，神经网络的之后层就会有更坚实的基础。即使使输入分布改变了一些，它会改变得更少。它做的是当前层保持学习，当改变时，迫使后层适应的程度减小了，你可以这样想，它减弱了前层参数的作用与后层参数的作用之间的联系，它使得网络每层都可以自己学习，稍稍独立于其它层，这有助于加速整个网络的学习。

所以，希望这能带给你更好的直觉，重点是Batch归一化的意思是，尤其从神经网络后层之一的角度而言，前层不会左右移动的那么多，因为它们被同样的均值和方差所限制，所以，这会使得后层的学习工作变得更容易些。
Batch归一化还有一个作用，它有轻微的正则化效果。

测试时的batchnorm

我们使用指数平均的方法计算每一个batch的平均值

猜你喜欢

转载自blog.csdn.net/Ding_xiaofei/article/details/81488414

神经网络训练的一些建议（Batch Normalization）

Caffe下卷积神经网络（CNN）中的一些特殊层(Batch Normalization)

batch normalization 与 layer normalization

Batch Normalization & Layer Normalization

神经网络优化-Batch Normalization(BN)

Batch Normalization 对于神经网络的影响

神经网络的归一化（batch normalization）

Batch Normalization

Batch Normalization 神经网络加速算法

卷积神经网络 Batch Normalization作用与原理

Batch Normalization —— 加速深度神经网络收敛利器

神经网络BN(Batch Normalization)层总结(下)

神经网络BN(Batch Normalization)层总结(上)

Batch Normalization：加速神经网络训练的通用手段

Batch Normalization导读 Batch Normalization导读

人工神经网络知识、激活函数、正则化、优化技术、Batch Normalization、Layer Normalization

batch_normalization和layer normalization的区别

batch normalization（BN）& group normalization（GN）

Batch normalization和Instance normalization的对比

Batch Normalization与Layer Normalization的区别与联系

神经网络--CNN的池化、激活函数、批处理归一化Batch Normalization

Batch Normalization层

对Batch Normalization的理解

解读Batch Normalization

batch normalization 详解

论文之Batch Normalization

[Tensorflow] Batch Normalization实现

Tensorflow实现Batch Normalization

Batch Normalization 学习笔记

Batch Normalization原理

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

周排行

购置笔记本常识

从源码看Spring Security之采坑笔记（Spring Boot篇）

大数据学习——高可用配置案例

如何避免选择不专业的建站公司?

Euclid's Game HDU - 1525（博弈）

面试笔记（六）---Js实现eventHandler

Windows 实例搭建的 FTP 在外网无法连接和访问

设计模式 : 桥接模式

USB 设备驱动开发之几个重要结构体分析

14-p14_sqrt求平方根

每日归档

更多

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)