深度学习《梯度消失和梯度爆炸》 - 代码天地

深度学习《梯度消失和梯度爆炸》

其他 2020-10-25 08:41:31 阅读次数: 0

一：梯度消失
在深层网络中，一方面由于求导法则，计算越前面层次或者时刻的梯度，会出现很多的乘法运算，很容易导致梯度消失和梯度爆炸，另一方面还受到激活函数的影响，Sigmoid函数和tanh函数会出现梯度为0 的区域，前面也说了，BP网络中，使用skip connection可以解决梯度消失，典型的就是ResNet。在RNN中LSTM, GRU就是解决思路。

其实我感觉他们的思路有异曲同工之妙，都是将先前的层次/序列的输出通过某种方式可以输入到某一层次需要用到的时候。求导的过程中，偏导数不至于为0，或者说降低了为0的概率，解决该问题。

二：梯度爆炸
那出现了梯度爆炸怎么玩呢？出现梯度爆炸的时候，参数值可能变得异常巨大，可能是NaN，这时候甚至都能计算溢出，这个时候我们需要进行干预了，用到技巧就叫做 Grident Clipping。

过程如下：设置一个梯度的阈值，一旦发现计算后的梯度大于该阈值，立马进行干预，也不难，就是多个判断的过程。

1）先设置一个梯度的阈值，也就是最大值，不能大于这个值
2）反向传播中比较阈值和梯度的大小
3）如果地图大于这个阈值，立马对地图进行缩放处理，让他不能大于这个阈值。
伪代码如下截图：

在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_29367075/article/details/108958796

深度学习-梯度消失和梯度爆炸

深度学习《梯度消失和梯度爆炸》

【深度学习】梯度消失和爆炸

深度学习笔记 3 梯度消失和梯度爆炸

深度神经网络梯度消失和梯度爆炸问题

深度学习—梯度消失和爆炸、权重初始化

机器学习中的数学——深度学习优化的挑战：梯度消失和梯度爆炸

【深度学习系列】DNN中梯度消失和梯度爆炸的原因推导

深度学习-------过拟合和欠拟合，梯度消失和梯度爆炸，优化器

深度学习中的梯度消失与梯度爆炸

[深度学习] 梯度消失与梯度爆炸

深度学习-梯度爆炸和梯度消失

【深度学习】：梯度消失与梯度爆炸

深度学习梯度爆炸与梯度消失

深度学习——梯度消失、梯度爆炸

【深度学习笔记】梯度消失与梯度爆炸

机器学习（自然语言处理）-2-梯度消失和梯度爆炸

机器学习梯度消失和梯度膨胀

学习笔记：梯度爆炸和梯度消失

梯度消失和爆炸

梯度消失和梯度爆炸

深度学习之如何防止梯度爆炸/梯度消失?

深度学习之详解梯度爆炸和梯度消失

动手深度学习之# 梯度消失、梯度爆炸

RNN梯度消失和爆炸

Python深度学习027：什么是梯度、梯度消失、梯度爆炸以及如何解决

梯度消失和梯度爆炸的解答

梯度消失和梯度爆炸理解

对于梯度消失和梯度爆炸的理解

梯度消失和梯度爆炸情况详解

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)