干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad - 代码天地

干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad

编程语言 2020-11-24 11:34:42 阅读次数: 0

1

总括

首先我们来看一下AdaGrad算法
干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad

我们可以看出该优化算法与普通的sgd算法差别就在于标黄的哪部分，采取了累积平方梯度。

简单来讲，设置全局学习率之后，每次通过，全局学习率逐参数的除以历史梯度平方和的平方根，使得每个参数的学习率不同

2

作用

那么它起到的作用是什么呢？

起到的效果是在参数空间更为平缓的方向，会取得更大的进步（因为平缓，所以历史梯度平方和较小，对应学习下降的幅度较小），并且能够使得陡峭的方向变得平缓，从而加快训练速度。

下面通过例子讲解一下：
假设我们现在采用的优化算法是最普通的梯度下降法mini-batch。它的移动方向如下面蓝色所示：
干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad

假设我们现在就只有两个参数w,b，我们从图中可以看到在b方向走的比较陡峭，这影响了优化速度。

而我们采取AdaGrad算法之后，我们在算法中使用了累积平方梯度r=:r + g.g。

从上图可以看出在b方向上的梯度g要大于在w方向上的梯度。

那么在下次计算更新的时候，r是作为分母出现的，越大的反而更新越小，越小的值反而更新越大，那么后面的更新则会像下面绿色线更新一样，明显就会好于蓝色更新曲线。
干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad

在参数空间更为平缓的方向，会取得更大的进步（因为平缓，所以历史梯度平方和较小，对应学习下降的幅度较小），并且能够使得陡峭的方向变得平缓，从而加快训练速度。

这就是AdaGrad优化算法的直观好处。

参考：YBB的Deep Learning 最优化方法之AdaGrad
吴恩达老师DeepLearning.ai课程slides

推荐阅读：

精选干货|近半年干货目录汇总
干货|吴恩达 DeepLearning.ai 课程提炼笔记（1-2）神经网络和深度学习 --- 神经网络基础
干货|吴恩达 DeepLearning.ai 课程提炼笔记（1-3）神经网络和深度学习 --- 浅层神经网络

           欢迎关注公众号学习交流~

干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad
欢迎加入交流群交

猜你喜欢

转载自blog.51cto.com/15009309/2553807

干货|通俗易懂讲解Deep Learning 最优化方法之AdaGrad

Deep Learning 最优化方法之AdaGrad

Deep Learning 之最优化方法

Deep Learning 最优化方法之Adam

Deep Learning 最优化方法之RMSProp

Deep Learning 最优化方法

Deep Learning 最优化方法之Momentum（动量）

「Deep Learning」Note on ADAGrad（比vanilla SGD好的优化算法）

通俗易懂的理解Q-Learning

Python之爬虫入门（最详细通俗易懂讲解）

Deep learning：三十七(Deep learning中的优化方法)

Deep Learning Specialization课程笔记——正则化和最优化

Deep Learning Specialization课程笔记——最优化算法

傅里叶分析之掐死教程--通俗易懂的讲解

JAVA设计模式之观察者模式（通俗易懂的代码讲解）

Deep Learning - Machine Learning

干货推荐：通俗易懂数据库MVCC讲解

通俗易懂LL(1)判别方法

Array的fill方法，通俗易懂

通俗易懂的Java方法分派策略

JVM之逃逸分析(通俗易懂)

CAN总线之通俗易懂----波形

CAN总线之通俗易懂----介绍

ThreadLocal之通俗易懂篇

Deep Learning

9、Tips for Deep Learning（深度学习优化）

迁移学习 Transfer Learning—通俗易懂地介绍（常见网络模型pytorch实现）

What is Machine Learning, Deep Learning and Structured Learning?

性能优化｜史上最通俗易懂的讲解5大垃圾收集器，独家整理哦

Deep Learning快速学习方法

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)