【深度学习笔记】随机梯度下降法

编程语言 2023-08-11 17:44:23 阅读次数: 0

本专栏是网易云课堂人工智能课程《神经网络与深度学习》的学习笔记，视频由网易云课堂与 deeplearning.ai 联合出品，主讲人是吴恩达 Andrew Ng 教授。感兴趣的网友可以观看网易云课堂的视频进行深入学习，视频的链接如下：

神经网络和深度学习 - 网易云课堂

也欢迎对神经网络与深度学习感兴趣的网友一起交流 ~

目录

2 随机梯度下降法

1 Mini-batch

常规的梯度下降法，在大数据集基础上的训练速度通常很慢。使用 Mini-batch 优化方法，可以提高神经网络训练的效率。

之前提到的向量化技巧，使深度学习算法能高效地处理 m 个样本。但是如果 m 很大的话，处理速度仍然很慢，比如说，m 是 500 万或 5000 万。

在使用梯度下降法时，每一步迭代必须处理训练集中的所有样本，然后才能进行下一步迭代。也就是，在某一次的迭代过程中，神经网络算法处理了完整的 500 万个训练样本，然后下一次迭代又需要重新处理 500 万个样本。

现在换一种方法，把训练集划分为许多子训练集，这些子训练集叫做 Mini-batch。假设总样本有 500 万个，每个 Mini-batch 包含 1000 个样本，那么你将有 5000 个 Mini-batch。

2 随机梯度下降法

在训练集上使用 Mini-batch 梯度下降法，处理过程如下：

使用 Batch 梯度下降法时，每次迭代都需要遍历整个训练集，成本函数的值随着迭代次数的增加而下降。然而使用 Mini-batch 梯度下降法时，如果你绘制出成本函数随迭代次数的变化曲线，你会发现并不是每次迭代都会下降。

如果 Mini-batch 的大小是 m，其实就是 Batch 梯度下降法，Mini-batch 等于整个训练集；

如果 Mini-batch 的大小是 1，就有了新的算法——随机梯度下降法（Stochastic gradient descent）。在随机梯度下降法中，每个样本都是独立的 Mini-batch。

在随机梯度下降法中，成本函数值的下降过程比较缓慢，且存在较多的噪声，即有时候朝着远离全局最小值的方向前进。不过平均来看，随机梯度下降法最终会接近全局最小值。

猜你喜欢

转载自blog.csdn.net/sxyang2018/article/details/131842097

【深度学习笔记】随机梯度下降法

【深度学习笔记】动量梯度下降法

随机梯度下降法

机器学习：随机梯度下降法

随机梯度下降法学习

机器学习之梯度下降法（GD）、随机梯度下降法（SGD）和随机平均梯度下降法（SAGD）

深度学习之梯度下降法

深度学习（四）：梯度下降法

二、PyTorch 深度学习梯度下降法

梯度下降法和随机梯度下降

［笔记］梯度下降法

笔记-梯度下降法

机器学习笔记之梯度下降法

CNN学习笔记：梯度下降法

[机器学习笔记] 梯度下降法

机器学习梯度下降法笔记

深度学习理论——随机梯度下降法(SGD) && 反向传播

随机梯度下降法(SGD)

深度学习笔记之【随机梯度下降（SGD）】

【pytorch深度学习实践】笔记—03.2.随机梯度下降

深度学习之梯度下降法,用excel体验梯度下降法

学习笔记13：随机梯度下降法（Stochastic gradient descent, SGD）

深度学习入门笔记（二）————线性神经网络，delta学习规则，梯度下降法

机器学习：随机梯度下降法（线性回归中的应用）

深度学习笔记：2.1|2.2 mini-batch梯度下降法及其理解

吴恩达深度学习笔记（8）-重点-梯度下降法（Gradient Descent）

梯度下降法、随机梯度下降法、小批量梯度下降法

【深度学习】机器学习概述（二）优化算法之梯度下降法（批量BGD、随机SGD、小批量）

深度学习原理-----线性回归+梯度下降法

梯度下降法课堂笔记

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)