随机梯度下降 - 代码天地

随机梯度下降

其他 2019-11-24 15:34:12 阅读次数: 0

优化目标函数：\(L(\theta) = \mathbb{E}_{(x,y) \sim p_{data}} L(f(x, \theta), y)\)
找到平均损失最小的模型参数，也就是求解优化问题：\(\theta^{*} = \mathop{\arg \min} L(\theta)\)

经典梯度下降

采用所有训练数据的平均损失来近似目标函数，即\(L(\theta) = \frac{1}{M}\sum \limits_{i=1}^{M}L(f(x_i, \theta), y_i)\)
\(\nabla L(\theta) = \frac{1}{M}\sum \limits_{i=1}^{M}\nabla L(f(x_i, \theta), y_i)\)
需要遍历所有训练数据，计算开销太大，但效果其实最好

随机梯度下降

用单个训练样本的损失来近似平均损失，即

\[\begin{aligned} L(\theta; x_i, y_i) & = L(f(x_i, \theta), y_i) \\ \nabla L(\theta; x_i, y_i) & = \nabla L(f(x_i, \theta), y_i) \end{aligned}\]
加快收敛速度，也适合在线更新
小批量梯度下降法
- 降低随机梯度的方差，使迭代更稳定
- 充分利用高度优化的矩阵运算
- 同时处理m个训练数据\(\{ (x_1, x_2), \cdots, (x_m, y_m) \}\),目标函数及其梯度为
  
  \[\begin{aligned} L(\theta) & = \frac{1}{m} \sum \limits_{i=1}^{m}L(f(x_i, \theta), y_i) \\ \nabla L(\theta) & = \frac{1}{m} \sum \limits_{i = 1}^{m} \nabla L(f(x_i, \theta), y_i) \end{aligned}\]
- 注意：
  - m的选取：一般选2的幂次，充分利用矩阵运算
  - 挑选m条数据：shuffle
  - 学习率：动态可调的

猜你喜欢

转载自www.cnblogs.com/weilonghu/p/11922496.html

梯度下降，随机梯度下降，

随机梯度/批量梯度下降

随机梯度下降 (SGD)

随机梯度下降+变体

PyTorch 随机梯度下降

随机梯度下降

随机梯度下降法

随机梯度下降与批梯度下降

随机梯度下降与批量梯度下降

批量梯度下降和随机梯度下降

梯度下降法和随机梯度下降

批量梯度下降and随机梯度下降

线性模型（梯度下降&随机梯度下降）

梯度下降、随机梯度下降和批量梯度下降

梯度下降随机梯度下降批量梯度下降

梯度下降、随机梯度下降、批量梯度下降

随机梯度下降与动量详解

随机梯度下降法(SGD)

Python之随机梯度下降

线性回归-随机梯度下降

梯度下降，随机梯度下降，小批量梯度下降，动量梯度下降的区别

随机梯度下降(SGD)和批量梯度下降(BGD)的区别

批量梯度下降和随机梯度下降的区别

随机梯度下降和批量梯度下降的简单代码实现

梯度下降之随机梯度下降 -minibatch 与并行化方法

tensorflow 2.0 随机梯度下降之梯度下降

批量梯度下降和随机梯度下降实现

梯度下降（Gradient Decent）与随机梯度下降（Stochastic Gradient Decent）

梯度下降系列博客：5、随机梯度下降代码实战

梯度下降（一）：批梯度下降、随机梯度下降、小批量梯度下降、动量梯度下降、Nesterov加速梯度下降法 Matlab 可视化实现

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

LogN级别的区间查询算法(线段树), 你学会了吗

数论概论(英文版.第4版)

idea 更新后和新的直接安装前，都需要配置 idea64.exe.vmoptions 后再使用

CANOpen系列教程04_CAN总线波特率、位时序、帧类型及格式说明

Java序列化基础

java排序算法整理

异常：org.apache.ibatis.reflection.ReflectionException

（算法练习）——二路归并排序

go 闭包函数

好程序员web前端技术分享媒体查询

每日归档

更多

2024-05-21(8)

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)