Pytorch 为什么每一轮batch需要设置optimizer.zero_grad

其他 2018-10-30 16:05:49 阅读次数: 0

CSDN上有人写过原因，但是其实写得繁琐了。

根据pytorch中的backward()函数的计算，当网络参量进行反馈时，梯度是被积累的而不是被替换掉；但是在每一个batch时毫无疑问并不需要将两个batch的梯度混合起来累积，因此这里就需要每个batch设置一遍zero_grad 了。

关于这一点可以参考：https://discuss.pytorch.org/t/why-do-we-need-to-set-the-gradients-manually-to-zero-in-pytorch/4903/3

关于backward()的计算可以参考：https://discuss.pytorch.org/t/how-to-use-the-backward-functions-for-multiple-losses/1826/5

猜你喜欢

转载自blog.csdn.net/xiaoxifei/article/details/83474724

Pytorch 为什么每一轮batch需要设置optimizer.zero_grad

Pytorch 中model.zero_grad 和optimizer.zero_grad等效

Pytorch中的optimizer.zero_grad和loss和net.backward和optimizer.step的理解

model.train()、model.eval()、optimizer.zero_grad()、loss.backward()、optimizer.step作用及原理详解【Pytorch入门手册】

Pytorch（一）为什么是pytorch

Pytorch: What is Pytorch? (一)

torch代码解析为什么要使用optimizer.zero_grad()

PyTorch入门（一）：什么是PyTorch

【PyTorch】PyTorch的深度学习入门：什么是Pytorch

什么是pytorch?

什么是Pytorch？

Pytorch(一)

Pytorch（一）

torch代码解析--optimizer.zero_grad

[work] pytorch grad简介

pytorch的no_grad()用法

Pytorch中的optimizer

pytorch中的lr,optimizer

Pytorch Optimizer优化器

PyTorch学习：一、PyTorch是什么？

PyTorch中的Batch Normalization

pytorch之——Batch Normalization

PyTorch 中文官方文档：什么是 PyTorch？

[pytorch][进阶之路]pytorch学习笔记一

pytorch（一）pytorch&torchvision介绍与安装

Pytorch学习笔记（一）—— Pytorch基础

pytorch: grad is None while training

pytorch查看模型weight与grad

Pytorch实现Grad-CAM

机器学习9:关于pytorch中的zero_grad（）函数

今日推荐

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

周排行

Python环境安装与基础语法（1）——计算机基础知识

IMU预积分

ADAS中的LDW、FCW、BSD、LCA、ACC、AEB、APA、DMS代表的含义

B站笔试两道题

skyeye arm 硬件虚拟机环境的搭建

Web前端静态页面示例

数组-合并排序数组 II-简单

springcloud之版本问题启动报错

面向对象-------------匿名对象(六)

输入URL到页面呈现中间发生了什么？

每日归档

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)