pytorch---之什么时候in-place操作不能用 - 代码天地

pytorch---之什么时候in-place操作不能用

其他 2018-10-11 23:57:02 阅读次数: 0

原文发表在知乎上在这里就做一下同步吧。
(本文章适用于 pytorch0.4.0 版本, 既然 Variable 和 Tensor merge 到一块了, 那就叫 Tensor吧)

在编写 pytorch 代码的时候, 如果模型很复杂, 代码写的很随意, 那么很有可能就会碰到由 inplace operation 导致的问题. 所以本文将对 pytorch 的 inplace operation 做一个简单的总结.

在 pytorch 中, 有两种情况不能使用 inplace operation:

对于 requires_grad=True 的叶子张量(leaf tensor) 不能使用 inplace operation
对于在 求梯度阶段需要用到的张量 不能使用 inplace operation

下面将通过代码来说明以上两种情况:

第一种情况: requires_grad=True 的 leaf tensor

import torch

w = torch.FloatTensor(10) # w 是个 leaf tensor
w.requires_grad = True    # 将 requires_grad 设置为 True
w.normal_()               # 在执行这句话就会报错
# 报错信息为
#  RuntimeError: a leaf Variable that requires grad has been used in an in-place operation.

很多人可能会有疑问, 模型的参数就是 requires_grad=true 的 leaf tensor, 那么模型参数的初始化应该怎么执行呢? 如果看一下 nn.Module._apply() 的代码, 这问题就会很清楚了

w.data = w.data.normal() # 可以使用曲线救国的方法来初始化参数

第二种情况: 求梯度阶段需要用到的张量

import torch
x = torch.FloatTensor([[1., 2.]])
w1 = torch.FloatTensor([[2.], [1.]])
w2 = torch.FloatTensor([3.])
w1.requires_grad = True
w2.requires_grad = True

d = torch.matmul(x, w1)
f = torch.matmul(d, w2)
d[:] = 1 # 因为这句, 代码报错了 RuntimeError: one of the variables needed for gradient computation has been modified by an inplace operation

f.backward()

为什么呢?

因为 f=matmul(d, w2) , ∂f∂w2=g(d)

--------------------- 本文来自 ke1th 的CSDN 博客，全文地址请点击：https://blog.csdn.net/u012436149/article/details/80819523?utm_source=copy

扫描二维码关注公众号，回复： 3538435 查看本文章

猜你喜欢

转载自blog.csdn.net/zxyhhjs2017/article/details/82843657

pytorch---之什么时候in-place操作不能用

Pytorch中的in-place操作

【OpenCV】in-place操作

入门科普：什么时候要用Python？用哪个版本？什么时候不能用？

【Pytorch】Tensor的分块、变形、排序、极值与in-place操作

在PyTorch中in-place operation的含义

Pytorch中in-place操作相关错误解析及detach()方法说明

pytorch---之mnist

pytorch---之MultiStepLR

pytorch---之halfTensor

pytorch---之item()

字符串拼接一定要用 SB 吗？为什么不能用 + ？能不能用 + ？什么时候可以用 + ？

编程中的In-place operation(就地操作)是什么意思？

Pytorch什么时候开始调用forward

pytorch小知识点（一）-------in-place operation

pytorch的in-place问题（a+=b 和a=a+b的区别）

pytorch---之pytorch与tensorflow的pad不同

pytorch lstm 什么时候使用output(输出层)，什么时候使用h(隐藏层)

In-place Sorting

In-Place原地算法

pytorch---张量（tensor）的基本操作

排序算法中In-place和Out-place是什么意思？

什么时候不能使用箭头函数

什么时候不能使用箭头函数？

pytorch---之读取csv文件

pytorch---之权重初始化

pytorch---之chirdren()和modules()

#科技好文#翻译#什么是5G，什么时候我能用上它

pytorch bug: a leaf Variable that requires grad has been used in an in-place operation

React和Vue等框架什么时候操作DOM

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)