Pytorch clone() detach() - 代码天地

Pytorch clone() detach()

企业开发 2024-11-03 00:14:37 阅读次数: 0

1.clone()主要用于模块复用数据进行复制，不共享同一内存，梯度可以回溯

c=torch.tensor(1.0,requires_grad=True)
b=c*2
d=b**2  （**）

b_=b.clone()
e_=b_**3
e_.backward(retain_graph=True)
"""
b.zero_()  这里的b是d.backward()的回溯节点（**），在回溯前不能进行in place 操作,
目的保证梯度计算正确，但如果是b_.zero_()就不会报错，因为clone不共享内存
"""
d.backward()
print(c.grad)  #tensor(32.)

这里单独查看b_.grad或者b.grad都不存在，因为他们是中间变量，不需要保存，更新也是只更新叶子节点，此外要设置retain_graph=True,因为有一条线路上先进行了梯度回溯，为节省显存计算图会释放。

2.detach()主要用于数据的提取，共享同一内存，强制require_grad=False(即使设置为True也不进行梯度回溯)

c=torch.tensor(1.0,requires_grad=True)
b=c*2
w=b**2

b_=b.detach()
q=torch.tensor(1.0,requires_grad=True)
e_=q**b_
e_.backward()

#b_.zero_()  因为detach共享内存，这里进行in palce操作会报错
w.backward()
print(q.grad)  #tensor(2.)

猜你喜欢

转载自blog.csdn.net/weixin_41914570/article/details/121003687

Pytorch clone() detach()

pytorch张量复制clone()和detach()

[pytorch] detach().clone().cpu().numpy() 操作解析

pytorch：对比clone、detach以及copy_等张量复制操作

pytorch中关于detach clone 梯度等一些理解

Pytorch之data、clone()、detach()、copy_()区别

pytorch的两个函数 tensor.detach()，tensor.detach_()，tensor.clone() 的作用和区别

pytorch: Variable detach 与 detach_

pytorch中copy_()、detach()、data()和clone()操作区别小结

Pytorch：Variable detach

pytorch-detach

Pytorch-detach()用法

pytorch-Detach的作用

pytorch .detach() .detach_() 和 .data

Pytorch基础：Tensor的detach方法

PyTorch中 detach() 、detach_()和 data 的区别

pytorch中data和detach()的区别

深入学习jquery源码之detach()和clone()

pytorch .detach() .detach_() 和 .data用于切断反向传播

Pytorch入门学习（九）---detach()的作用（从GAN代码分析)

pytorch中required_grad和detach的澄清

PyTorch中 tensor.detach() 和 tensor.data 的区别

pytorch中.numpy()、.item()、.cpu()、.detach()及.data的使用

pytorch中.data与.item()，.numpy()，.detach()，.cuda()，.cpu()的作用

深入浅出Pytorch函数——torch.Tensor.detach

警告UserWarning: To copy construct from a tensor, it is recommended to use sourceTensor.clone().detach

pytorch系列 --4 pytorch 0.4改动后Variable和Tensor合并问题data和.detach

Pytorch: detach 和 retain_graph,和 GAN的原理解析

对于pytorch中的detach copy 讲解很好的一篇博文

Pytorch torch.Tensor.detach()方法的用法及修改指定模块权重的方法

今日推荐

周排行

函数作用域说明

安卓开发中发送短信的方法 APP内单发短信群发短信 APP跳转到短信页单条短信多条短信Intent跳转

Java之字节数组和字符串的转换问题

c++结构体实例之按结构体中指定变量进行排序

Java笔记丨10-1 数组示例

安装Google Cloud SDK遇到的问题和解决

使用JDBC调用Oracle存储过程或存储函数

vim在同一个窗口中同时编辑多个文件

IDEA中实用的插件

DataGridView 设定单元格只读

每日归档

更多

2025-02-02(0)

2025-02-01(0)

2025-01-31(0)

2025-01-30(0)

2025-01-29(0)

2025-01-28(0)

2025-01-27(0)

2025-01-26(0)

2025-01-25(0)

2025-01-24(0)