【torch】rsample与sample的区别 - 代码天地

【torch】rsample与sample的区别

企业开发 2023-12-18 02:31:16 阅读次数: 0

sample()：从概率分布中随机采样。所以，我们不能反向传播，因为它是随机的！（计算图被截断）。

请参阅torch.distributions.normal.Normal中示例的源代码：

def sample(self, sample_shape=torch.Size()):
    shape = self._extended_shape(sample_shape)
    with torch.no_grad():
        return torch.normal(self.loc.expand(shape), self.scale.expand(shape))

torch.normal 返回随机数张量。此外，torch.no_grad() 上下文可以防止计算图进一步增长。

你看，我们不能反向传播。 Sample() 返回的张量仅包含一些数字，而不是整个计算图。

那么，rsample() 是什么？

通过使用 rsample，我们可以反向传播，因为它使计算图保持活动状态。

如何？通过将随机性放在单独的参数中。这称为“重新参数化技巧”。

rsample：使用重新参数化技巧进行采样。

源码中有eps：

def rsample(self, sample_shape=torch.Size()):
    shape = self._extended_shape(sample_shape)
    eps = _standard_normal(shape, dtype=self.loc.dtype, device=self.loc.device)
    return self.loc + eps * self.scale

eps 是负责采样随机性的单独参数。

查看返回值：平均值 + eps * 标准差

eps 不依赖于您想要微分的参数。

所以，现在你可以自由地反向传播（=微分），因为当参数改变时 eps 不会改变。

（如果我们改变参数，重新参数化的样本的分布会因为 self.loc 和 self.scale 改变而改变，但 eps 的分布不会改变。）

请注意，采样的随机性来自于 eps 的随机采样。计算图本身不存在随机性。一旦选择了 eps，它就被固定了。（eps 元素的分布在采样后是固定的。）

例如，在强化学习中的 SAC（Soft Actor-Critic）算法的实现中，eps 可能由与单个小批量动作相对应的元素组成（并且一个动作可能由许多元素组成）。

猜你喜欢

转载自blog.csdn.net/qq_42725437/article/details/134979212

【torch】rsample与sample的区别

torch.grid_sample

Batch, Epoch, Iteration, Sample的区别

torch.max ()与 torch.argmax()的区别

torch.mm, torch.mul, torch.matmul的区别

torch.mul、torch.mm、torch.bmm、torch.matmul的区别

torch.mul | torch.mm | torch.bmm | torch.matmul的区别和使用

torch.FloatTensor,torch.Tensor,torch.tensor,torch.as_tensor,torch.from_numpy的区别与连系总结

torch.mul() 和 torch.mm() 区别

torch.nn 和 torch.functional 的区别

pytorch torch.expand和torch.repeat的区别

PyTorch中torch.tensor与torch.Tensor的区别

pytorch中torch.transpose()与torch.tensor.permute()的区别

torch.Tensor与torch.tensor的三个区别

torch.as_tensor()、torch.Tensor() 、 torch.tensor() 、transforms.ToTensor()的区别

torch.functional 和torch.nn.functional，torch.nn和torch.nn.functional的区别

torch和numpy使用之间的区别

K.dot与torch.dot的区别

torch.meshgrid与np.meshgrid区别

torch.norm()与F.normalize()的区别

torch.gather与tf.gather的区别

targets.append(torch.FloatTensor(sample[1])) RuntimeError: given sequence has an invalid size of dimension 2: 0

【个人记录】torch转onnx对上TensorRT的grid_sample接口（4D/5D）进行加速

torch.sigmoid()、torch.nn.Sigmoid()和torch.nn.functional.sigmoid()三者之间的区别

torch.nn与torch.nn.functional之间的区别和联系

Pytorch本人疑问(1) torch.nn和torch.nn.functional之间的区别

Pytorch中torch.Tensor和torch.tensor()以及其他Tensor类型的区别

pytorch学习笔记torch.mul() 和 torch.mm() 的区别

【Pytorch基础】torch.nn.dropout和torch.nn.F.dropout区别

torch.nn.dropout和torch.nn.F.dropout区别

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)