tensorlfow中的KLDivergence与pytorch的KLDivLoss使用差异 - 代码天地

tensorlfow中的KLDivergence与pytorch的KLDivLoss使用差异

企业开发 2023-07-21 03:03:11 阅读次数: 0

pytorch中的手册：torch.nn.KLDivLoss

在这里插入图片描述

kl_loss = nn.KLDivLoss(reduction="batchmean")
# input should be a distribution in the log space
input = F.log_softmax(torch.randn(3, 5, requires_grad=True))
# Sample a batch of distributions. Usually this would come from the dataset
target = F.softmax(torch.rand(3, 5))
output = kl_loss(input, target)

kl_loss = nn.KLDivLoss(reduction="batchmean", log_target=True)
log_target = F.log_softmax(torch.rand(3, 5))
output = kl_loss(input, log_target)

tensorflow中的手册：tf.keras.losses.KLDivergence

在这里插入图片描述

y_true = [[0, 1], [0, 0]]
y_pred = [[0.6, 0.4], [0.4, 0.6]]
# Using 'auto'/'sum_over_batch_size' reduction type.
kl = tf.keras.losses.KLDivergence()
kl(y_true, y_pred).numpy()

>>0.458

再看一个例子：

tensorflow下的计算：
在这里插入图片描述
两个序列的概率分布一致，所以为0

pytorch下的计算：
在这里插入图片描述
明明是一样的分布，pytorch却没有输出0？
这是因为根据pytoch手册，需要对y_pred取手动log

if not log_target: # default
    loss_pointwise = target * (target.log() - input)
else:
    loss_pointwise = target.exp() * (target - input)

在这里插入图片描述
可以看到计算正确了。

注意：实际使用中，往往需要搭配softmax使用
即y_true里面的数值加起来为1，如0.1+0.2+0.3+0.4=1

下面是pytorch的使用例子：

kl_loss = nn.KLDivLoss(reduction="batchmean")
# input should be a distribution in the log space
input = F.log_softmax(torch.randn(3, 5, requires_grad=True)) #y_pred取log再softmax
# Sample a batch of distributions. Usually this would come from the dataset
target = F.softmax(torch.rand(3, 5))  #y_true做softmax
output = kl_loss(input, target)

kl_loss = nn.KLDivLoss(reduction="batchmean", log_target=True)
log_target = F.log_softmax(torch.rand(3, 5))
output = kl_loss(input, log_target)

猜你喜欢

转载自blog.csdn.net/aa2962985/article/details/124252785

tensorlfow中的KLDivergence与pytorch的KLDivLoss使用差异

tensorflow中的KLDivergence的使用示例

cuda、cudnn、tensorlfow、pytorch的安装及常见问题解答

tensorlfow基础

pytorch中tensorboardX使用

pytorch中tensorboard的使用

nn.KLDivLoss

js中 let var const 的差异和使用场景

tensorlfow 可视化

Pytorch学习 (十二) ----- Pytorch中如何使用Tensor Comprehensions

jquery版本中的差异

makefile中=,:=,?=,+=的差异

Pytorch学习（十九）--- 模型中buffer的使用

pytorch 中的view 参数使用方法

pytorch中的embedding词向量的使用

pad_sequence在pytorch中的使用

python及pytorch中乘法使用小结

PyTorch中DataLoader与Dataset的使用、关系&原理

python-ignite在pytorch中的使用

浅谈Pytorch中的Variable的使用方法

Pytorch中DataLoader的使用方法

PyTorch中DistributedDataParallel使用笔记

python中index()与find()的差异

HttpServletRequest中getRequestDispatcher()与sendRedirect()差异

HTTP协议及其POST与GET操作差异 & C#中如何使用POST、GET等

Python 中的列表跟元组存储方式和性能的差异、使用的场景

ReentrantLock中四种加锁方式的使用区别和源码实现的细节差异

前端：一篇彻底搞懂vuex中dispatch与commit的使用及差异

pytorch 使用

Pytorch中ImageFolder的使用，如何使用Pytorch加载本地Imagenet的训练集与验证集

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)