softmax+交叉熵损失函数的数值举例

企业开发 2025-04-11 17:46:51 阅读次数: 0

文章目录

一、目标为类别索引的例子
二、目标为类别概率分布的例子
三、举例说明
- 3.1 计算类别索引模式的交叉熵：
- 3.2 计算类别概率分布模式的交叉熵：

这段代码展示了两种不同的方式使用 torch.nn.functional.cross_entropy 来计算交叉熵损失，分别是目标为类别索引和目标为类别概率分布的情况。下面是对代码的逐步解释：

一、目标为类别索引的例子

# Example of target with class indices
input = torch.randn(3, 5, requires_grad=True)
target = torch.randint(5, (3,), dtype=torch.int64)
loss = F.cross_entropy(input, target)
loss.backward()

含义和执行步骤

input:

大小为 [3, 5]，表示有 3 个样本，每个样本有 5 个类别的 logits（未经过 softmax 的分数）。
它是模型输出的原始预测结果。

target:

大小为 [3]，表示每个样本的目标类别索引（整数形式）。
target[i] 的值范围是 [0, 4]，表示第 ii 个样本的正确类别。

F.cross_entropy(input, target):

这个函数会先对 input 应用 softmax 转换成概率分布，然后计算交叉熵损失。
损失公式： $\text{CrossEntropyLoss} = -\frac{1}{N} \sum_{i=1}^N \log(P[i, y_i])$ 其中：
- $P[i, y_i]$ 是第 ii 个样本的正确类别概率（由 softmax 得到）。
- $y_i$ 是第 ii 个样本的目标类别索引。

loss.backward():

计算 input 的梯度，用于后续的优化。

关键点

target 是每个样本的类别索引。
input 被视为 logits，无需手动应用 softmax。

二、目标为类别概率分布的例子

# Example of target with class probabilities
input = torch.randn(3, 5, requires_grad=True)
target = torch.randn(3, 5).softmax(dim=1)
loss = F.cross_entropy(input, target)
loss.backward()

含义和执行步骤

input:

大小仍为 [3, 5]，表示 3 个样本，每个样本有 5 个类别的 logits。

target:

大小为 [3, 5]，表示每个样本的目标是一个类别概率分布（已归一化，且每行的和为 1）。
通过 softmax(dim=1) 将随机生成的值归一化，确保其符合概率分布的要求。

F.cross_entropy(input, target):

这时，target 是概率分布，而非类别索引。
损失公式修改为： $\text{CrossEntropyLoss} = -\frac{1}{N} \sum_{i=1}^N \sum_{j=1}^C t_{i,j} \log(P[i, j])$ 其中：
- $t_{i,j}$ 是目标概率分布 $\text{target}[i, j]$ 。
- $P [i, j]$ 是模型预测的类别概率分布（由 softmax 得到）。
这表示每个类别的损失按照目标概率分布进行加权平均，而不是只针对一个目标类别。

loss.backward():

计算 input 的梯度，用于后续的优化。
关键点
target 是每个样本的类别概率分布。
F.cross_entropy 会根据 target 的分布计算加权损失，而非直接使用单个类别。

两种模式的区别

模式	目标类型	损失公式
类别索引模式	每个样本对应一个类别索引	$log(P[i, y_i])$
类别概率分布模式	每个样本对应一个概率分布	$-\sum_{j} t_{i,j} \log(P[i, j])$

三、举例说明

输入数据：

input = torch.tensor([[2.0, 1.0, 0.1],
                      [0.5, 1.5, 1.0],
                      [0.1, 0.2, 0.7]], requires_grad=True)
#目标为类别索引
target_index = torch.tensor([0, 2, 1])  
#目标为类别概率分布
target_prob = torch.tensor([[1.0, 0.0, 0.0],
                            [0.0, 0.0, 1.0],
                            [0.0, 1.0, 0.0]])

3.1 计算类别索引模式的交叉熵：

对 input 应用 softmax：

P = softmax(input, dim=1)

结果：

P = [[0.6590, 0.2424, 0.0986],
     [0.2119, 0.5761, 0.2119],
     [0.3006, 0.3322, 0.3672]]

取正确类别概率：

样本 1: P[0, 0] = 0.6590
样本 2: P[1, 2] = 0.2119
样本 3: P[2, 1] = 0.3322

计算损失：
$\text{Loss} = -\frac{1}{3} \left( \log(0.6590) + \log(0.2119) + \log(0.3322) \right)$

3.2 计算类别概率分布模式的交叉熵：

按概率分布加权：
$\text{Loss} = -\frac{1}{3} \sum_{i=1}^3 \sum_{j=1}^3 t_{i,j} \log(P[i, j])$
对于每个样本：

样本 1: t = [1.0, 0.0, 0.0] -> $-\log(0.6590)$
样本 2: t = [0.0, 0.0, 1.0] -> $-\log(0.2119)$
样本 3: t = [0.0, 1.0, 0.0] -> $-\log(0.3322)$

最终两种方式的结果一致，只是计算方法略有不同。

猜你喜欢

转载自blog.csdn.net/ThomasCai001/article/details/144381675

softmax+交叉熵损失函数的数值举例

softmax+交叉熵

softmax函数和交叉熵损失函数

softmax交叉熵损失函数及其求导

softmax交叉熵损失函数求导

交叉熵损失函数（softmax分类器）

softmax交叉熵损失函数的深度理解

SoftMax与交叉熵损失

从熵、相对熵、交叉熵到机器学习的交叉熵损失与softmax损失函数

【KD】多标签“Softmax+交叉熵”的软标签版本

基于softmax激活函数交叉熵损失函数的BP推导

多分类问题的softmax函数交叉熵损失函数推导

简单易懂的softmax交叉熵损失函数求导

Softmax交叉熵损失函数反向传播公式推导

softmax交叉熵损失函数反向传播求导过程分析

【转载】深度学习中softmax交叉熵损失函数的理解

RNN softmax函数交叉熵损失公式的反向传播

softmax交叉熵损失函数深入理解（二）

Softmax函数与交叉熵

交叉熵与softmax函数

均方误差，交叉熵损失函数举例计算

交叉熵损失函数

交叉熵--损失函数

PyTorch的SoftMax交叉熵损失和梯度

【机器学习】二次损失函数的不足及交叉熵损失softmax详解

【KD】将“softmax+交叉熵”推广到多标签分类问题

class4---tensorflow:损失函数-激活函数、交叉熵、softmax函数

深度学习基础--loss与激活函数--sigmiod与softmax；对数损失函数与交叉熵代价函数

损失函数之交叉熵

简单的交叉熵损失函数

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)