如何计算文本的困惑度perplexity(ppl) - 代码天地

如何计算文本的困惑度perplexity(ppl)

企业开发 2023-09-05 22:08:14 阅读次数: 0

前言

本文关注在Pytorch中如何计算困惑度（ppl）
为什么能用模型 loss 代表 ppl

如何计算

当给定一个分词后的序列 $(x_0, x_1, \dots,x_t)$ , ppl 计算公式为：

在这里插入图片描述

其中 $p_\theta(x_i|x_{<i})$ 是基于 $i$ 前面的序列，第 $i$ 个 token 的 log-likelihood

Full decomposition of a sequence with unlimited context length

import torch
from tqdm import tqdm

max_length = model.config.n_positions
stride = 512
seq_len = encodings.input_ids.size(1)

nlls = []
prev_end_loc = 0
for begin_loc in tqdm(range(0, seq_len, stride)):
    end_loc = min(begin_loc + max_length, seq_len)
    trg_len = end_loc - prev_end_loc  # may be different from stride on last loop
    input_ids = encodings.input_ids[:, begin_loc:end_loc].to(device)
    target_ids = input_ids.clone()
    target_ids[:, :-trg_len] = -100

    with torch.no_grad():
        outputs = model(input_ids, labels=target_ids)

        # loss is calculated using CrossEntropyLoss which averages over valid labels
        # N.B. the model only calculates loss over trg_len - 1 labels, because it internally shifts the labels
        # to the left by 1.
        neg_log_likelihood = outputs.loss

    nlls.append(neg_log_likelihood)

    prev_end_loc = end_loc
    if end_loc == seq_len:
        break

ppl = torch.exp(torch.stack(nlls).mean())

这里我们可以看到 neg_log_likelihood = output.loss，这说明我们利用模型输出的 CrossEntropyLoss 就能代表 ppl。

为什么

交叉熵损失函数公式（pytorch中并不是直接按照此公式计算，还做了其他处理）

在这里插入图片描述

其中 $y$ 是真实 ground-truth 标签
$\hat{y}$ 是模型预测的标签
$C$ 是类别数目，这里可以看做vocabulary大小

在生成任务中，因为每个 $y_i$ 中只有一个位置是1，其余位置都是 0，其实上述公式也就是 $log({y_{i}})$ ，那么对一个序列 $X$ ，我们对每个token的 cross-entropy loss进行平均，其实就是 $KaTeX parse error: {equation} can be used only in display mode.$ ，也就是 ppl。因此在实际计算中，我们利用 cross-entropy loss 来代表一个句子的 ppl

参考：Perplexity of fixed-length models (huggingface.co)

猜你喜欢

转载自blog.csdn.net/qq_52852138/article/details/132023596

如何计算文本的困惑度perplexity(ppl)

困惑度 perplexity

NLP 之 Perplexity困惑度

Language Model perplexity by using tensorflow使用tensorflow RNN模型计算语言模型的困惑度

python下进行lda主题挖掘(三)——计算困惑度perplexity

LDA困惑度perplexity的一些个人理解

LLM(大语言模型)常用评测指标-困惑度（Perplexity）

人机文本分类特征构造——困惑度计算

困惑度计算

一文详解NGram语言模型以及困惑度perplexity

LDA主题模型绘制困惑度（perplexity）-主题数曲线——python

Perplexity：深入理解语言模型评价指标——困惑度

(python )LDA perplexity计算

LDA perplexity计算

如何用python做文本相似度计算

深度学习 pytorch 困惑度计算方法

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

文本相似度计算之余弦定理如何提高使用Java反射的效率？

使用gensim实现lda，并计算perplexity（ gensim Perplexity Estimates in LDA Model）

【图像生成Metrics】快速计算FID、KID、IS、PPL

文本相似度计算的常用方法

短文本相似度计算

文本相似度计算-编辑距离

python文本相似度计算

利用python计算文本相似度

使用sklearn 计算文本余弦相似度

DSSM算法-计算文本相似度

计算文本相似度方法

文本相似度计算工具类

NLP学习——文本相似度计算

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)