困惑度 perplexity - 代码天地

困惑度 perplexity

编程语言 2020-02-26 13:04:46 阅读次数: 0

在自然语言处理中，困惑度是用来衡量语言模型优劣的一个方法。它的值是对交叉熵损失函数做指数运算后得到的结果。

交叉熵损失函数

单个训练样本的损失：

$loss=-\frac{1}{n}\sum_{i=1}^{n}y_{i}log\hat{y_{i}}=-log\hat{y_{j}}$

$n$ 是标签数量，在语言模型中指的是字符总数。 $\hat{y_{i}}$ 是预测概率， $y_{i}$ 是预测正确概率。假如标签数为3，每个样本只有一个标签，正确预测结果为类别1，则 $y_{1}=1$ ， $y_{2}=0$ ， $y_{3}=0$ ，代入公式得到 $loss=-log\hat{y_{1}}$ 。可以看到交叉熵损失函数只关心预测正确的概率。

困惑度

$perplexity=e^{loss}=\frac{1}{\hat{y_{i}}}$

最佳情况下，模型总是把标签类别的概率预测为1，此时困惑度为1；
最坏情况下，模型总是把标签类别的概率预测为0，此时困惑度为正无穷；
基线情况下，模型总是预测所有类别的概率都相同。 $\hat{y_{i}}=\frac{1}{n}$ ， $perplexity=n$ 。此时困惑度为类别个数。
显然，任何一个有效模型的困惑度必须小于类别个数。在语言模型中，困惑度必须小于词典大小vocab_size。

qsmx666

发布了13 篇原创文章 · 获赞 0 · 访问量 309

私信关注

猜你喜欢

转载自blog.csdn.net/qsmx666/article/details/104514206

困惑度 perplexity

NLP 之 Perplexity困惑度

如何计算文本的困惑度perplexity(ppl)

LDA困惑度perplexity的一些个人理解

LLM(大语言模型)常用评测指标-困惑度（Perplexity）

Language Model perplexity by using tensorflow使用tensorflow RNN模型计算语言模型的困惑度

python下进行lda主题挖掘(三)——计算困惑度perplexity

一文详解NGram语言模型以及困惑度perplexity

LDA主题模型绘制困惑度（perplexity）-主题数曲线——python

Perplexity：深入理解语言模型评价指标——困惑度

人工智能-自然语言处理(NLP)：N-gram语言模型【用来判断一句话语法上是否通顺】 --＞语言模型的评估【Perplexity（困惑度） --＞利用语言模型生成新句子】

gensim---LDA---perplexity

(python )LDA perplexity计算

LDA perplexity计算

困惑度计算

语言模型评价指标Perplexity

语言模型评估方法Perplexity

N-gram语言模型 & Perplexity & 平滑

使用gensim实现lda，并计算perplexity（ gensim Perplexity Estimates in LDA Model）

自然语言处理 —— 困惑度

困惑

搜索神器Perplexity的详细使用方法(持续更新)

NLP 的 Task 和 Metric (Perplexity，BLEU，METOR，ROUGH，CIDEr)

人机文本分类特征构造——困惑度计算

深度学习 pytorch 困惑度计算方法

计算perplexity确定LDA到底聚出多少个主题合适

生成式 AI 搜索引擎 Perplexity 融资 7360 万美元

神奇智能搜索引擎：perplexity智能搜索引擎（ChatGPT与Edge合体——联网版chatGPT）

A.深度学习基础入门篇[二]：机器学习常用评估指标:AUC、mAP、IS、FID、Perplexity、BLEU、ROUGE等详解

NewBing、Andi、Phind、Perplexity 还有国产kuaisou五个AI搜索引擎的介绍和对比

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)