信息检索中 (IR) 的评价指标: P@n, MAP, MRR, DCG, NDCG - 代码天地

信息检索中 (IR) 的评价指标: P@n, MAP, MRR, DCG, NDCG

其他 2020-06-24 10:48:22 阅读次数: 0

P@n

前 n 个结果的准确度, P指的是Precision. 如果用 $y_i=0,1$ 分别表示第 i 个结果相关、不相关, 则
$P@n = \frac{1}{n} \sum_{i=1}^ny_i$
在评测系统的 P@n 时, 对每个查询的结果计算P@n, 取这些值的平均值作为系统的P@n.
参考:

https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-39940-9_484

MAP

Average Precision(AP): P@n的一个平均, 计算方式如下:
$AP = \frac{1}{R} \sum_{r=1}^RP@r$
其中R是预定义的. 在评测系统的AP时, 对每个查询的结果计算AP, 取这些值的平均值作为系统的AP.

Mean Average Precision (MAP): 在评价一个系统的性能, 有时会用不同主题的查询进行检索, 评价系统的整体性能. 在第t类查询, 系统的AP记作 $AP_i$ 的话, MAP计算方式如下:
$MAP = \frac{1}{T} \sum_{t=1}^AP_i$
参考

https://link.springer.com/referenceworkentry/10.1007%2F978-0-387-39940-9_492

MRR

Mean Reciprocal Rank (MRR). 对每个查询 $q_i$ , 记它第一个相关的结果排在位置 $k_i$ , 即rank为 $k_i$ , 则Reciprocal Rank(RR)得分计作 $1 / k_i$ .
对所有query的RR取平均, 即为MRR:
$MRR = \frac{1}{N}\sum_i 1/ k_i$

DCG和NDCG

Discounted Cumulative Gain (DCG): 指的, Cumulative为将所有的结果累加起来, Discounted指给排在后面的结果加一个折扣系数, 排序位置越考后, 折扣系数越小.
DCG@N的计算方式如下
$DCG@N = \sum_{i=1}^N r_i * D_i$
其中 $r_i$ 指每条结果的收益(Gain), $D_i$ 指折扣系数, 排序位置越考后, 折扣系数越小, 常用的是 $1 / log(1 + i)$ .
一种常用的形式如下:
$DCG@N = \sum_{i=1}^N \frac{2^{rel_i} - 1} {\log (i + 1)}$

Normalized Discounted Cumulative Gain (NDCG): 对于不同query, DCG的量级可能不同, 比如一个query对应的文档相关性都较差, 另一个query对应的文档都很好, 这样评价指标就会偏向第二个query. Normalized指将一个query对应的文档所有排序中最大的DCG求出来, 不妨计作 $IDCG@N$ , 则
$NDCG@N = DCG@N / IDCG@N$
举例来说, query下有4个文档, 相关性分别为1 2 3 0. 则最好的排序是 3 2 1 0, 在这种排序情况下计算出来的DCG就是IDCG.

猜你喜欢

转载自blog.csdn.net/feifei3211/article/details/105146215

信息检索中 (IR) 的评价指标: P@n, MAP, MRR, DCG, NDCG

Learning to Rank for IR的评价指标—MAP,NDCG,MRR

IR的评价指标-MAP，MRR和NDCG的形象理解

信息检索IR评价中常见的评价指标-MAP\NDCG\ERR\P@10等

搞懂推荐系统中的评价指标NDCG（CG、DCG、IDCG）

排序算法常用评价指标计算方式（AUC,MAP,NDCG,MRR）

推荐算法常用评价指标：NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等

推荐系统-排序算法：常用评价指标：NDCG、MAP、MRR、HR、ILS、ROC、AUC、F1等

深度学习常用评价指标（Accuracy、Recall、Precision、HR、F1 score、MAP、MRR、NDCG）——推荐系统

推荐系统常用的评价指标：HR、NDCG、MRR

【推荐系统】常用评价指标NDCG、HR、Recall、MRR解析

信息检索常用的评价指标整理 MAP nDCG ERR F-measure Precision Recall

信息检索 DCG、NDCG、AUC、BM25

信息检索(IR)的评价指标介绍

【推荐系统排序指标】CG、DCG、NDCG、Hit Rate

图像检索：信息检索评价指标mAP

NDCG评价指标讲解

搜索评价指标——NDCG

评价指标 MRR

图像检索评价指标mAP

推荐系统：NDCG评价指标

MAP 与 MRR

搜索评价指标 / 标签排序指标：nDCG

信息检索的评价指标(Precision, Recall, F-score, MAP)

知识图谱嵌入评价指标之MRR，Hits@n

召回评价指标之NDCG full or half

【推荐】排序模型的评价指标nDCG

MRR-推荐算法评价指标

排序类问题度量指标:Recall , MAP，MRR

信息检索的评价指标

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

curl的POST请求，封装方法

8.1.1. Integer Types

Java基础 Day05(个人复习整理)

Python - Django - 中间件 process_exception

小L的试卷

【Shell编程】（函数）判断用户是否存在

python(css样式)

spring ant path 匹配原则 - 【笔记】

《JavaScript与JScript从入门到精通》(美)James.Jaworski.中译本.扫描版.pdf

Eclipse运行带参数的java程序

每日归档

更多

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)