推荐系统的性能评估（RMSE、MAE、F1 core、A/B testing、CTR和CR、ROI和QA）

其他 2020-03-24 00:24:46 阅读次数: 0

目录

一、线下评估（应用学术研究）

1、RMSE(均方根误差)

2、MAE(均方误差)

3、F1 score(包括recall和precision)

（2）precision

4、A/B testing

二、线上评估（应用于商业）

一、线下评估（应用学术研究）

1、RMSE(均方根误差)

应用场景：需要用户评分信息，评分信息较多时

RMSE越小表示误差越小，推荐系统的性能就越好

2、MAE(均方误差)

应用场景：需要用户评分信息，评分信息较多时

3、F1 score(包括recall和precision)

应用场景：当没有用户评分信息时，或者评分信息较少

举例：

（1）recall

或

此时recall=6/10=0.6，recall越大表示包含了越多给用户推荐的商品

（2）precision

或

此时precision=6/50=0.12,precision越大表示了推荐的商品数量越少，即推荐的更精准

综合（1）+（2）

F的值越大说明推荐系统的性能越好

4、A/B testing

分组推荐，可以不止是A和B，越多消耗资源越大

二、线上评估（应用于商业）

1、CTR和CR

CTR(点击率Click Through Rate)

CR（转化率 Conversion Rate）

2、ROI和QA

关键在于定义合理的回报和投资，ROI越大推荐系统性能越好

当凭借算法评价推荐系统的性能不理想时，可以专门成立一个QA小组来测试推荐系统，根据个人经验判断。

纵死侠骨香

发布了151 篇原创文章 · 获赞 11 · 访问量 1万+

私信关注

猜你喜欢

转载自blog.csdn.net/qq_41808387/article/details/104942820

推荐系统的性能评估（RMSE、MAE、F1 core、A/B testing、CTR和CR、ROI和QA）

回归模型选择性能指标 | RMSE与MAE应用及其区别（L1-曼哈顿范数和L2-欧几里得范数)

BigData_A_B_01Spark-core-1-wordcount

R语言使用yardstick包的rmse函数和rsq函数评估回归（regression）模型的性能、分别计算均方根误差、R方（其他指标mae、mape、smape、msd、ccc等计算方式类似）

精确率、召回率、F1、AUC和ROC曲线（这是重点推荐）

NER命名实体识别，实体级level的评估，精确率、召回率和F1值

recall、precision和f1

SAP的F1和F4搜索帮助

性能评估 4 f1_score F1值

RMSE、MAPE、准确率、召回率、F1、ROC、AUC数据挖掘中的性能指标总结

精确率、召回率和F1值

Google Spanner和F1介绍

micro 和 macro F1 值的区别？

准确率、召回率和F1数值

机器学习模型评估指标准确率、精确率、召回率、F1-Score、AUC、MAE、MSE、RMSE、R-Squared等

衡量线性回归法的指标：MSE, RMSE和MAE

BigData_A_B_01Spark-core-3-日志保存和历史服务器以及高可用

【推荐算法】CTR中embedding层的学习和训练

Seam 3.1.0 CR1 和 Seam 的未来

【《机器学习》周志华学习笔记2.3.2】~模型评估与选择-性能度量-查准率、查全率、F1

Codeforces Round #750 (Div. 2) A B C D F1

成功解决xgboost.core.XGBoostError: b‘value 0 for Parameter num_class should be greater equal to 1‘

树莓派3b+ linux系统安装，C# .NET Core 程序部署亲身完美体验过程

【从0开始.NET CORE认证】-2 使用.Net Core Identity和EF Core 从0开始.NET CORE认证-1

1.25Cr0.5Mo钢板化学成分1.25Cr0.5Mo性能和应用

1、A+B和C

【Codeforces Round #547 (Div. 3)】 A B C D E F1 F2 G

js 静止f1到f12 和屏蔽鼠标右键

精确度/召回率/F1值/Micro-F1和Macro-F1的理解

分类的性能评估：准确率、精确率、Recall召回率、F1、F2

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)