数据挖掘 — Learn To Rank(LTR) - 代码天地

数据挖掘 — Learn To Rank(LTR)

其他 2019-04-04 21:17:20 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_20095389/article/details/88189644

1、文本特征向量提取方式

TF - IDF：单词在当前文档出现的频率 * log(总文档/单词在总文档中出现的文档数 ) 统计单词的TF-IDF，作为文本特征向量
CountVectorizer：只统计单词的词频，作为文本特征向量

上面两种方式参考这篇 https://blog.csdn.net/The_lastest/article/details/79093407

Word2Vec
隐藏层求得onehot维度 * 隐藏层神经节点的个数，就是我们需要的wordvec，每一行就是对应单词的编码后的向量
- CBOW：输入是上下文，输出是种子单词
- Skip-Gram：输入是种子单词，输出是上下文

word2vec 参考

2、LTR算法

（TODO 每个方式找个具体的算法看下怎么做的）
https://blog.csdn.net/manduner/article/details/80702762

Pointwise
Pairwise
Listwise

3、评价标准

https://blog.csdn.net/manduner/article/details/80702762
https://www.cnblogs.com/eyeszjwang/articles/2368087.html

MAP
NDCG

猜你喜欢

转载自blog.csdn.net/qq_20095389/article/details/88189644

数据挖掘 — Learn To Rank(LTR)

大数据learn

learn

数据挖掘十大算法以及scikit-learn算法选择图

Python数据挖掘入门与实践---使用scikit-learn 估计器分类

【Easy Python】第五话：小试scikit-learn数据挖掘——newsgroup数据处理与文本分类

信息检索IR与学习排序LTR（1）Learning to Rank在QA系统中的应用

LTR (Learning to Rank): 排序算法 poitwise, pairwise, listwise常见方案总结

scikit-learn数据预处理

数据预处理（Python scikit-learn）

数据预处理 Scikit-learn Preprocessing

scikit-learn内置数据集

数据标准化——scikit-learn

2.1_Scikit-learn数据集

Learn专题七——数据可视化

机器学习 scikit-learn 数据集

SciKit-Learn 加载数据集

数据的特征工程之Scikit-learn

scikit-learn与数据预处理

Learn02-数据库索引

【Scikit-Learn 中文文档】处理文本数据 - scikit-learn 教程 | ApacheCN

[机器学习]Scikit-Learn学习笔记03——Scikit-Learn数据模型

[SQL挖掘机] - 窗口函数 - rank

python数据挖掘入门与实践--------电离层（Ionosphere）, scikit-learn估计器，K近邻分类器，交叉检验，设置参数

元学习--learn to learn

Zoom to Learn, Learn to Zoom

python数据分析工具——Pandas、StatsModels、Scikit-Learn

scikit-learn的线性回归模型利用pandas处理数据

用scikit-learn生成测试数据集

【Scikit-Learn】SVM手写数据集

今日推荐

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

周排行

NEFU 117 素数个数的位数

Closest Common Ancestors (Lca,tarjan)

ELK部署

【转载】Hive笔记整理（三）

SQL语句（一）基本表的定义

关于Java web开发中的MySQL的事务语句

MFC创建自定义窗体

如何用一句话激怒程序员？

《逆袭大学》文摘——9.4 基础和应用的平衡中找到大学的节奏

【spring源码分析】@Value注解原理

每日归档

更多

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)