word2vec 和 doc2vec 相似和区别 - 代码天地

word2vec 和 doc2vec 相似和区别

企业开发 2023-07-11 21:23:56 阅读次数: 0

Word2vec 算法

CBOW 和 Skip-Gram模型

CBOW通过周围词找到当前词，Skip-Gram通过当前词找到周围词，都是使用评估概率找到概率最大的

doc2vec

在word2vec的基础上增加一个段落向量，该模型也有两个方法：Distributed Memory(DM) 和 Distributed Bag of Words(DBOW)

doc2vec 的c-bow与word2vec的c-bow模型的区别
在训练过程中增加了每个句子的id(向量)，计算的时候将paragraph vector和word vector累加或者连接起来，作为softmax的输入

在预测过程，给预测句子分配一个新的paragraph id , 重新利用梯度下降训练待预测的句子，待收敛后，即得到待测句子的paragraph vector

PV-DM

doc2vec的skip-gram与word2vec的skip-gram模型的区别

在doc2vec里，输入都是paragraph vector ，输出是该paragraph 中随机抽样的词

PV-DBOW

补充知识

One-hot Representation

采用稀疏方式存储，给每个词分配一个数字 ID，表示后配合上最大熵、SVM、CRF 等等算法已经很好地完成了 NLP 领域的各种主流任务

缺点任意两个词之间都是孤立的，光从这两个向量中看不出两个词是否有关系，容易发生维数灾难

Distributed representation

从原始的词向量稀疏表示法过渡到低维空间中的密集表示

决了维数灾难问题，并且挖掘了word之间的关联属性

Reference

https://www.jianshu.com/p/048bff9b0f65

https://www.cnblogs.com/gogoSandy/p/13773327.html

猜你喜欢

转载自blog.csdn.net/weixin_48185819/article/details/127281549

word2vec 和 doc2vec

Word2vec 和 Doc2vec 总结

word2vec和doc2vec的总结

word2vec 和 doc2vec 相似和区别

Python训练Word2Vec和Doc2Vec

数据转换Word2Vec和Doc2Vec

动手实践word2vec和doc2vec模型

word2vec和doc2vec模型详解及应用

深度学习笔记——Word2vec和Doc2vec应用举例：词和句子的相似度计算

深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析

doc2vec介绍和实践

深度学习笔记——Word2vec和Doc2vec训练实例以及参数解读

深度学习笔记——基于Word2vec和Doc2vec的句子对匹配方法

深度学习笔记——Word2vec和Doc2vec原理理解并结合代码分析

Doc2Vec,Word2Vec文本相似度初体验。

Word2Vec和fasttext

word2vec 学习和理解

word2vec 和 glove 模型的区别

word2vec、doc2vec的使用

word2vec、glove和 fasttext 的比较

word2vec实现cbow和skip-gram

用gensim实现word2vec 和 glove

Python Word2Vec训练和测试词向量

word2vec 的使用和学习笔记

word2vec原理和代码介绍

gensim Word2Vec 训练和使用

Tensorflow 的NCE-Loss的实现和word2vec

charRNN和word2vec的实现原理

word2vec中Skip-Gram和CBOW

Word2vec的详细讲解和总结

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)