[NLP] word2vec - 代码天地

[NLP] word2vec

编程语言 2018-04-24 12:41:49 阅读次数: 3

word2vec简介

作用: 将自然语言中的字词转为计算机可以理解的稠密向量.
在word2vec之前曾经用one-hot来表示字词, 比如:

杭州 [0,0,0,0,0,0,0,1,0,……，0,0,0,0,0,0,0]
上海 [0,0,0,0,1,0,0,0,0,……，0,0,0,0,0,0,0]
宁波 [0,0,0,1,0,0,0,0,0,……，0,0,0,0,0,0,0]
北京 [0,0,0,0,0,0,0,0,0,……，1,0,0,0,0,0,0]

但是one-hot有如下问题: (1) 向量之间相互独立. (2) 向量维度过大, 矩阵过于稀疏, 可能造成维度灾难.
word2vec可以解决这些问题: 将one-hot的向量转换为低维度的稠密向量. 实质上用到的解决方法是矩阵分解.

相关概念理解

词向量: 也被称为词嵌入(word embeddings), word2vec就是是一种常见的词向量, 除了word2vec, 比较出名的还有GloVe.
LDA: 是主题模型(Topic Models)的一种计算方法.
语言模型: 在统计自然语言处理中，语言模型指的是计算一个句子的概率模型。
神经概率语言模型: Neural Probabilistic Language Model, 词的表示是向量形式、面向语义的。两个语义相似的词对应的向量也是相似的，具体反映在夹角或距离上。

参考:
大白话讲解word2vec到底在做些什么
 词向量，LDA，word2vec三者的关系是什么?
word2vec原理推导与代码分析(未看完)

未完待续……

猜你喜欢

转载自blog.csdn.net/pangtouyu_qy/article/details/80059947

[NLP] word2vec

NLP之——Word2Vec详解

【NLP】Word2vec简介，入门

NLP之word2vec

NLP笔记(1)——word2vec

NLP（一）Word2Vec原理

NLP之Word2Vec详解

NLP入门（三）word2vec

[NLP] 秒懂词向量Word2vec的本质+word2vec资源总结

NLP到Word2Vec 02 | Word2Vec理论基础

NLP到Word2Vec 03 | Word2vec应用案例

NLP系列2：Word2Vec理论及实战

NLP - word2vec理论基础

不懂word2vec，还敢说自己是做NLP？

[NLP] 秒懂词向量Word2vec的本质

用Word2Vec来处理NLP问题

NLP 相关算法 Word2Vec embedding

【NLP】【五】gensim之Word2Vec

NLP：Gensim库之word2vec

NlP之word2vec的发展历程

NLP | Word2Vec之Huffman树与Huffman编码

Python实现Word2Vec(yandexdataschool/nlp_course)

NLP从词袋到Word2Vec的文本表示

NLP课程：Word2vec到FastText

NLP入门（1）— 从NNLM到Word2Vec

NLP探索：一、从Word2vec到Bert

NLP入门学习路线 word2vec 原理分析

实战1：NLP到word2vec

【NLP】Word2vec概念和演进史

NLP学习笔记十一-word2vec模型

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)