深度学习（自然语言处理）-词嵌入

其他 2020-09-21 11:31:00 阅读次数: 0

前言：

由于最近在学习知识图谱的实体命名问题，在实验中，我们对于词语的处理使用word2vec进行降为因此对于这个工具，基本的情况需要进行了解.

10.1 词嵌入（word2vec）

10.1.1 为何不采用one-hot向量

one-hot向量表示词（字符为词）, 假设一个词的索引为iii，为了得到该词的one-hot向量表示，我们创建一个全0的长为NNN的向量，并将其第iii位设成1.one-hot词向量无法准确表达不同词之间的相似度，如我们常常使用的余弦相似度

由于任何两个不同词的one-hot向量的余弦相似度都为0

它将每个词表示成一个定长的向量，并使得这些向量能较好地表达不同词之间的相似和类比关系。word2vec工具包含了两个模型，即跳字模型（skip-gram）[2] 和连续词袋模型（continuous bag of words，CBOW）

10.1.2 跳字模型

假设文本序列是“the”“man”“loves”“his”“son”。以“loves”作为中心词，设背景窗口大小为2。

关于SoftMax:https://blog.csdn.net/lz_peter/article/details/84574716

扩展到更为一般：

假设给定中心词的情况下背景词的生成相互独立，当背景窗口大小为mm时，跳字模型的似然函数即给定任一中心词生成所有背景词的概率

10.1.2.1. 训练跳字模型¶

10.1.3. 连续词袋模型¶

连续词袋模型假设基于某中心词在文本序列前后的背景词来生成该中心词

未完待续。。。

参考文献：

原文链接：https://zh.d2l.ai/chapter_natural-language-processing/word2vec.html

极大似然估计：http://fangs.in/post/thinkstats/likelihood/

softmax函数:https://blog.csdn.net/lz_peter/article/details/84574716

条件随机场 ConditionalRandom Field，CRF

猜你喜欢

转载自blog.csdn.net/qq_37457202/article/details/108697461

深度学习——自然语言处理与词嵌入[15]

深度学习（自然语言处理）-词嵌入

吴恩达《深度学习》第五门课（2）自然语言处理与词嵌入

吴恩达老师深度学习视频课笔记：自然语言处理与词嵌入

13.深度学习(词嵌入)与自然语言处理--HanLP实现

自然语言处理(一)：词嵌入

DeepNLP的表示学习·词嵌入来龙去脉·深度学习（Deep Learning）·自然语言处理（NLP）·表示（Representation）

《深度学习工程师-吴恩达》05序列模型--自然语言处理与词嵌入学习笔记

吴恩达深度学习学习笔记——C5W2——自然语言处理与词嵌入-3

吴恩达深度学习学习笔记——C5W2——自然语言处理与词嵌入-2

吴恩达深度学习第五课第二周自然语言处理与词嵌入

吴恩达Coursera深度学习课程 deeplearning.ai (5-2) 自然语言处理与词嵌入--编程作业(一)：词向量运算

《序列模型》之自然语言处理和词嵌入

序列模型——自然语言处理与词嵌入（理论部分）

自然语言处理：什么是词嵌入(word embedding)？

自然语言处理(五)：子词嵌入（fastText模型）

自然语言处理(四)：全局向量的词嵌入（GloVe）

深度学习与自然语言处理

深度学习与自然语言处理（二）

深度学习与自然语言处理（一）

基于深度学习的自然语言处理

自然语言处理系列---深度学习

深度学习——自然语言处理（一）

吴恩达深度学习学习笔记——C5W2——自然语言处理与词嵌入——练习题

吴恩达Coursera深度学习课程 deeplearning.ai (5-2) 自然语言处理与词嵌入--课程笔记

用深度学习来获取文本语义词向量应用于自然语言处理

自然语言处理中传统词向量表示VS深度学习语言模型（一）

自然语言处理中传统词向量表示VS深度学习语言模型（二）

吴恩达深度学习——自然语音处理与词嵌入

2020-11-12 吴恩达DL学习-C5 序列模型-W2 自然语言处理与词嵌入(2.10 词嵌入除偏)

今日推荐

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

周排行

返回指定时间格式

fopen函数中的mode参数

Java 单例模式探讨

Flex remoteobject工作原理探讨

寻找mplayer的便捷安装方法

30天了解30种技术系列---(26)MySQL自动化运维工具Inception

关于Jboss/Tomcat/Jetty的JNDI定义123

程序减肥，strip，eu-strip 及其符号表

AsyncTask、View.post(Runnable)、ViewTreeObserver三种方式总结frame animation自动启动

Json和Bean的互相转换

每日归档

更多

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)