word2vec 番外篇 1—— Skip-Gram 方法介绍

其他 2019-10-27 11:06:56 阅读次数: 0

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/qq_15192373/article/details/89929764

1. 一些定义

功能：

输入一个词，然后试着估计 其他词 出现在 该词附近 的概率。

gram 含义：

是一个有 n 个单词的组 (group)，其中 n 是 gram 的窗口大小 (window size)。

例如：「The cat sat on the mat」这句话用 3 个 gram 表示的话，是「The cat sat」、「cat sat on」、「sat on the」、「on the mat」。

skip 含义：

指一个输入词 在不同的上下文词 的情况下，在数据集中 重复的次数。

2. 预期功能

框架名称：

Word2Vec 上下文预测系统

预期测试结果：

输入：词「cat」

输出：预测的上下文(「the」，「sat」)

3. 训练过程

输入：

gram

过程：

Word2Vec 系统将遍历所有 给出的 gram 和 输入的单词，并尝试学习适当的 映射向量(嵌入)

4. 测试过程

输入：

给定输入单词，例如词「cat」

输出：

预测的上下文(「the」，「sat」)，因为正确的上下文单词在softmax 输出层能得到 更高概率。

5. 改进

改进：

实际上，该权重矩阵 可以当做 查找或编码单词的总表。

好处：

1. 一旦训练了网络，就意味着我们 放弃了softmax层 并使用 10,000 x 300 的权重矩阵 作为我们的 嵌入式查找表。大大节约计算量。

2. 由于采用这种方式训练网络，这些权值 还包含了上下文信息。(独热方法剥离了单词的所有局部语境，也就是说它会去掉句子中（或句子之间）紧密相连的单词的信息。)

猜你喜欢

转载自blog.csdn.net/qq_15192373/article/details/89929764

word2vec 番外篇 1—— Skip-Gram 方法介绍

word2vec 番外篇 1—— Skip-Gram 方法介绍

Skip-Gram直观理解（ Word2Vec Tutorial - The Skip-Gram Model， Word2Vec (Part 1): NLP With Deep Learning翻译）

深度学习方法（十七）：word2vec算法原理（1）：跳字模型（skip-gram）和连续词袋模型（CBOW）

一文入门word2vec（1）：CBOW, Skip-gram原理详解

训练自己的中文word2vec（词向量）--skip-gram方法

word2vec skip-gram

[机器学习与深度学习] - No.1 基于Negative Sampling SKip-Gram Word2vec模型学习总结

word2vec 番外篇 2—— 在 TensorFlow 中实现 softmax Word2Vec 方法（持续更新）

word2vec 番外篇 2—— 在 TensorFlow 中实现 softmax Word2Vec 方法（持续更新）

word2vec之skip-gram模型

Word2vec skip-gram模型

Word2Vec教程 - Skip-Gram模型

word2vec：skip-gram模型

word2vec: 理解nnlm, cbow, skip-gram

Word2Vec Tutorial - The Skip-Gram Model

Word2vec 之 Skip-Gram模型

利用skip-gram模型实现Word2vec

word2vec实现cbow和skip-gram

对word2vec skip-gram模型的理解

word2vec之skip-gram算法原理

理解 Word2Vec 之 Skip-Gram 模型

漫谈Word2vec之skip-gram模型

word2vec中Skip-Gram和CBOW

skip-gram word2vec代码实现

word2vec模型cbow与skip-gram的比较 word2vec模型cbow与skip-gram的比较

word2vec 两个模型,两个加速方法负采样加速Skip-gram模型层序Softmax加速CBOW模型

【机器学习】【Word Embedding，Word2Vec之Skip-Gram模型与负采样】

Word2vec之CBOW word2vec原理(一) CBOW与Skip-Gram模型基础

word2vec原理推导 word2vec原理(一) CBOW与Skip-Gram模型基础

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)