【NLP-02】NNLM

其他 2020-05-24 23:01:33 阅读次数: 0

目录

研究背景
离散表示
分布式表示
神经网络

NNLM (Neural Network Language model)，神经网络语言模型是03年提出来的，通过训练得到中间产物–词向量矩阵，这就是我们要得到的文本表示向量矩阵。

1、研究背景

维数灾难（curse of dimensionality）是语言模型和其他一些学习问题的基础问题。进一步的，当我们对连续变量进行建模时，通过根据目标函数的局部光滑特性进行学习，可以相对容易的对目标函数进行泛化；但在离散空间中，待学习的结构通常不明确，任何一个离散变量的改变都可能对待估函数的取值产生重大影响，而且，当每一个离散变量的取值范围都很大时，大多数观察对象之间的海明距离都变得很远。这说明了维度约减的重要性。

n-gram模型的单词序列长度，即n通常小于3（基于计算效率的考虑），并且没有考虑单词之间的语义信息。这是Neural Probabilistic Language Model的动机。

2、神经网络模型

学习目标：得到模型f，使得

该模型可分为特征映射和计算条件概率分布两部分：

特征映射：一个从词汇表V（V 是所有单词的集合，即词典）到实数向量空间的映射C。通过这个映射得到每个单词的向量表示。因此C实际上是一个|V|×m的矩阵（m是单词向量的维数）；

下面重点介绍神经网络的结构，网络输出层采用的是softmax函数，如下式所示：

三、模型训练

模型的训练目标是最大化以下似然函数：

使用梯度下降算法更新参数的过程如下：

上述过程可以归结为三步：

将单词映射到m维的特征空间中；
使用单词序列的对应向量集合作为输入表达单词序列的联合概率方程；
同步学习单词的特征向量和概率函数。

注意：在本文中作者仍然是以学习语言生成模型为主要目标的，但在word2vec中，作者以获得理想的单词向量为目标。

四、总结

由于NNLM模型使用了低维紧凑的词向量对上文进行表示，这解决了词袋模型带来的数据稀疏、语义鸿沟等问题。显然nnlm是一种更好的n元语言模型；另一方面在相似的上下文语境中，nnlm模型可以预测出相似的目标词，而传统模型无法做到这一点。其优势可见下面一个例子（因为神经网络是一个向量模型）：

参考：

https://blog.csdn.net/lilong117194/article/details/82018008?utm_medium=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1&depth_1-utm_source=distribute.pc_relevant.none-task-blog-BlogCommendFromBaidu-1

http://blog.sina.com.cn/s/blog_66a6172c0102v1zb.html

https://blog.csdn.net/u010089444/article/details/52624964?ops_request_misc=&request_id=&biz_id=102&utm_medium=distribute.pc_search_result.none-task-blog-2~blog~sobaiduweb~default-0

猜你喜欢

转载自www.cnblogs.com/yifanrensheng/p/12953197.html

【NLP-02】NNLM

NLP模型之NNLM

深度学习-->NLP-->NNLM简介

NLP入门（1）— 从NNLM到Word2Vec

NLP之NNLM：NNLM算法(词向量法的始祖)的简介、网络结构、案例应用之详细攻略

NLP----神经网络语言模型（NNLM），词向量生成，词嵌入，python实现

NLP 02 RNN

【NLP】_02_NLP经典任务

NLP+深度学习：paper(1) Bengio: A Neural Probabilistic Language Model， word2vec蓝本NNLM方法

02-NLP-04-03

02-NLP-04-04

02-NLP-gensim中文处理案例

02-NLP-01-jieba中文处理

NLP学习笔记 02 句法和文法

【NLP】多头注意力概念（02）

【NLP的python库(02/4) 】：Spacy

02-NLP-02-朴素贝叶斯与应用

02-NLP-02-朴素贝叶斯

NLP学习笔记02---NLP概述(NLP领域的关键技术和应用场景)

2020-3-2 深度学习笔记12 - 深度学习应用 3（自然语言处理NLP - n-gram / 神经语言模型NNLM / 高维输出 / 结合 n-gram 和神经语言模型 / 神经机器翻译）

Pytorch实现NNLM语言模型

02-NLP-01-python正则表达式

02-NLP-01-字符串处理

02-NLP-03-LDA主题模型应用

02-NLP-05-使用HMM进行词性标注

02-NLP-08-条件随机场与应用

02-NLP-07-词向量及相关应用

NLP 学习笔记 02 Tagging Problems and Hidden Markov Models

NLP学习02--卷积神经网络CNN

02[NLP训练营]递归算法复杂度

今日推荐

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

LFOSSA 源来如此公开课 | 掌握云原生未来：CNCF 认证全面攻略与备考秘籍

国产云输入法——仅华为无云端数据上传安全问题

开源日报 | 工业开源项目OGG 1.0；姐姐，你要和我一起配置火狐吗；苹果AI遥遥落后？Fedora 40

开放签电子签章：停止新增，优化体验，前进更进（五一假期前工作）

开源日报 | 中学生开源前端动画引擎；全球首个Llama3 8B中文版开源模型；联想电脑恐出局；Linus讽刺AI炒作

周排行

浏览器对同一域名进行请求的最大并发连接数

React Hook之自定义Hook

【转】MyBatis缓存机制

-Java-泛型

自动化测试常用脚本-发送邮件

LeetCode#859: Buddy Strings

java、Python处理字符串

第二篇の博客

Hadoop伪分布式环境安装

SQL Server进阶（十一）临时表、表变量

每日归档

更多

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)

2024-04-23(26)

2024-04-22(39)

2024-04-21(0)

2024-04-20(6)

2024-04-19(5)

2024-04-18(0)