【NLP】如何理解n-gram模型 - 代码天地

【NLP】如何理解n-gram模型

其他 2019-06-19 08:59:21 阅读次数: 0

最近在研究NLP的相关知识，然后就遇到了n-gram这个模型。拜读了高老师的博客后，觉得通俗易懂，所以对知识进行了以下整理。

维基百科的定义：在计算语言学中，n-gram指的是文本中连续的n个item（item可以是phoneme, syllable, letter, word或base pairs）

n-gram 中如果n=1则为unigram，n=2则为bigram，n=3则为trigram。n>4后，则直接用数字指称，如4-gram，5-gram。

示例

以 “我将要去美国”这句话为例。bigram结果为：

我将
将要
要去
去美
美国

用python3实现bigram模型

sent="我将要去美国"
bigram=[]
for i in range(len(sent)-1):
   bigram.append(sent[i] + sent[i+1])
print(bigram)

输出结果：['我将', '将要', '要去', '去美', '美国']

示例

还是以 “我将要去美国”这句话为例。trigram结果为：

我将要
将要去
要去美
去美国

用python3实现trigram模型

sent="我将要去美国"
bigram=[]
for i in range(len(sent)-2):
   trigram.append(sent[i] + sent[i+1] + sent[i+2])
print(trigram)

输出结果：['我将要', '将要去', '要去美', '去美国']

是不是感觉很简单呢？那我们继续来实现n-gram模型吧

def nGram(lst,n):
    ngram=[]
    for i in range(len(lst)-n+1):
        ngram.append(lst[i:i+n])
    print(ngram)

调用nGram()即可，sent="我将要去美国"，n可以为小于len(lst)的一个数字

参考文献：http://blog.sina.com.cn/s/blog_5f4150730102wkdq.html

猜你喜欢

转载自blog.csdn.net/dylan_me/article/details/80931518

【NLP】如何理解n-gram模型

理解n-gram模型

对语言模型N-gram的理解

N-gram理解

N-gram模型

自然语言处理NLP中的N-gram模型

NLP学习记录4——n-gram模型（待整理）

简单理解语言模型与N-gram语言模型

N-gram模型简介

N-gram 语言模型

N-gram语言模型

通俗理解N-gram语言模型。（转）

NLP task2 N-Gram

NLP task2 _ 自然语言处理中N-Gram模型的Smoothing算法

NLP系列(5)_从朴素贝叶斯到N-gram语言模型

NLP浅层次模型之N-Gram词袋法

「X」Embedding in NLP｜Token 和 N-Gram、Bag-of-Words 模型释义

n-gram模型中的平滑方法

N-gram语言模型 & Perplexity & 平滑

n-gram语言模型及平滑算法

基于n-gram模型的中文分词

n-gram的理解：使用sklearn CountVectorizer 实现n-gram

N-gram算法

N-Gram

自然语言处理（NLP）： 03 tfidf 特征抽取&n-gram 扩展 + 朴素贝叶斯模型

通俗讲：自然语言处理（NLP）入门之N-gram语言模型。（朴素贝叶斯分类器的推导）

【Chatgpt4 教学】 NLP（自然语言处理）第十一课 n-gram模型原理

2020-3-2 深度学习笔记12 - 深度学习应用 3（自然语言处理NLP - n-gram / 神经语言模型NNLM / 高维输出 / 结合 n-gram 和神经语言模型 / 神经机器翻译）

自然语言处理中的N-Gram模型

N-gram模型(自然语言处理)

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

报告：Django 仍然是 74% 开发者的首选

《2024 年一季度互联网投融资运行情况》研究报告

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

BPM为企业带来的实际利益

好程序员web前端分享css常用属性缩写

Java文件下载（excel）

css样式的动态添加及显示和隐藏等零碎用法

axios全局配置以及拦截器

使用Logstash来实时同步MySQL和log日志数据到ES

C++获取当前时间（年月日、时分秒、毫秒）

Odoo产品分析 (四) -- 工具板块(11) -- 网站即时聊天(1)

Java环境配置正确，但是java、javac、java -version均返回“不是内部或外部命令，也不是可运行的程序或批处理文件”？

01 官网下载各种CentOS教程（超详细版）

每日归档

更多

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)