NLP 简单统计 - 代码天地

NLP 简单统计

其他 2019-01-21 16:29:32 阅读次数: 0

版权声明：本文为博主原创文章，未经博主允许不得转载。 https://blog.csdn.net/qq_35774189/article/details/84557386

1、变量名必须以字母开头，可以包含数字和下划线，名称是区分大小写的，变量名不能游空格，可以用下划线 ( _ ) 把单词分开

2、利用FreqDist寻找文本中最常见的50个词：

第89行计算whale出现的次数

累积频率图

计算文本中每个词的长度：

fdist.keys() 只有20个不同的元素（说明只有20种不同的词长）

fdist.freq(3) 表示词长为3的词占比

例子	描述
fdist=FreqDist(samples)	创建包含给定样本的频率分布
fdist.inc(sample)	增加样本
fdist['monstrous']	计数给定样本出现的次数
fdist.freq('monstrous')	给定样本的频率
fdist.N()	样本总数
fdist.keys()	以频率递减顺序排序的样本链表
for sample in fdist:	以频率递减的顺序遍历样本
fdist.max()	数值最大的样本
fdist.tabulate()	绘制频率分布表
fdist.plot()	绘制频率分布图
fdist.plot(cumulative=True)	绘制累积频率分布图
fdist1 < fdist2	测试样本在fdist1中出现的频率是否小于fdist2

猜你喜欢

转载自blog.csdn.net/qq_35774189/article/details/84557386

NLP 简单统计

nlp 统计语言模型

NLP - 统计频率

NLP简单介绍

简单地了解NLP

【Elasticsearch】NLP简单应用

NLP（一）：从规则到统计

NLP-统计语言模型

csdn博客的简单nlp分析

简单理解NLP中文分词

【NLP】暑假课作业3 - 词性标注（简单词频概率统计）

NLP

【NLP】

NLP系列-中文分词（基于统计）

初探nlp 词频统计，去停顿词

006-深度学习与NLP简单应用

Pycharm nltk 实现简单的NLP功能

NLP——01机器翻译的简单框架

NLP标注工具Brat的简单使用

NLP数据预处理——词频统计（创建词典）程序

【NLP】英文数据预处理__词频统计简例

基于ansj_seg和nlp-lang的简单nlp工具类

NLP | 简单学习一下NLP中的transformer的pytorch代码

python.nlp随笔（四）简单的全文检索系统

NLP的第三方包的学习简单总结

Flair：一款简单但技术先进的NLP库

Flair：一款简单但技术先进的NLP库！

NLP中几种分词库的简单使用（Python）

NLP(6):一些简单得dp

FoolNLTK—简单好用的中文NLP工具包

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)