模块jieba库的使用

其他 2019-10-28 20:01:10 阅读次数: 0

模块jieba库的使用

一 jieba库基本介绍

1.1 jieba库的概念

jieba库是优秀的中文分词第三方库

中文文本需要通过分词获得单个的词语
jieba是优秀的中文分词第三方库，需要额外安装
jieba库提供三种分词模式，最简单只需掌握一个函数

1.2 jieba库的安装

pip install jieba (cmd命令行)

1.3 jieba分词的原理

jieba分词依靠中文词库

利用一个中文词库，确定汉字之间的关系概念
汉字间概率大的组成词组，形成分词结果
除了分词，用户还可以添加自定义的词组

jieba库使用说明

2.1 jieba分词的三种模式

精确模式：把文本精确的切分开，不存在冗余单词
全模式：把文本中所有可能的词语都扫描出来，有冗余
搜索引擎模式：在精确模式基础上，对长词再次切分

2.2 jieba库常用函数

2.3 分词要点

下面是代码演示

import jieba

txt = '中国，是以华夏文明为源泉、中华文化为基础，并以汉族为主体民族的多民族国家，通用汉语、汉字，汉族与少数民族被统称为“中华民族”，又自称为炎黄子孙、龙的传人。'

# 精确模式

# res = jieba.cut(txt) # 获取可迭代对象

res = jieba.lcut(txt) # 生成的是一个列表

# 全模式

# res1 = jieba.cut(txt, cut_all=True) # 获取可迭代对象

res1 = jieba.lcut(txt, cut_all=True) # 生成的是一个列表

# 搜索引擎模式

# res2 = jieba.cut_for_search(txt) # 获取可迭代对象

res2 = jieba.lcut_for_search(txt) # # 生成的是一个列表

# for i in res2:

print(res2)

猜你喜欢

转载自www.cnblogs.com/everuse/p/11754646.html

模块jieba库的使用

模块5：jieba库的使用

041 模块5-jieba库的使用

Python jieba库的使用

jieba库的使用

jieba库基本使用

jieba库的基本使用

jieba库使用

使用jieba库

jieba模块包的举例使用

jieba库及wordcloud库的使用

Python入门：jieba库的使用

python jieba库的基本使用

jieba库的使用与词云

Python jieba、wordcloud库的使用

Python-jieba库的使用

python :jieba库的使用大全

jieba库 Python jieba 库的使用说明

Python库中，如何使用jieba模块来实现古典名著《西游记》的分词

jieba(结巴)常用方法 python jieba库的基本使用

使用jieba库寻找相同词

jieba库的使用和好玩的词云

jieba库的使用和好看的词元

jieba库使用和好玩的词云

python好玩的词云和Jieba库的使用

python入门之jieba库的使用

python jieba库的使用说明

Python jieba 库的使用说明

jieba库的使用及词云应用

NLP之路——Jieba库安装与使用

今日推荐

Linus “吃狗粮”最积极！

开源日报 | Winamp播放器即将开源；生成式AI之战升级第二轮；Linus“吃狗粮”最积极；AI进入泡沫前期；吴泳铭为阿里云带来了什么？

NetBSD 禁止提交由 AI 生成的代码

Apache Doris 2.0.10 版本正式发布！

开源日报 | 大模型开战；大模型独角兽被曝卖身；周鸿祎建议谷歌开源所有产品；最大开源AI社区提供1000万美元共享GPU

开源日报 | Chrome内置Gemini的意义不在于Gemini；中国AI追随之路的五大误区；ECharts创始人“下海”养鱼；谷歌I/O开发者大会什么都有，只是没有惊喜

微软回应中国区AI团队“打包赴美”传闻

周排行

SVN服务端安装在阿里云

实战 | 相机标定

webpack核心概念

note20——》只要肯低头吃苦，人生就会有救

PAT甲级 1062 Talent and Virtue （25 分）排序

NG Toolset开发笔记--5GNR Resource Grid（26）

如何对待上司

oracle命令

第9章 STL迭代器

logstash使用es映射模板

每日归档

更多

2024-05-20(36)

2024-05-19(0)

2024-05-18(4)

2024-05-17(34)

2024-05-16(6)

2024-05-15(24)

2024-05-14(0)

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)