jieba之segment - 代码天地

jieba之segment

其他 2018-05-12 05:21:30 阅读次数: 0

代码：

import jieba

sentence = "我来到清华大学"


# 从分词粒度上来讲，全模式 > 搜索模式 > 精确模式

# 精确模式
seg_list = jieba.cut(sentence)
#jieba的分词结果是产生一个生成器
print("===" * 20)
print(seg_list)
#如何打印生成器，用分隔符去拼接
print("===" * 20)
print("/".join(seg_list))


# 全模式,把里面所有可能的词都给找出来
seg_list = jieba.cut(sentence, cut_all=True)
print("===" * 20)
print("/".join(seg_list))


# 搜索引擎模式
seg_list = jieba.cut_for_search(sentence)
print("===" * 20)
print("/".join(seg_list))

运行结果：

============================================================
<generator object Tokenizer.cut at 0x1130b3f68>
============================================================
我/来到/清华大学
============================================================
我/来到/清华/清华大学/华大/大学
============================================================
我/来到/清华/华大/大学/清华大学

代码：

# 返回一个列表
# 精确模式
seg_list = jieba.lcut(sentence)
print("===" * 20)
print(seg_list)


# 全模式,把里面所有可能的词都给找出来
seg_list = jieba.lcut(sentence, cut_all=True)
print("===" * 20)
print(seg_list)


# 搜索引擎模式
seg_list = jieba.lcut_for_search(sentence)
print("===" * 20)
print(seg_list)

运行结果：

============================================================
['我', '来到', '清华大学']
============================================================
['我', '来到', '清华', '清华大学', '华大', '大学']
============================================================
['我', '来到', '清华', '华大', '大学', '清华大学']

猜你喜欢

转载自blog.csdn.net/wangsiji_buaa/article/details/80263402

jieba之segment

Elasticsearch之segment merge

python之jieba

NLP之jieba分词

Druid源码解析之Segment

Okhttp IO 之 Segment & SegmentPool

jieba之posseg(词性标注)

中文分词之jieba分词

jieba

SRS之SrsHlsCache::reap_segment详解

图像分割之SAM（Segment Anything Model）

论文阅读：Segment Anything之阅读笔记

jieba之sedict（自定义字典）

自然语言处理之jieba分词

NLP之jieba中文分词官方文档

NLP之jieba分词原理简析

【NLP】【一】中文分词之jieba

Windows之Python模块jieba安装

python入门之jieba库的使用

Python开发之 Jieba分词示例

【NLP】Python之jieba词性标注实例

NLP基本工具之jieba详解

digits tutorial 3 voc_segment 系列之1

easyPR源码解析之chars_segment.h

Segment Anything Model代码讲解（二）之image_encoder

Segment Anything Model代码讲解（一）之SAM

Segment Anything Model代码讲解（五）之Transformer

Segment Anything Model代码讲解（四）之prompt_encoder

Segment Anything Model代码讲解（三）之mask_decoder

GreenPlum中性能调优之segment实例个数

今日推荐

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

火速冲上 GitHub 热榜 —— 开源编程语言、框架哪有这么可爱？

北京人形机器人创新中心发布全球首个纯电驱拟人奔跑的全尺寸人形机器人“天工”

周排行

rbac——界面、权限

Apache CXF + SpringMVC 整合发布WebService

so插件化

Vue.js实战系列---图标字体制作（svg格式）

PAT乙级 1007 素数对猜想(孪生素数对) (20分) ---（C语言 + 详细注释）

被IRM保护的文档，打开失败

Calendar和Date计算日期差的小问题

win10子系统ubuntu18.4安装docker

利用Wrap Shell Script定位Android Native内存泄漏

MySQL: Transaction (Part I - Basic Concept)

每日归档

更多

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)

2024-04-24(36)