优秀的中文分词jieba库

jieba库的简介

jieba是优秀的中文分词库,中文文本需要通过分词来获的单个词语。jieba库提供了三种分词模式:精确模式,全模式,搜索引擎模式。精确模式是将文本精确割分,不存在冗余。全模式是将文本中所有可能单词都扫描出来,存在冗余。搜索引擎模式是将经过精确模式分割下的长词在进行分割。
常见jieba库的函数

猜你喜欢

转载自www.cnblogs.com/gzk08-20/p/9216302.html