jieba分词模块中如何添加自己准备的词典

jieba分词的词典一般是C:\Users\Administrator\AppData\Local\Programs\Python\Python36\Lib\site-packages\jieba的目录下的dict.txt文件,如果自己想添加词典,比如添加dict2.txt的词典,可以将此文件放入dict.txt的同一个目录下,然后在每一次使用时调用方法jieba.load_userdict来加载新的词典,在这个例子中就是jieba.load_userdict(“C:/Users/Administrator/AppData/Local/Programs/Python/Python36/Lib/site-packages/jieba/dict2.txt”),但是运行后出现下面这个问题:
这里写图片描述
这个就是文件的编码问题,此时可以将dict2.txt文件另存为然后将编码改为utf-8,如下图:
这里写图片描述
然后剧可以用自己的新的词典啦!

猜你喜欢

转载自blog.csdn.net/qq_38585359/article/details/81315659