python之自然语言处理(NLTK)安装库文件位置存储问题
背景介绍
NLTK简单说明
自然语言工具包(Natural Language Toolkit,NLTK)就是这样一个Python 库,用于识别和标记英语文本中各个词的词性(parts of speech)。这个项目于2000 年创建,经过15 年的发展,由来自世界各地的几十个开发者共同努力维护。
准备工作
安装NLTK模块
NLTK 模块的安装方法和其他Python 模块一样,要么从NLTK 网站直接下载安装包进行安装,要么用其他几个第三方安装器通过关键词“nltk”安装。
NLTK安装
安装完之后就是开始安装NLTK自带的文本库,这也是此次文章博主遇到的问题!!!
问题阐述!!!
当我安装完NLTK库的时候,就要开始安装NLTK自带的文本库
两种安装NLTK自带的文本库
第一种:
命令窗口下:
输入命令会弹出NLTK的下载器,我们可以通过下载器进行下载我们需要的文本库
说明:
这里默认是安装路径是C盘,一提到安装到C盘我就不由自主的想吐槽,大家都懂就不多说啦!!!哈哈
当然路径是可以改变的,那么问题来啦,如何改变路径?改变了路径是否能生效?所以这里我们就当且默认安装到C盘吧
第二种:
基于第一种下载的时候特别的慢且安装路径是C盘,所以我们不言而喻就想到是否可以采用离线安装文本库?答案是可以的奥!!!
博主这里就直接提供了NLTK的文本库
链接:https://pan.baidu.com/s/1ekdZl1ows34n02mMGLx9jA 密码:zn68
让博主苦恼的问题来啦???
将下载好的NLTK自带的文本库存储到哪里?
解决方案
我们可以进行反测试得出问题所在,换句话说就是先写一个没有安装文本库的一个测试语句,例如下图
这样我们就根据报错提示就可以知道自己需要将离线的安装包存储在哪里!!!
如下就是我们可以将离线的安装包存储的位置:
说明:
将里面的文件都要解压奥
解决结果
总结
博主的问题就是将离线下载的NLTK文本库文件存放能生效的位置。