解决pycharm中安装不了tesserocr库的问题

1、问题抛出
参考崔庆才的网络爬虫书时,在学习验证码识别那章,想起来要装tesseract和tesserocr库,安装tesseract版本为3.05.02,对应tesserocr版本为tesserocr-2.2.2-cp36,python版本为3.6.4。结果安装tesseract没有问题,安装完成后将D:\python\python_lib\ocr\install\Tesseract-OCR已经配置了系统坏境变量,通过cmd tesseract help命令也可以查询到已经成功安装。之后,在pycharm中添加tesserocr库时每次都提醒已经安装成功,但是再File/settings/project interpreter展示的第三库中并没有看到tesserocr库,在此多说一句,pycharm添加第三方库时,有些库是需要多次添加才能成功,原因不详(可能是与谜一样的天朝坏境有关)。通过pip3手动安装tesserocr库时又报错:找不到tesseract文件路径。很奇怪,明明已经安装过了,有知道的小伙伴麻烦留言一下 ,谢谢。
2、问题解决
多方查找原因后,请参考http://www.cnblogs.com/zhangxinqi/p/9297292.html#_label2这篇文章所述。文章中指出:
由于tesserocr在windows环境下会出现各种不兼容问题,并且与pycharm虚拟环境不兼容等问题,所以在windows系统环境下,选择pytesseract模块进行安装,如果实在要安装请使用whl文件安装或者使用conda安装
解决办法:就是使用pytesseract模块进行安装,pycharm一次性就可以了。
3、反思
这种解决办法实为无奈之举,并没有解决根本性问题。另外,tesserocr是惠普公司的开源OCR识别库,pytesseract是谷歌的开源库。有其他好的解决办法,麻烦告知一下,多谢。

猜你喜欢

转载自blog.csdn.net/qq_28831197/article/details/81103897