Window系统tesseract+tesserocr过程中,发生的一系列问题及解决办法(已解决)

在Windows下安装tessocr,首先需要下载tesseract,它为tesserocr提供了支持。

tesseract下载地址:https://digi.bib.uni-mannheim.de/tesseract/

进入下载页面,可以看到有各种.exe文件的下载列表,这里可以选择下载3.0版本。示例为3.05版本。

其中文件名中带有dev的为开发版本,不带dev的为稳定版本,可以选择下载不带dev的版本,例如可以选择下载tesseract-ocr-setup-3.05.01.exe。

下载完成后双击,此时会出现如图1-25所示的页面。

此时可以勾选Additional language data(download)选项来安装OCR识别支持的语言包,这样OCR便可以识别多国语言。然后一路点击Next按钮即可。

接下来,再安装tesserocr即可,此时直接使用pip安装:

不建议使用虚拟环境中使用 pip installl tesserocr(运行会报错)

pycharm可以使用pytesserocr(仍然无法运行,有的伙伴这里可以使用)

解决方式

  5.1 :CMD管理员模式 输入pip install wheel 等待安装完成;
  5.2 : 升级pip
  5.3: CMD下输入: pip install tesserocr-2.2.2-cp36-cp36m-win64.whl   

  whl文件下载地址:https://github.com/simonflueckiger/tesserocr-windows_build/releases

  5.4重点一步:将tesseract安装目录中的tessdata数据copy到python安装目录中(或虚拟环境中)  ok

猜你喜欢

转载自blog.csdn.net/sinat_22498107/article/details/83387339