pycharm中tesserocr和pytesseract库的安装与使用

前言

这两个库的安装与使用折磨了小白博主几个小时,也是综合了各方资料肝出了这篇较为详细的几乎零基础的tesserocr和pytesseract库的安装与使用教程(主要介绍安装部分),可以帮大家少走一些弯路,利用tesserocr或者pytesseract库,前提是已经安装好Tesseract-OCR软件(文后有安装链接),tesserocr库的安装,问题不大,但要配合tesseract-OCR使用,麻烦死了,反正我搞了好久,还是有一些莫名的错误,听我一句劝就用pytesseract吧!

Tesseract-OCR安装

安装过程如下:
1.下载安装包(直接点开文末链接,下载最新版本就行了)
我安装的是这个:
在这里插入图片描述
带dev的为开发版本,不带dev的为稳定版本
2.打开下载的.exe文件,进行安装,建议按默认选项一路同意下去,然后就安装成功,
在这里插入图片描述
安装过程中,红色框框部分,可以设置下载各个语言的语言包,也可以点‘+’进行选择性下载,默认语言包为英语的语言包,个人感觉这样下载过慢,可以之后进入官网直接下载对应语言包,下载完成后放到Tesseract-OCR\tessdata\目录下
注:chi_sim.traineddata为简体中文语言包,可在cmd中运行tesseract --list-langs命令,查看已安装的语言包
3、设置环境变量
进入环境变量设置面板(不知道如何进入可以自行百度),出现如下界面:
在这里插入图片描述
依次操作,如下图:

  • 1.编辑文本
  • 2.加入Tesseract-OCR软件安装路径(默认为C:\Program Files\Tesseract-OCR,注意各个环境变量以’;'间隔)
  • 3.加入之后,会出现3的情况,环境变量设置ok了
    在这里插入图片描述
    在这里插入图片描述
    4、查看是否成功
    打开cmd,输入tesseract回车,出现如下界面表示成功:
    在这里插入图片描述

pytesseract库配置

1.安装pytesseract库
和普通包一样,直接pip
2.配置pycharm路径
进入下图界面,打开该文件:
在这里插入图片描述
编辑文件,改成下图所示:
在这里插入图片描述
注意:C:\Program Files\Tesseract-OCRC:\Program Files\Tesseract-OCR\tesseract.exe,这是文件所在路径,但直接把文件部分改为该路径,运行仍会报错,而应该改成C:/Program Files/Tesseract-OCRC:/Program Files/Tesseract-OCR/tesseract.exe,二者区别仅仅是’\‘与’/'
3.程序测试

import pytesseract
from PIL import Image
img = Image.open('code.jpg')
img = img.convert('RGB')
img.show()
print(pytesseract.image_to_string(img))

# 输出结果:4XWL

code.jpg
在这里插入图片描述
4.大功告成(^-^

tesserocr库配置

简介

再windows中安装tesserocr是比较麻烦的,如果没有Anaconda,不能直接pip,推荐pytesseract
库,下面只简单介绍一下思路

安装

方法一:
下载匹配的whl文件。链接地址:
https://github.com/simonflueckiger/tesserocr-windows_build/releases ,里面只有对应tesseract4.0.0及以下版本,可在cmd中运行tesseract -v查看自己tesseract的版本。下载对应文件时注意自己是win32还是win64,以及自己python版本
在这里插入图片描述
以我为例python37,win64
下载之后

pip install D:\tesserocr-2.4.0-cp37-cp37m-win_amd64.whl

自己下载文件的路径
方法二:
有Anaconda,直接

conda install -c simonflueckiger tesserocr

可以下个miniconda和pycharm配合使用,个人觉得还行

链接分享

Tesseract-OCR 下载地址: http://digi.bib.uni-mannheim.de/tesseract
Tesseract-OCR语言包:https://github.com/tesseract-ocr/tessdata
tesserocr PyPI:https://pypi.python.org/pypi/tesserocr
pytesserocr PyPI:https://pypi.org/project/pytesseract/
以上就是全部内容了,有错误与不足望指出O(∩_∩)O!

原创文章 6 获赞 7 访问量 550

猜你喜欢

转载自blog.csdn.net/jiuzhongxian_/article/details/105239684