一、介绍
tesserocr一个OCR识别库,其实是对tesseract做的一层pythonAPI封装,识别图形验证码
二、安装
2.1 tesseract安装
- 官网:https://digi.bib.uni-mannheim.de/tesseract
- Windows安装程序:https://github.com/UB-Mannheim/tesseract/wiki
- Github:https://github.com/tesseract-ocr/tesseract/releases
带dev为开发版本,不带为稳定版本
》》双击安装
》》选择中文语言包
》》配置安装路径安装
》》配置环境变量
》》配置语言包
- Github地址:https://github.com/tesseract-ocr/tessdata
》》将下载的文件解压到如下目录下
》》重新列出支持的语言
》》验证安装
使用其识别如下图片
》》语法阐述
test.png:目标截图文件
result:生成的记事本识别翻译文件
-l:指定的字体(避免乱码)
2.2 tesserocr安装
》》pip install testserocr pillow
安装报错
使用wheel方法安装