Windows下 tesseract 的配置

Windows下 tesseract 的配置

总感觉tesseract配起来无比蛋疼。。写个博文舒缓下心情

先留个坑,给安装tesseract-ocr


pytesseract的安装

一、install pip pytesseract

你懂的。。

这里写图片描述

二、更改 pytesseract.py 中的 tesseract.exe 的路径

这里写图片描述

三、配置中文OCR

  1. 在chi_sim.traineddata的目录下新建文件 chi_sim.config
    这里写图片描述

  2. 在chi_sim.traineddata的目录下打开命令行,输入
    combine_tessdata -e chi_sim.traineddata chi_sim.config

这里写图片描述

  1. 打开chi_sim.config,在allow_blob_division F这一行前面加#注释掉

中文OCR还没配成功,先这样吧

四、 测试代码

import pytesseract
from PIL import Image

image = Image.open('en1.png')
text = pytesseract.image_to_string(image)
print(text)

猜你喜欢

转载自blog.csdn.net/qq_29159273/article/details/78947506