Python使用OCR识别中英文

其他 2020-01-23 12:17:48 阅读次数: 0

环境

Python 3.6.6
MacOS 10.14.6
pip 19.0.1
mac版的tesseract 4.1.0
pip的tesseract 0.3.0

安装

1.安装python的OCR库

pip install pytesseract

2.在MacOS的终端上安装tesseract，命令：

brew install tesseract

3.下载OCR语言模型
比如：中文是chi_sim.traineddata 文件，下载后，复制到该目录下

/usr/local/Cellar/tesseract/4.1.0/share/tessdata/

4.查看该tesseract所下载后支持的所有的可用语言

tesseract --list-langs

在这里插入图片描述

使用

from PIL import Image
import pytesseract

resDict = pytesseract.image_to_boxes(Image.open('images/example3.png'), lang='chi_sim')
print(resDict)

识别结果是：
在这里插入图片描述

原图片是：
在这里插入图片描述

另一个测试案例

原图
在这里插入图片描述
代码不变，修改图片名，结果是：

错的离谱！！

在来一个实例
原图片：
在这里插入图片描述

代码：

from PIL import Image
import pytesseract

resDict = pytesseract.image_to_boxes(Image.open('images/example4.png'), lang="eng")
arrLetters = resDict.split("\n")
sentence = ""
for letters in arrLetters: 
    sentence += letters.split(" ")[0]
print(sentence)

识别结果是
在这里插入图片描述

识别的精准度还不错，但是我们在拼接句子的时候，不知道在哪里空格，每个单词与单词之间是有间距的，这个就难以控制

Victor.Zhang 博客专家

发布了336 篇原创文章 · 获赞 124 · 访问量 65万+

他的留言板关注

猜你喜欢

转载自blog.csdn.net/u013538542/article/details/102769593

Python使用OCR识别中英文

基于python和tesseract库的中英文识别（OCR)

OCR实时扫描识别中英文--tess_two在Android的使用

C# OCR AspriseOcr测试使用图像文字中英文识别

OpenCvSharp (C# OpenCV) OCR实现中英文识别文字识别(附WinForm完整源码)

python中英文对照

PP-OCR: 3.5M超轻量中英文OCR模型详解(四) 文本识别优化瘦身策略

tesseract 中英文混合识别

中英文，藏文，文字识别

python中英文翻译translate模块使用

python 中英文混合字符

python 中英文时间转换

[Python] 中英文标点转换

python中英文翻译模块

【Python】实现中英文互译

python 中英文翻译

中英文分句

中英文统计

中英文换行

tess4j3.2.1识别中英文

CRNN中英文字符识别

PaddleOCR+OpenCV实现中英文识别

Delphi 用Tessercat 4.1 进行OCR中英文标点符号等识别准确率可达99%以上附全部源码

Delphi 用Tessercat 4.1 进行OCR中英文标点符号等识别准确率可达99.9%以上附全部源码

2018.5.27（python）实例：文本词频分析(中英文各一份)及列表的sort（）使用

软件测试|如何使用Python取句中中英文内容

利用Python将文本中的中英文分离

Python实现中英文混排时行号对齐

python过滤中英文标点符号

python基础和前端中英文对照

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

[编程题]学英语

[codeforces 1288A] Deadline 约数+模

Python的web开发

Docker在Centos 7上的部署

python编码

解决Ubuntu16.04 fatal error: json/json.h: No such file or directory

mysql并发插入

rest接口如何适应jsonp的方案

linux 终端上网设置

高数——等号两边同时求导、积分的解释

每日归档

更多

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)

2024-04-25(22)