python识别图片中的文字处理方法 - 代码天地

python识别图片中的文字处理方法

其他 2018-06-21 22:24:11 阅读次数: 3

一、准备工作与代码实例

1、python2.7,PIL、pytesser

(1)安装PIL：下载地址：http://www.pythonware.com/products/pil/

下载后是一个exe，直接双击安装，它会自动安装到C:\Python27\Lib\site-packages中去，

(2)pytesser:下载地址：http://code.google.com/p/pytesser/,（CSDN下载）

下载解压后直接放C:\Python27\Lib\site-packages(根据你安装的Python路径而不同)，同时，新建一个pytesser.pth,内容就写pytesser，注意这里的内容一定要和pytesser这个文件夹同名，意思就是pytesser文件夹，pytesser.pth,及内容都要一样！

(3)将 'C:\Python27\Lib\site-packages\pytesser\pytesser.py' 里面的 tesseract_exe_name='tesseract' 里面是相对路径,改成绝对路径就好了:tesseract_exe_name='F:\\Python\\Lib\\site-packages\\pytesser\\tesseract'，将 import Image 改为 from PIL import Image

（4）：

然后当安装好后运行:

from PIL import Image
from pytesser import * 


image = Image.open('captcha3.png') 
print image_to_string(image)

问题一、WindowsError: [Error 2]

问题详细提示，如下：

产生原因：调用tesseract.exe失败

解决：把tesseract.exe加入当前工程，如图：

说明：这个tesseract.exe就相当于在linux下的 tesseract-orc

问题二、IOError: [Errno 2] No such file or directory: 'tesseract.log'

问题详细提示，如下：

产生原因：不是因为缺少tesseract.log而是因为缺少tessdata文件夹

解决：把tessdata文件夹从pytesser文件夹下拷贝到工程下，如图：

如果仍旧出现问题二，则试试换个tesseract.exe试试。

猜你喜欢

转载自blog.csdn.net/huxiangen/article/details/78812945

python识别图片中的文字处理方法

Python爬虫Pytesseract图像识别与文字处理

图片文字处理 ocr

ps 文字处理

数组与文字处理

css文字处理

python数据采集11-图像识别与文字处理

css中文字处理

Mellel—文字处理器

HTML 文字处理基础

Python识别图片中的文字

Html+CSS下溢出文字处理、背景图片处理

【课件整理复习】第十一章图像识别与文字处理

Windows 10创意者更新显示不了文字处理方法

python切图并识别图片中的文字

python使用pytesseract识别图片中的文字

python 识别图片中的文字信息

python--识别图片中的文字

识别图片中的文字

json数据返回数字，页面显示文字处理

技巧篇一、文字处理技巧

Wrise for Mac(Mac文字处理工具)

CSS多种常用文字处理方式

linux常用文字处理命令总结

java从图片中识别文字

如何识别图片中的文字

识别图片中的文字简单方法有哪些？

python 包的使用（二）——tesseract识别图片中的文字

使用Python进行OCR识别图片中的文字

python利用pytesser3识别图片中的文字信息

今日推荐

基于大语言模型的开源知识库问答系统 MaxKB GitHub Star 数量突破 5,000 个！

美国拟限制 AI 大模型出口中国和俄罗斯

苹果将与 OpenAI 达成协议，将 ChatGPT 应用于 iPhone

openKylin 社区生态委员会第六次会议圆满召开

阿里云正式发布通义千问 2.5

Python 3.13 发布首个 Beta：实验性自由线程模式和 JIT、改进交互式解释器

Stack Overflow 拿我的代码去训练 AI 大模型，还封了我的账号

Pop!_OS 的 COSMIC 桌面完成 App Store 上架工作

《2024 年一季度互联网投融资运行情况》研究报告

报告：Django 仍然是 74% 开发者的首选

15 年前上了“FFmpeg 耻辱柱”，今天他还得谢谢咱——腾讯QQPlayer一雪前耻？

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

周排行

记一下去大梅沙的准备（2018-05-26）

Spring 注解事务

基于HTTP协议的客户端缓存

阿里云rds 备份和还原

[PHP] 几个拖慢 PHP 程序/API 运行速度的点

python 代码风格------------PEP8规则

js控制json生成菜单——自制菜单（一）

将字符串: 'k:1|k1:2|k2:3|k3:4 ' ,处理成 python 字典: {'k':1, 'k1':2, ...}

微信小程序转支付宝小程序

Qt551.窗口滚动条

每日归档

更多

2024-05-13(18)

2024-05-12(0)

2024-05-11(38)

2024-05-10(38)

2024-05-09(35)

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)