Tesseract5.0 图像识别本地服务一【安装配置】 - 代码天地

Tesseract5.0 图像识别本地服务一【安装配置】

编程语言 2020-06-18 23:05:36 阅读次数: 0

一：简介

OCR(Optical Character Recognition)：光学字符识别，是指电子设备（例如扫描仪或数码相机）检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。
Tesseract：开源的OCR识别引擎，初期Tesseract引擎由HP实验室研发，后来贡献给了开源软件业，后由Google进行改进、修改bug、优化，重新发布。

二：下载

1、Windows版本Tesseract各版本下载，本教程用的版本是tesseract-ocr-w64-setup-v5.0.0.20190623（【注意】要3.0以上才支持中文）。
项目github地址：Tesseract

2、各版本对应字库要识别简体中文需要下载chi_sim.traindata字库（【注意】根据版本下载对应字库）。

3、jTessBoxEditor官网下载，用来训练字库的，带FX的版本才支持中文。

4、各位打不开链接的朋友，看这里：

链接：https://pan.baidu.com/s/1ViyFSR9CjXVy8b7mQeTISQ
提取码：m87b

三：安装

这个就不截图了

安装完成后我们配置环境变量

四：配置环境变量

1、配置系统环境变量

tesseract-ocr-Home

C:\Program Files\Tesseract-OCR

path : 加上新配置的信息

;%tesseract-ocr-Home%

2、配置字库-后期JAVA API要使用

TESSDATA_PREFIX

C:\Program Files\Tesseract-OCR\tessdata

备注：将下载好的字库放到Tesseract-OCR项目的tessdata文件夹里面。

五：验证安装的效果

在cmd窗口输入tesseract -v，配置成功如下图：

六：识别-看看识别的效果

1、tesseract 图片名称 生成的结果文件的名称 字库

例如我的图片识别就是：

tesseract test.png result -l eng

1、执行命令：

2、原图片：

3、识别结果：

这一期就先这样了

猜你喜欢

转载自blog.csdn.net/yexiaomodemo/article/details/106794043

Tesseract5.0 图像识别本地服务一【安装配置】

Tesseract5.0 图像识别本地服务二【字库、训练识别模型】

Tesseract5.0 图像识别本地服务四【Java服务API】

Tesseract5.0 图像识别本地服务三【训练自定义字库,提高图片的识别效果】

tesseract5.0 交叉编译移植到arm

Tesseract-OCR图像文字识别技术安装配置（4.0.0-beta.3）及测试

ActiveMQ5.0实战一: 安装配置ActiveMQ5.0 ActiveMQ5.0实战一: 安装配置ActiveMQ5.0

监控服务器配置(一)-----Prometheus安装配置

(一）jenkins在linux下以服务方式安装配置

Golang的安装配置---一套龙服务

Mac上tesseract-OCR 的安装配置，识别验证码

tesseract-OCR 图像识别插件 node-tesr 了解一下？

Tesseract-ocr 安装配置

Tesseract5.0 在windows下编译VS2019项目

solr安装配置（一）

Hive(一)——安装配置

Gradle（一）安装配置

一、django安装配置

vue（一）[安装配置]

一、kafka 安装配置

Tomcat(一)安装配置

tesseract图像识别验证码：安装使用和避免坑

tensorRT5.0安装配置说明

tesseract_ocr+pytesseract图像识别

云服务器项目部署环境安装配置（一）-- jdk安装

Zookeeper本地安装配置

Maven安装配置一：完整配置

SSH服务安装配置

Https服务安装配置

安装配置FTP服务

今日推荐

TIOBE 5 月榜单：Fortran “复活”进入 Top 10

GCC 14.1 发布

面壁智能发布 Eurux-8x22B 开源大模型 —— 堪称「理科状元」

开源日报 | 谷歌扶持鸿蒙上位；开源Rabbit R1；Docker加持的安卓手机；微软的焦虑和野心；海尔电器把开放平台关了

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

周排行

Java自定义时间格式

同步整形电路

在开发中最最最常用的字符串的属性大集合

Linux 查看端口占用并杀掉

Java基础四：ArrayList

多线程之死锁就是这么简单

mysql 基础命令集

awk 命令详解

Centos6.3编译安装nginx+php步骤

OCR （Optical Character Recognition，光学字符识别）

每日归档

更多

2024-05-08(42)

2024-05-07(14)

2024-05-06(40)

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)