【GitHub-star16.5k】最强开源OCR工具！！！

我们日常工作经常需要处理各种格式的文档，无论是PDF、图片还是其他格式，传统的文档处理方式往往效率低下，容易出错，那有没有什么工具减轻这繁重的工作量呢？今天给大家带来了~

项目简介

Surya是一个开源的OCR工具包，，它支持90多种语言的文字识别，能够轻松应对各种语言的文档处理需求。无论是英文、中文、日文还是韩文，Surya都能处理。它不仅具备强大的文字识别能力，还能进行布局分析、表格识别等高级功能，让你的文档处理变得更加简单高效。

性能特色

多语言支持：Surya支持90多种语言的文字识别，无论你面对的是何种语言的文档，它都能轻松应对
行级文本检测：Surya能够对文本进行行级检测，确保每一行文字都被准确识别和理解
布局分析：除了文字识别外，Surya还能对文档的布局进行深入分析，识别出表格、图片、标题等元素
表格识别：Surya在表格识别方面表现尤为出色，它能够清晰地识别出表格中的行、列和单元格，甚至能识别旋转的表格和复杂的布局
可商用与跨平台：Surya完全开源且允许商业用途，这意味着你不仅可以在个人项目中使用它，还可以将其集成到商业应用中。同时，它还支持Windows、Mac和Linux等多种操作系统，让你的文档处理不再受平台限制
高效处理：Surya使用了新的模型架构，大幅提升了识别精度和速度。无论是文字还是表格的处理，它都能在短时间内给出准确的结果

快速安装使用

1、pip安装

pip install surya-ocr

2、Docker安装

docker pull vikparuchuri/surya
docker run -v ${path_to_host_folder_to_scan}:/path vikparuchuri/surya:latest [COMMAND] [OPTIONS] [SOURCE_PATH]

3、源码安装（前提电脑已安装-git）

git clone https://github.com/VikParuchuri/surya.git
cd surya
make build

项目体验展示

安装完成后，通过命令行或者Python代码来使用Surya。

比如，你想用Python代码来识别一个图片中的文字，可以这样写，如下：

from PIL import Image
from surya.recognition import RecognitionPredictor
from surya.detection import DetectionPredictor

image = Image.open(IMAGE_PATH)
langs = ["en"]
recognition_predictor = RecognitionPredictor()
detection_predictor = DetectionPredictor()

predictions = recognition_predictor([image], [langs], detection_predictor)

【GitHub-star16.5k】最强开源OCR工具！！！

项目简介

性能特色

快速安装使用

1、pip安装

2、Docker安装

3、源码安装（前提电脑已安装-git）

项目体验展示

安装完成后，通过命令行或者Python代码来使用Surya。

比如，你想用Python代码来识别一个图片中的文字，可以这样写，如下：

第一次运行Surya时，模型权重会自动下载，不用担心配置复杂的问题

运行后，Surya会输出一个包含检测到的文本和边界框的JSON文件

效果图：

GitHub地址：GitHub - VikParuchuri/surya: OCR, layout analysis, reading order, table recognition in 90+ languages

都看到这里了点歌赞支持一下吧！！！

目录

项目简介

性能特色

快速安装使用

1、pip安装

2、Docker安装

3、源码安装（前提电脑已安装-git）

项目体验展示

安装完成后，通过命令行或者Python代码来使用Surya。

比如，你想用Python代码来识别一个图片中的文字，可以这样写，如下：

第一次运行Surya时，模型权重会自动下载，不用担心配置复杂的问题

运行后，Surya会输出一个包含检测到的文本和边界框的JSON文件

效果图：

GitHub地址：GitHub - VikParuchuri/surya: OCR, layout analysis, reading order, table recognition in 90+ languages

都看到这里了点歌赞支持一下吧！！！

猜你喜欢

目录

热门文章