Python实现基于开源cnocr和gradio的OCR图像中文字识别工具 - 代码天地

Python实现基于开源cnocr和gradio的OCR图像中文字识别工具

企业开发 2025-04-09 18:30:10 阅读次数: 0

1.直接上代码

#!/usr/bin/env python3
# -*- coding: utf-8 -*-
"""
Created on Fri Dec 13 11:19:16 2024
@author: xioabai
"""
# CnOcr是开源的ocr库，支持中英文识别，准确率高
from cnocr import CnOcr
import gradio as gr

# 初始化CnOcr
ocr = CnOcr()

def perform_ocr(img_path):
    if img_path is None:
        return "请上传图片"
    # OCR识别
    result = ocr.ocr(img_path)
    # 提取text字段并组成新的段落
    paragraph = ''.join(item['text'] for item in result)
    return paragraph

def save_text(text, output_file='output.txt'):
    if not text.strip():
        return "没有内容可以保存"
    with open(output_file, 'w', encoding='utf-8') as f:
        f.write(text)  
    return output_file

# Gradio Interface
with gr.Blocks() as iface:
    gr.Markdown("## OCR 文字识别工具")
    gr.Markdown("上传图片进行OCR文字识别，支持手动编辑，结果保存为txt文件。")

    with gr.Row():
        with gr.Column():
            image_input = gr.Image(type="filepath", label="上传图片")
        with gr.Column():
            edit_output = gr.Textbox(label="识别结果（可编辑）", lines=10)

    with gr.Row():
        recognize_button = gr.Button("开始识别")
        save_button = gr.Button("保存结果(txt)")
        file_output = gr.File(label="下载txt文件", visible=False)

    # 设置按钮点击事件
    recognize_button.click(fn=perform_ocr, inputs=image_input, outputs=edit_output)
    save_button.click(fn=save_text, inputs=edit_output, outputs=file_output)

# 启动Gradio应用
if __name__ == "__main__":
    iface.launch()

2.运行代码后，在chrome浏览器打开地址
测试结果
在这里插入图片描述

3.可手动编辑识别结果，并保存为txt文件
在这里插入图片描述

猜你喜欢

转载自blog.csdn.net/qq_38773993/article/details/144451438

Python实现基于开源cnocr和gradio的OCR图像中文字识别工具

cnocr实现ocr文字检测加识别-python实现

基于python的OCR中文字符识别——基于windows平台

iText for Mac(OCR识别图中文字工具)

cnocr安装和识别文字

文字识别CRNN（基于pytorch、python3）实现不定长中文字符识别

如何使用Python实现图像文字识别OCR

开源的Umi-OCR 文字识别工具

Python实现OCR文字识别

迅捷OCR文字识别软件怎样快速识别图中文字

如何通过迅捷OCR文字识别软件识别提取图中文字

如何使用迅捷OCR文字识别软件识别提取图中文字

基于Pytesseract的OCR文字识别实现

Java 实现OCR 识别图像文字(手写中文)----tess4j

批量识别图片中文字（python、百度开发者工具）

用python写一个图像文字识别OCR工具

用Python写了一个图像文字识别OCR工具

基于MATLAB的图片中文字的提取及识别

图片文字识别开源工具Tesseract-ocr

ollama-ocr：高精度图像文字识别工具

六、AlexNet实现中文字体识别——隶书和行楷

深入学习使用ocr算法识别图片中文字的方法

使用OCR文字识别软件将图中文字识别提取出来的方法

Java调用 Tesseract 实现图片中文字识别

Python中怎么识别中文字符？

使用Python轻松识别音频中文字(Whisper)

Python图像处理之图片文字识别（OCR）

转载-Python图像处理之图片文字识别（OCR）

Python构建快速高效的中文文字识别OCR

python实现中文字符繁体和简体中文转换

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)