PP-OCRv4rec数显表识别，tensorrt-cpp推理

企业开发 2025-04-08 13:23:22 阅读次数: 0

前言

在上文 PaddleOCR数字表计识别，环境配置，数据集制作，训练推理全套流程中，我们介绍了如何训练一个PP-OCRv4模型，在实际使用中，主要应用ocr的需求是文本识别，故本文介绍如何通过tensorrt-cpp推理PP-OCRv4rec，便于工业应用的进一步落地。

一、训练好的模型转换为inference模型

inference 模型（paddle.jit.save保存的模型）一般是模型训练，把模型结构和模型参数保存在文件中的固化模型，多用于预测部署场景。训练过程中保存的模型是checkpoints模型，保存的只有模型的参数，多用于恢复训练等。与checkpoints模型相比，inference 模型会额外保存模型的结构信息，在预测部署、加速推理上性能优越，灵活方便，适合于实际系统集成。
转换代码：

python3 tools/export_model.py -c configs/rec/PP-OCRv3/en_PP-OCRv3_rec.yml -o Global.pretrained_model=./pretrain_models/en_PP-OCRv3_rec_train/best_accuracy  Global.save_inference_dir=./inference/en_PP-OCRv3_rec/

-c 后面设置训练算法的yml配置文件,-o 配置可选参数Global.pretrained_model 参数设置待转换的训练模型地址，不用添加文件后缀 .pdmodel，.pdopt或.pdparams。Global.save_inference_dir参数设置转换的模型将保存的地址。
>注意：如果您是在自己的数据集上训练的模型，并且调整了中文字符的字典文件，请注意修改配置文件中的character_dict_path为自定义字典文件。

转换成功后，在目录下有三个文件：

inference/en_PP-OCRv3_rec/
├── inference.pdiparams # 识别inference模型的参数文件
├── inference.pdiparams.info # 识别inference模型的参数信息，可忽略
└── inference.pdmodel # 识别inference模型的program文件

可通过下面代码测试转换的模型，如果训练时修改了文本的字典，在使用inference模型预测时，需要通过–rec_char_dict_path指定使用的字典路径。

python3 tools/infer/predict_rec.py --image_dir="./doc/imgs_words_en/word_336.png" --rec_model_dir="./your inference model" --rec_image_shape="3, 48, 320" --rec_char_dict_path="your text dict path"

二、推理模型转化为onnx

ppocr转换为onnx模型需要包Paddle2ONNX ，Paddle2ONNX 支持将 PaddlePaddle 模型格式转化到 ONNX 模型格式，算子目前稳定支持导出 ONNX Opset 9~18，部分Paddle算子支持更低的ONNX Opset转换。
安装：

python3 -m pip install paddle2onnx

模型转换：

paddle2onnx --model_dir ./inference/ch_PP-OCRv4_rec_infer \
--model_filename inference.pdmodel \
--params_filename inference.pdiparams \
--save_file ./inference/rec_onnx/model.onnx \
--opset_version 11 \
--enable_onnx_checker True

执行完毕后，ONNX 模型会被分别保存在 ./inference/det_onnx/，./inference/rec_onnx/，./inference/cls_onnx/路径下,注意：对于OCR模型，转化过程中必须采用动态shape的形式，否则预测结果可能与直接使用Paddle预测有细微不同,Paddle2ONNX 版本 v1.2.3后已默认支持动态shape。

三、tensorrt-cpp推理：

虽然PaddleOCR提供了TensorRT部署支持, 但是其代码比较复杂, 比较难解耦. 本项目提供了相对简洁的代码, 展示如何使用TensorRT C++ API和ONNX进行PaddleOCR文字识别算法的部署项目地址：
,项目下载好之后，修改CMakeLists.txt中tensort的路径为自己的路径，例如：

cmake_minimum_required(VERSION 3.18)
project(tensorrt_cpp_api)

# Set C++ version and optimization level
set(CMAKE_CXX_STANDARD 17)

set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -Wall -Ofast -DNDEBUG")
# set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS}")
# add_compile_options(-fno-elide-constructors) 

# For finding FindTensorRT.cmake
set(CMAKE_MODULE_PATH "${CMAKE_SOURCE_DIR}/cmake" ${
    
    CMAKE_MODULE_PATH})

# TODO: Specify the path to TensorRT root dir
set(TensorRT_DIR "/home/build/下载/TensorRT-8.4.3.1.Linux.x86_64-gnu.cuda-11.6.cudnn8.4/TensorRT-8.4.3.1/")

# We require CUDA, OpenCV, and TensorRT
find_package(TensorRT REQUIRED)
find_package(CUDA REQUIRED)
find_package(OpenCV REQUIRED)

add_library(tensorrt_cpp_api SHARED
        src/engine.cpp)

target_include_directories(tensorrt_cpp_api PUBLIC ${
    
    OpenCV_INCLUDE_DIRS} ${
    
    CUDA_INCLUDE_DIRS} ${
    
    TensorRT_INCLUDE_DIRS}
        ${
    
    TensorRT_DIR}/samples/common)
target_link_libraries(tensorrt_cpp_api PUBLIC ${
    
    OpenCV_LIBS} ${
    
    CUDA_LIBRARIES} ${
    
    CMAKE_THREAD_LIBS_INIT} ${
    
    TensorRT_LIBRARIES})

add_executable(demo src/main.cpp)
target_link_libraries(demo tensorrt_cpp_api)

修改src文件夹下的main.cpp文件，



  // TODO: Specify your character_dict here.
  std::string label_path = "../data/ppocr_keys_v1.txt";
  // TODO: Specify your test image here.
  const std::string inputImage = "../data/word_2.png";
  // TODO: Specify your model here.
  const std::string onnxModelpath = "../data/modelv3.onnx"; // Modify to "../data/modelv2.onnx" when using ppocrv2

将这三个地方修改为自己的路径，分别为训练时候的字符串文件，测试图片，与刚才转换好的onnx文件，修改好之后执行下面步骤。

cd /home/build/下载/PaddleOCR_TensorRT_cpp-main(1)/PaddleOCR_TensorRT_cpp-main
mkdir build
cd build
cmake ..
make
./demo

运行demo的时候会自动生成engine文件，下次运行的时候会自动调用此文件。
最终效果：
请添加图片描述
结束！

猜你喜欢

转载自blog.csdn.net/HanWenKing/article/details/144203008

PP-OCRv4rec数显表识别，tensorrt-cpp推理

车牌识别：使用PaddleOCR特色模型ch_PP-OCRv3_det+ch_PP-OCRv3_rec

【论文简介】PP-OCRv1-v4中文字符识别论文概述

26- OCR 基于PP-OCRv3的液晶屏读数识别

yolov11det-cpp-tensorrt推理流程讲解

仪表识别之数字表识别

超轻量OCR系统PP-OCRv3技术解读

YOLOv4 tensorrt推理 python版【附代码】

yolov8+tensorRT加速推理+部署-姿态识别-实力分割-目标检测

软件工程应用与实践（十）：PP-OCRv2的简单介绍

安装PaddlePaddle及使用PP-OCRv3 模型提取身份证信息

TensorRT对TensorFlow模型进行推理

TensorRT创建Engine并推理engine

TensorRT 推理 (onnx-＞engine)

tensorRT 分类模型构建与推理

图像识别谈论，不仅限于OCR，基于水表识别，燃气表识别为例

PaddleOCR数字仪表识别——图像预处理(python)

【钟表识别】基于matlab GUI形态学钟表识别【含Matlab源码 1351期】

OCR文字识别rec数据合成制作

基于TensorRT的神经网络推理与加速

TensorRT深度学习推理框架介绍

深度学习推理加速TensorRT简介

TensorRT C++ 批量推理笔记

Pytorch模型通过TensorRT部署推理---HRNet

Tensorrt笔记（四）推理分割模型

TVM VS TensorRT推理速度比较

使用TensorRT加速Pytorch模型推理

C++:点云检测tensorrt推理

pointnet C++推理部署--tensorrt框架

tensorRT模型推理时动态shape

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)