PaddleOCR 识别器数据增强 - 代码天地

PaddleOCR 识别器数据增强

企业开发 2022-06-06 10:24:08 阅读次数: 0

PaddleOCR 识别器自带了数据增强方法，如何开启呢？
参照：rec_chinese_common_train_v2.0.yml配置文件。
增加- RecAug: 字段，例如：

Train:
  dataset:
    name: SimpleDataSet
    data_dir: ./train_data/rec/
    label_file_list: ["./train_data/rec/rec_gt_train.txt"]
    transforms:
      - DecodeImage: # load image
          img_mode: BGR
          channel_first: False
      - RecAug: 
      - CTCLabelEncode: # Class handling label
      - RecResizeImg:
          image_shape: [3, 32, 320]
      - KeepKeys:
          keep_keys: ['image', 'label', 'length'] # dataloader will return list in this order
  loader:
    shuffle: True
    batch_size_per_card: 32
    drop_last: True
    num_workers: 0

在这里插入图片描述
增强方法在PaddleOCR-release-2.4/ppocr/data/imaug/rec_img_aug.py里面。
代码如下：

class RecAug(object):
    def __init__(self, use_tia=True, aug_prob=0.4, **kwargs):
        self.use_tia = use_tia
        self.aug_prob = aug_prob

    def __call__(self, data):
        img = data['image']
        img = warp(img, 10, self.use_tia, self.aug_prob)
        data['image'] = img
        return data

猜你喜欢

转载自blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/125155386

PaddleOCR 识别器数据增强

PaddleOCR识别问题

PaddleOCR，图像检测识别

通过PaddleOCR识别PDF

PaddleOCR图片识别

paddleOCR文字识别

Paddleocr数据集制作

paddleocr

paddleocr文本识别模型的训练

基于PaddleOCR的车牌检测识别

PaddleOCR训练自己的数据集

PaddleOCR简单文字识别使用(一)

PaddleOCR文字检测、标注与识别详细记录

YOLO+PaddleOCR实现车牌检测识别

使用 PaddleHub 结合 PaddleOCR 实现车牌识别

PaddleOCR方向分类器优化输入图像

PaddlePaddle / PaddleOCR Public训练自己的数据集

paddleocr学习笔记（八）训练自己的文字识别数据

Paddleocr文本识别数据集的合成与制作----超级详细

PaddleOCR docker实现文字检测身份证识别

PaddleOCR数字仪表识别——图像预处理(python)

【教程】PaddleOCR文字识别，整个安装环境过程

基于PaddleOCR的集装箱箱号检测识别

paddleocr自己训练模型识别字符

YOLOv5+PaddleOCR手写签名识别

PaddleOCR+OpenCV实现中英文识别

PaddleOCR—图片文字识别提取—快速使用教程

【AI测试】已落地-python文字图像识别PaddleOCR

PaddleOCR学习笔记3-通用识别服务

PaddleOCR学习笔记2-初步识别服务

今日推荐

Electron中的关于静态资源加载问题解决方案

《Cursor-AI编程》基础篇-界面指南

《Cursor-AI编程》基础篇-Tab代码智能补充

《Cursor-AI编程》基础篇-Composer功能详解

《Cursor-AI编程》基础篇-Chat功能详解

《Cursor-AI编程》进阶篇-自定义模型

《Cursor-AI编程》进阶篇-上下文详解

【大模型系列篇】最强检索增强技术GraphRAG基本原理详解

【大模型系列篇】基于Ollama和GraphRAG v2.0.0快速构建知识图谱

解释什么是迁移学习？在 CNN 中如何应用？（面试题200合集，高频、关键）

解释数据增强（Data Augmentation）的概念和方法（（面试题200合集，高频、关键））

揭秘大模型“魔法”：Function Calling 让 AI 不止会说，更能“做”！

周排行

ConfigurationClassParser类的parse方法源码解析

基础大讲堂-java 位运算符

ConsecutiveInteger判断给定的整数n能否表示成连续的m(m>1)个正整数之和

多项式问题之六——多项式快速幂

Spring Security技术栈开发企业级认证与授权（四）RESTful API服务异常处理

Linux基础命令---apachectl

MATLAB中的线性插值

Unity编辑器拓展之十七：NGUI ComponentSelector增加搜索框

SqlServer 备份还原教程

[Unity动画]01.

每日归档

更多

2025-04-12(10529)

2025-04-11(9561)

2025-04-10(1213)

2025-04-09(10354)

2025-04-08(12998)

2025-04-07(0)

2025-04-06(0)

2025-04-05(0)

2025-04-04(0)

2025-04-03(0)