Paddle实战

Paddle OCR
PP-OCR
PaddleNLP
- UIE定制训练
- 智能语音指令

PaddleOCR官方帮助文档

PaddleNLP官方帮助文档

Paddle帮助文档

旧版本对应关系
在这里插入图片描述

Paddle OCR

paddleocr默认使用PP-OCRv4模型(–ocr_version PP-OCRv4)，如需使用其他版本可通过设置参数–ocr_version，具体版本说明如下：
在这里插入图片描述

文本检测

检测+方向分类器+识别

–use_angle_cls true设置使用方向分类器识别180度旋转文字，–use_gpu false设置不使用GPU

paddleocr --image_dir ./imgs/11.jpg --use_angle_cls true --use_gpu false

结果是一个list，每个item包含了文本框，文字和识别置信度

[[[28.0, 37.0], [302.0, 39.0], [302.0, 72.0], [27.0, 70.0]], ('纯臻营养护发素', 0.9658738374710083)]
......

输入pdf文件

可以通过指定参数page_num来控制推理前面几页，默认为0，表示推理所有页

paddleocr --image_dir ./xxx.pdf --use_angle_cls true --use_gpu false --page_num 2

单独使用检测

设置–rec为false

paddleocr --image_dir ./imgs/11.jpg --rec false

结果是一个list，每个item只包含识别结果和识别置信度

语言切换

通过修改–lang参数进行切换，对于英文模型，指定–lang=en。

paddleocr --image_dir ./imgs_en/254.jpg --lang=en

OCR检测脚本

检测图片

from paddleocr import PaddleOCR, draw_ocr

# Paddleocr目前支持的多语言语种可以通过修改lang参数进行切换
# 例如`ch`, `en`, `fr`, `german`, `korean`, `japan`
ocr = PaddleOCR(use_angle_cls=True, lang="ch")

Paddle实战

Paddle OCR

文本检测

OCR检测脚本

猜你喜欢

目录

热门文章