动手RAG: ocr文字识别

对于rag应用来说,文档是第一步,对于部分扫描件的文件来讲,主要就需要OCR.
在这里插入图片描述
在这里插入图片描述

OCR

还有诸如

OCR包含几类,

  • 自然场景中的文字识别,文档中的文字识别
  • pipeline: 文本检测,文本识别,文档结构化识别(版面分析,表格识别,关键信息提取)

在这里插入图片描述
在这里插入图片描述
表格识别
在这里插入图片描述
部署
在这里插入图片描述

pdf解析

文档解析

参考

  • https://github.com/PaddleOCR-Community/Dive-into-OCR/blob/main/notebook_ch/1.introduction/OCR%E6%8A%80%E6%9C%AF%E5%AF%BC%E8%AE%BA.ipynb