百度AI开放平台——教学视频——基础视觉

文字识别基础介绍及应用场景

百度OCR介绍

OCR基本概念

OCR(Optical Character Recongnition):图像文字识别——让计算机和人一样看图识字的人工智能技术。

OCR API接口整体架构图

算法架构:
在这里插入图片描述
系统架构:
在这里插入图片描述

百度OCR优势

文字识别服务–性能数据

深度学习算法——>数千万PV产品群——>千万级别训练数据——>深度学习算法

语种支持:支持中、英、日、韩、葡、德、法、意、西、俄等十国语言
系统性能:平均耗时500ms
支持产品线:手机百度、百度钱包、百度糯米、百度外卖、百度翻译、百度贴吧、百度推广、涂书笔记、百度地图、百度图片搜索等

文字识别服务–技术优势

公开数据集指标:ICDAR竞赛5项世界第一
在这里插入图片描述

DEMO演示

OCR功能介绍

在这里插入图片描述
通用OCR:多项ICDAR指标世界第一,支持10多种语言的识别,识别率90%以上。
身份证OCR:可识别所有字段,对倾斜、暗光、曝光、阴影等异常情况稳定性好、识别准确率高达98%以上。
银行卡OCR:可准确识别所有主流银行卡卡号,识别率高达98%以上。
(Demo入口:http://ai.baidu.com

文字识别API接入介绍

百度OCR API功能及案例

OCR功能

在这里插入图片描述

文字识别服务(OCR)——通用场景

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

文字识别服务(OCR)——金融场景

在这里插入图片描述

文字识别服务(OCR)——反作弊场景

在这里插入图片描述

自定义模板文字识别基础介绍

用户痛点

现有的通用OCR技术无法找到“字段名”和“字段值”的对应关系。

方案

使用字段之间的相对位置关系,结合百度强大的NLP技术,实现“字段名”和“字段值”的匹配输出。

优势

1.全场景——用户自主定义识别模板,轻松适配所有场景。
2.简单易用——界面花的模板制作过程,5min即可完成一个模板的制作。
3.更智能——对旋转、扭曲的图片进行智能的图片矫正。

自定义模板文字识别实际操作演示

http://abcinstitute.baidu.com/pages/index.html#/video/?courseId=14723&elementId=21932222-e9c7-4f6b-82de-bea1071d2837&userId=6749125&groupId=479938&_k=kgn6cb

图像定制化训练平台使用教程

http://abcinstitute.baidu.com/pages/index.html#/video/?courseId=14719&elementId=e8d488d5-474e-4b90-97c6-754e000c8e80&userId=6749129&groupId=479934&_k=c3tdur

猜你喜欢

转载自blog.csdn.net/weixin_43336281/article/details/87457164