表格票据识别,智能OCR

核心关键词:文字识别、票据识别、数据捕获、OCR、事后监督、事中监督 1

文通银行票据识别引擎是针对银行巨大的票据业务,使用票据OCR技术提取票据影像上的关键字段要素,自动建立索引,从而完成金融领域风险监督、票据自动存档。银行票据识别引擎(SDK)由两部份组成:模板编辑器和分类识别核心。其中模板编辑器完成票据模板的规则定制工作,并由识别模板指导识别核心进行影像分类和识别。

工作原理如下图:

1.1 模板编辑器 文通银行票据识别系统提供了便捷的模板制作工具——模板编辑器。模板为识别过程提供指导,包括分类标识、定位标识、识别要素等详细信息。分类标识信息包括:图像大小、版面特征文件、框线信息、标题信息、文本信息等多种分类信息。在识别过程中具体采用的分类算法可以通过模板编辑器在主模板中配置。

1.2 图像预处理模块 文通银行票据识别系统在对影像进行识别前做了多项预处理操作,为之后识别输出最优的图像质量,具体有纠偏、偏色校正、滤色、降噪、二值化、增强识别单元对比度等功能。这些预处理功能均可通过参数灵活配置、自由组合。

1.3 票据分类模块 文通银行票据识别系统票据分类功能强大:系统同时支持表格框线(位置、颜色)分类、标题单元(标题内容、标题颜色)分类、文本区域(文本内容、文本颜色)分类等,以限度发掘不同凭证之间的差异。如框线颜色、标题颜色均可以用来区分多联凭证的不同联;文本内容可以区分同一凭证打印多种交易的影像;文本颜色可以用来区分同一种凭证分多联并且不同联之间框线颜色和标题颜色均相同的影像。

1.4 字符识别核心模块 系统支持印刷汉字识别、印刷英文识别、印刷数字识别、手写汉字识别、手写英文识别、手写数字识别、磁码识别、条形码识别、客户签字检测、附件章检测等多个识别引擎。

2. 我们的技术服务 我们的宗旨:为客户提供企业级的数据采集技术

我们的技术服务内容:

1、识别需求评估;

2、二次开发技术支持,在企事业客户开发应用系统的过程中,我们将全程跟踪,为客户方提供专业团队的技术服务;

3、持续的软件升级服务;

猜你喜欢

转载自blog.csdn.net/ocr_sinosecu/article/details/81061483