面向票据的OCR识别算法研究与实现

发布日期:2022年12月22日
面向票据的OCR识别算法研究与实现 面向票据的OCR识别算法研究与实现

本内容试读结束

下载后可阅读完整内容,立即下载

随着对票据使用的不断增多,票据的存储、管理以及票据信息的查找,逐渐变得繁琐,给人们带来困扰。通过对票据中信息的识别,发现其中圆形印章中的字符并不能准确识别,针对环形字符以及印章中文字的准确识别进行研究,实现了面向票据的OCR识别算法。使用Canny算子边缘检测、Hough变换、极坐标变换、以及确定极坐标变换起点的算法等,实现了能够按照印章中文字排列的逻辑进行变换,并成功识别出印章中所含的文字内容。实验结果表明,对印章中文字内容识别的正确率达到83.84%。

随着经济不断发展,以银行代表的金融业票据量及票据种类越来越多,单纯靠人工来识别票据和印章已经不足以满足人们的需求。因此,为了提高印章的识别效率,实现面向票据的印章内容自动识别必不可少。票据的印章中通常包含了公司的单位名称、税务登记号以及其他重要信息。利用特定的提取方法和识别方法可以对印章内容进行处理,而印章的内容相对于文字识别来说具有不规则形状,例如呈圆环状或者拱形排列,而且文字排列方向不统一,这使得印章的识别工作更加困难。

OCR [1] (Optical Character Recognition 光学字符识别)技术,是指利用电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。也就是通过扫描文本资料,然后对图像文件进行分析处理,来获取文字以及版面信息的过程。信息电子化在计算机技术发展的浪潮中,已经逐渐成为一个必然趋势,而文字又作为信息中最重要的一种载体,其电子化的程度决定了信息化的程度。

光学字符识别(OCR)这一概念, 最早由德国科学家Tausheck 在1929 年提出。

汉字识别最早是由IBM (International Business Machines Corporation)公司的工程师Casey 与Nagy 实现的,他们在1966 年发表了首篇汉字识别相关的文章,采用的是模式匹配的方式,可以识别1000 个印刷体汉字。之后,OCR 技术得到大量研究, 经过近60 年的发展, 并且随着相关技术以及算力的提升, 现在已经广泛应用在各个领域。

在现阶段,这项技术已经比较成熟,应用风险也低。OCR 一般可分为手写体识别和印刷体识别,识别内容则包括汉字、英文字母、阿拉伯数字、常用标点符号等。

一套OCR 处理流程基本可分为版面分析、预处理、行列切割、字符识别、后处理识别矫正共计5 个步骤[2]。

综上所述,本文实现了面向票据的OCR 识别算法,解决了对票据上圆形印章和拱形文字的识别,给人们对于票据信息的获取和保存带来便利。

2. 相关工作 2.1. 研究背景 通过对OCR 技术简单的测试,不难发现OCR 对数字和英文字符的识别效果是普遍高于对中文的识别效果的,之所以会出现上述情况,与中文字体的复杂形状有着直接的关系。传统的OCR 技术,能够使用模式匹配、支持向量机或者浅层神经网络等方法,针对文字噪声少、设计高性能的特征向量,可以得到很高的准确度, 但是当传统的OCR 技术用于有着大量噪声、复杂的中文文字或者非线性排列的文字识别时,识别效果较差[3]。传统OCR 标注如图1 所示:



相关标签