针对工业生产钢材部件上压印字符与背景区域同色和光照不均影响,传统计算机视觉算法识别钢印字符存在效率与精度不佳的问题,本研究提出一种基于YOLOv2的钢材压印字符识别方法。通过一些基本的图像预处理方式扩充钢印字符数据集,采用快速可靠的深度学习算法YOLOv2自动提取图像的特征,实现对钢印字符(包括数字和字母)的识别。相较于其他传统的图像识别算法,实验结果表明,该网络模型对钢印字符识别的准确率达98.6%,算法平均处理时间为0.3 s,达到了工程应用的精度和效率要求。此外,利用字符位置信息对模型的输出进行改进,实现直接输出正确的生产标号。在工业生产环境下具有较好的稳定性和实时性,有一定的应用意义。
在钢材器件生产过程中,往往会在每个部件上标注不同的生产编号,这样不仅为了便于对部件的质量监控和信息管理追踪,还为了方便对部件与相应器件间的匹配问题进行把控。压印字符是利用字模对物体表面施压形成的,呈凹凸状,因其不能随意更改而可以永久保存的优点,在工业生产中得以广泛应用。钢材器件通常是大批量的生产,传统的人工手动记录生产编号的方法需消耗大量的劳动力,同时大大延长了生产时间,还容易出错。计算机视觉技术不断发展,应用于工业生产过程当中,极大地减少了工业生产对人工的依赖。现如今,随着工业智能化生产的发展要求不断提高,在工业生产中迫切需要对钢材器件上的压印字符标号进行视觉实时识别。
压印字符与手写字符、印刷字符等一般的光学字符有所不同,压印字符的颜色与背景色是一样的, 因而这两者的对比度不鲜明, 而且在复杂多变的工业生产环境下, 会出现噪声、光照不均衡、抖动模糊、位置不确定等问题,这些问题又进一步增加了压印字符识别的难度。因此,传统的字符识别技术(如模板匹配[1])无法直接应用于钢材压印字符的识别中。
可将钢材压印字符识别看成是具有一般性的目标检测任务。目标检测是计算机视觉[2]研究的热点问题之一,它学习每个对象的可视模型,并找到合适的边界框区域和对象类别。早期较常用的目标检测算法是DPM (Deformable Parts Model) [3],其通过HOG (His-tograms of Oriented Gradients) [4]特征提取,将提取到的图像特征作为输入,利用SVM (Support Vector Machine) [5]进行分类。DPM 在行人检测[6]等目标检测任务上有较好的效果。但实质上,这样的方法对于特征设计十分依赖于人工,过程也比较复杂繁琐。