文本图像在扫描阶段的倾斜现象会对后续的图像分割以及光学字符识别(OCR)等处理造成极大的影响。本文提出了一种方向白游程算法的改进算法,通过对文本图像旋转从而对不同倾角的白游程进行扫描,然后统计每一个倾角上的白游程长度,最后找出最大白游程长度的倾角来调整文本图像。实验结果表明该算法能够准确并快速的校正文本图像。
随着数字化技术的发展,“无纸化”已经成为办公自动化的显著特点。将纸质文章拍摄成为照片, 不仅能够保持原文件的书写特征,而且可以使用JPEG、TIFF 等图像编码格式表示,易于存储建档并在互联网中传输。文本图像在存储后可以运用信息处理技术提取感兴趣的信息,因此在各类信息系统汇总得到了广泛的应用。然而在将纸质文件转换为文本图像的过程中,由于机械操作和人为的原因,不可避免地会造成文本图像的倾斜,这种倾斜显然将对文本图像的分析,如图像分割、版面分析和理解及光学字符识别处理等产生不利的影响。因此,文本图像倾斜角度的检测和校正是文本图像预处理中一个必不可少的技术环节。
目前,已有很多研究人员开展了图像的倾斜校正方面的研究工作。主要的方法有基于Hough 变换[1]的图像倾斜校正的方法[2]、基于投影的方法[3] [4]、直线拟合方法[5]等。Hough 变换方法是把倾斜角度检测问题看作直线检测问题,通过把图像上的点映射为参数空间上的线,然后在参数空间上求多条直线的交点得到图像空间上的直线参数,从而完成倾斜角度检测。该方法精度较高,但是耗费时间比较多, 需要的存储空间也比较大。方向投影法是用不同倾斜角度对图像进行投影,同时把各个角度下的投影值保存下来,最后通过取得投影最大值时的方向或者通过设定的能量函数求得最小值时的方向作为图像的倾斜方向。该方法效果较好,但需要对各个方向投影,由粗到精,所以运算量较大,时间较长。直线拟合的方法通过对图像做傅里叶变换,然后在傅里叶能量谱中获得亮线所在的方向,该方向垂直的方向即为图像倾角方向。由于要对图像做二维傅里叶变换,所以运算量也很大。前人提出了一种基于方向白游程的倾角检测,只对图像进行一遍扫描,只对少于百分之一的像素点计算方向白游程,故计算量很小, 速度较快。但是该算法对于行间距较大的文本图像存在误差,所以本文基于上述算法提出了一种改进算法。本算法通过对图像旋转从不同倾角白游程进行扫描,然后统计每个方向上白游程长度,最后通过不断的调整与对图像倾斜角度不断的精确化,从而达到对文本图像倾斜校正的目的。
2. 方向白游程 白游程是指从一个白色的像素点出发,一直沿着直线方向向前走,直到遇到黑色的点或者到达图像的边缘为止,得到的白点走过的线段。如果沿着不同方向的直线向前走,直到遇到黑色的点或者到达图像的边缘为止,就得到了方向白游程[6]。由方向白游程概念可以知道,选择文本行中间的白像素点作为中心点时,当游程线的方向与图像的倾斜角度一致时,游程的长度达到最大。因此可以通过计算最大游程长度所在方向来获得图像的倾斜角度。