APP下载

基于对比度增强和背景估计的文档图像二值化

2018-04-08完颜勇

电子科技 2018年4期
关键词:二值像素点文档

完颜勇

(北方工业大学 城市道路交通智能控制技术北京市重点实验室,北京 100144)

文档图像中含有大量的文本信息,在对文档图像进行分析和处理时,文档图像的二值化处理是重要的环节。文档图像的二值化处理通常执行在文档分析处理的预处理阶段,它的目标是将灰度或者彩色文档图像中的前景文本从文档背景中分离出来,以二值形式的图像进行显示,同时尽可能的保留原文档图像中的文本信息。文档图像二值化处理性能的好坏直接后续的文本检测、文本识别、信息检索等文本处理应用的性能。

针对图像的二值化问题,国内外已经进行了大量的研究工作。除了原理较为简单的Ostu[1]、Niblack[2]、Bernsen[3]、Sauvola[4]等二值化算法之外,更加复杂的方法已经被应用到图像的二值化处理过程中。Tsai和Lee[5]提出了一种基于亮度和饱和特征来实现对彩色图像的二值化处理。Le等[6]提出使用香农熵和复杂的后续处理来改善对退化文档图像的二值化处理。Tabbone和Wendling[7]采用了迭代概率C-means聚类算法对彩色图像进行二值化处理。Hebert等[8]提出以条件随机场为基础框架来结合6种不同的算法的来对图像进行二值化处理。Su等[9]提出一种结合文档图像的局部对比度和梯度来实现对不同退化状况的文档图像的二值化处理。这些算法既保证的二值化算法研究的连续性,又在发展过程中得到了不断创新。

1 二值化算法的设计及实现

针对文档图像存在的文本对比较弱、背景笔迹渗透、笔墨污点等不同的退化状况对文档图像二值化处理的影响,本文提出了一种基于对比度增强和背景估计的文档图像二值化算法,用于对退化的文档图像进行二值化增强处理。该算法首先通过对比度增强算法用于增强弱对比度文本与背景的对比度,其次通过背景估计及移除来抑制文档背景对文档图像二值化的干扰,最后根据边缘像素邻域灰度值的分布情况进行文本断笔修复,算法流程图如图1所示。

图1 二值化算法流程图

1.1 区域划分

在文档图像的二值化处理过程中,图像的方差、均值和梯度等特征均得到了普遍重视,但图像的亮度信息并没有引起足够的关注。直观上可以观察到,当文档图像整体或者部分处于阴影或强光条件下,文本与背景的对比明显较弱,因此光照条件是影响退化文档文本区域对比度不同的重要因素之一。通过对100张光照不均匀的退化文档的区域亮度信息进行统计分析和测试,发现通过文档的不同区域的亮度信息差异可以有效区分出亮区域、暗区域和均匀光照区域。文中将灰度图像的256个灰度值划为的3个范围,如果像素点的灰度值在区间[0,63]范围内,则将该像素点定义为低灰度值像素点;如果像素点的灰度值处于区间[192,255]内,则将该像素点定义为高灰度值像素点。

通过研究多幅图像的灰度直方图之间差异,发现不均光条件下对文档图像区域特征影响如下:

(1)阴影和亮光对像素灰度值处于[64,255]范围的像素影响较大;

(2)阴影会造成文档区域内的高灰度值像素点的比例减少,而低灰度值像素点的比例基本能够保持不变;

(3)亮光会使文档区域内高灰度值像素点的比例增加,同时会使区域内的低灰度值像素点的比例下降。

亮区域、暗区域和均匀光照区域划分方法如下所示:

(1)将文档图像均分为N×N个子区域,遍历每个子区域,分别统计子区域中高、低灰度值像素点所占的比例;

(2)如果高灰度值像素点所占的比例≥0.9,则判定该子区域为亮区域;如果低灰度值像素点所占的比较>0.05且高灰度值像素点的比例<0.2,则判定该子区域为暗区域;如果前两种条件均不满足,则该子区域为均匀光照区域。

1.2 对比度增强

使全局二值化算法或局部二值化算法对文档图像进行处理时,处理的目的均是找到理想的阈值来有效地将文本前景从背景中分离出来。但对于退化的文档图像来说,传统的方法并不能够取得理想的效果。因此,本文根据不同的区域划分,使用不同的对比度增强算法对文档图像进行增强处理,增强后的文档图像为后续更进一步处理提供了便利。

对于亮区域或暗区域,由于亮光或阴影的存在,造成文本与背景的灰度对比降低,文中使用了强的对比度增强方式对其进行增强处理

(1)

对于均匀区域,文本与背景的灰度对比较为明显,为了便于后续的处理,使用弱对比度增强算法对其进行增强处理

(2)

在式(1)和式(2)中,f(x,y)为原文档图像上坐标(x,y)处对应的灰度值;fmax(x,y)、fmin(x,y)分别为原文档图像上的灰度最大值和最小值;δ是为了防止分母为零而引入的一个比较小的正数,图2(b)显示了对比度增强的效果。

图2 对比度增强效果图

1.3 背景估计及移除

形态学闭运算可以去除与结构元素相比尺寸较小的暗细节,使得图像变亮,同时能够保持图像的整体灰度值和较大的暗区基本不变。基于这一特性,对文档图像进行形态学闭运算处理,获取文档图像的近似背景估计图像。由图3所示,结构元素尺寸的选择对文档图像背景估计有着决定性的影响,经过大量的实验测试验证:结构元素尺寸取值为(2Sw+1)×(2Sw+1),背景估计的效果最佳,文本笔画宽度的Sw计算如下:

图3 不同结构元素尺寸下的背景估计图像

(1)文档图像边缘的检测。本文采用Canny边缘检测算法[10]对文档图像进行边缘检测,提取文档图像的边缘信息;

基于上述算法得到的背景估计图像减去原文档图像得到背景移除后的图像,如图4所示。

图4 背景移除后的图像

1.4 全局阈值分割

在背景移除后的文档图像经过双边滤波[11]后得到的图像中,文本前景像素的灰度值范围较为集中。因此,使用Ostu算法对经双边滤波后的背景移除文档图像进行二值化处理,处理的结果如图5所示,所得的二值化图像中的文本笔画较原文本粗,需进一步处理。

图5 全局二值化效果

1.5 使用Sauvola算法细化文本边缘

Sauvola算法在图像的二值化处理中得到了广泛的应用,它的主要优点在于它对有噪声和模糊存在的图像具有良好的处理效果和运行效率。Sauvola算法引入了两个参数w和k。w和k值的选择对文档的二值化效果有着至关重要的影响。w过小会造成文本笔画断裂或出现在空洞,过大会加粗文本的笔画,它的尺寸的选择依赖于文档图像的内容。k值的选择影响着低对比度文档图像的二值化,较低的k值可以获得更多低对比度文本。

在获取文档图像的全局阈值二值化图像后,通过结合Sauvola二值化图像对文本笔画进行细化处理。在Sauvola二值化图像的文本像素集中,查询与全局二值化图像共有的文本像素集,作为笔画细化后的二值化处理结果保存起来,如图6(b)所示。通过大量的实验测试,当k=0.01,w=11×11时能够获得最好的文本笔画细化效果,较低的k能够获得更多的低对比度文本,同时也会引入更多的噪声和伪影,而全局二值化图像是基于背景移除后的图像得到的,能够较好地抑制各种不同的退化状态存在对文档图像二值化处理的影响。

图6 笔画细化前后对比

1.6 文本断笔修复

在上述算法得到的二值化图像中可能会有噪音和笔画断笔现象的存在,二值化的效果需要进一步改进。为减少噪声的干扰,使用中值滤波器[12]对文档图像的二值化图像进行滤波处理。另外,文本断笔的存在严重影响了二值化性能,文本断笔需要进一步修复:

(1)使用Canny边缘检测算法获取二值化图像的边缘像素集,为了更精确地确定边缘像素集,排出孤立的边缘像素;

(2)对于边缘像素集中的任一边缘像素(i,j),查询其对应的邻域像素: (i+1,j)、(i,j-1)、(i,j+1)和(i-1,j),将(i,j-1)、(i,j+1)和(i+1,j)、(i-1,j)两两配对;

(3)若同一对的两个像素在二值化图像中均为同一类像素(背景或前景),则指定在原文档图像对应位置上灰度值低的像素为前景像素,另一像素为背景像素,对二值化图像进行文本断笔修复。同时,将置为前景的像素纳入边缘像素集中;

(4)重复操作步骤(2)和步骤(3),直到遍历所有的边缘像素,图7(b)显示了文档图像的二值化最终效果。

图7 文档图像的二值化效果

2 实验结果与分析

为了验证算法的有效性,本文实验使用了由DIBCO竞赛提供的4个数据库(2009,2010,2011,2012)对文中所提的算法进行了测试和评估,DIBCO数据库由不同类型的退化文档和其对应的真值图像组成,图8显示了DIBCO数据库中的部分示例。

图8 DIBCO数据库的部分示例

为了证明本文提出二值化算法的有效性,本文在实验中对比分析了本文算法、Ostu算法、Sauvola算法和Su算法的性能,并使用F-Measure(FM)、Peak Signal to Noise Ratio(PSNR)、Negative Rate Metric(NRM)和Misclassification Penalty Metric(MPM)对二值化算法的性能进行定量分析,具体的对比结果如表1所示。

表1 不同二值化算法性能对比

从表1中可以得到,本文算法取得的各项性能指标为:F-Measure为90.47,PSNR为19.15,NRM为5.38,MPM为0.33。与Ostu和Sauvala算法相比,本文算法在F-Measure、PSNR、NRM和MPM指标上均有了的提升;与Su算法相比,本文算法仅在PSNR指标上略微低于Su算法,而其它方面的性能指标均优于Su算法;这就意味着本文算法能够更好地对退化的文档图像进行二值化处理。图9、图10和图11显示了4种算法的二值化效果的部分示例。

图9 不同的二值化算法对图6(a)的处理效果

从图9可以观察到,对于文本对比度较弱的区域,Ostu、Sauvola和Su均能够不带噪声的提取出文本,但文本出现的明显的断笔现象;图9(d)显示了本文算法对文档对比度变化具有更强的容忍性,在强对比度区域和弱对比度区域,均能较好的提取出文本,同时压制噪声的存在。

图10 不同的二值化算法对图6(b)的处理效果

在图10中,对于背部文本渗透的文档二值化处理,Ostu和Sauvola较为明显了引入了大量的噪声,Su和本文算法均能合理地确定前景像素和背景像素,抑制了噪声的干扰。

图11 不同的二值化算法对图6(c)的处理效果

图11显示了有笔墨污点存在的文档的二值化处理效果,Ostu将笔画污点当作了前景文本进行了处理,Sauvola在对笔墨污点区域二值化处理时引入了大量的噪音;Su在抑制噪音的同时,笔墨污点区域的文本出现了断笔;本文算法对笔墨污点区域具有良好去除效果,同时能够较为完整地检测出文本。通过对不同退化状况文档图像二值效果分析,验证了本文算法能够较好地处理具有不同退化状况的文档图像。

3 结束语

本文针对文档存在的文本对比较弱、背景笔迹渗透、笔墨污点等各种退化状况对文档图像二值化的干扰,提出了一种基于对比度增强和背景估计的文档图像二值化算法。该算法首先通过对比度增强算法用于增强弱对比度文本与背景的对比度,其次通过背景估计及移除来抑制文档背景对文档二值化的干扰,最后根据边缘像素邻域灰度值的分布情况进行断笔修复,实验结果证明了本文所提二值化算法的有效性。

[1]Ostu N. A threshold selection method from Gray-Level his-

tograms[J]. IEEE Transactions on Systems Man & Cybernetics,2007,9(1):62-66.

[2]Niblack W. An introduction to digital image processing[M]. Denmark: Strandberg Publishing Company,1986.

[3]Bernsen J. Dynamic thresholding of gra-y-level images[C]. Paris:International Conference on Pattern Recognition,1986.

[4]Sauvola J, Pietikinen M. Adaptive doc-ument image binarization[J]. Pattern Recognition,2000,33(2):225-236.

[5]Tsai C M, Lee H J. Binarization of color document images via luminance and saturat-ion color features [J]. IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2002,11(4):434-51.

[6]Le T H N, Bui T D, Suen C Y. Ternary entropy-based binarization of degraded document images using morphological erators[C].Beijing: International Conference on Document Analysis and Recognition, 2011.

[7]Tabbone S, Wendling L. Binarization of color images from an adaptation of possi-bilistic C-Means algorithm[C]. Cambridge:International Conference on Pattern Recognition,2004.

[8]Hebert D, Nicolas S, Paquet T. Discrete CRF based combination framework for document image binarization[C].Washington DC: International Conference on Document Analysis and Recognition,2013.

[9]Su B, Lu S, Tan C L. Robust document image binarization technique for degraded document images[J].IEEE Transactions on Image Processing A Publication of the IEEE Signal Processing Society,2013,22(4):1408-1417.

[10] Canny J. A computational approach to edge detection[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence,1986,8(6):679-698.

[11] 靳明,宋建中. 一种自适应的图像双边滤波方法[J]. 光电工程, 2004, 31(7):65-68.

[12] 雷超阳,刘军华,张敏.一种基于自适应的新型中值滤波算法[J].计算机工程与应用,2008,44(2):60-62.

猜你喜欢

二值像素点文档
浅谈Matlab与Word文档的应用接口
有人一声不吭向你扔了个文档
支持CNN与LSTM的二值权重神经网络芯片
基于局部相似性的特征匹配筛选算法
基于二值形态学算子的轨道图像分割新算法
基于5×5邻域像素点相关性的划痕修复算法
基于canvas的前端数据加密
基于稀疏表示的二值图像超分辨率重建算法
基于曲率局部二值模式的深度图像手势特征提取
基于逐像素点深度卷积网络分割模型的上皮和间质组织分割