APP下载

基于RGB亮度分级的图像预处理研究

2013-05-31刘振华朱阳端

长沙航空职业技术学院学报 2013年2期
关键词:彩色图像亮度灰度

刘振华,胡 佳,朱阳端

(长沙航空职业技术学院,湖南 长沙 410124)

1 概述

自然场景中的文字包含了丰富的语义信息,提取和识别这些文字对于完整地理解和认知自然场景图像具有重要的意义。自然场景下的文本信息提取概括起来可以分为三个步骤:文本获取,文本定位,文本识别[1]。其中文本定位前,通常需要对源图像进行预处理,降低源图像的复杂程度。由于图像来源的多样性,图像采集、存储设备的制约和图像获取条件等诸多方面的因素,比如,文字背景千变万化,与文字特征类似的场景元素非常普遍,如树枝、门窗、栏杆等等。文字的光照、遮挡、阴影和观察角度导致的几何形变等等。文本提取算法所面对的自然图像的质量是有很大的差别的,这些差别会导致文本提取算法的适应性问题[2]。

研究发现,当图像质量较低时,单一的颜色会出现较大的扰动,增加图像的复杂程度,如图1(a)所示;但是,如果是高质量的图像,精细地再现了自然场景中的细微差别,只会导致图像更加复杂,反而不利于文本的提取,如图1(b)所示。上述两种情形都将导致同一个问题——即使是视觉上单一的颜色,实际上也是有差异的,显然文本提取之前应当消除这些差异,减少后续处理的难度。

图1 图像质量对图像复杂度的影响

基于上述原因,文本提取之前的图像预处理,并不是以提高图像质量为目的,而是以降低图像的复杂度为目的。因此,文本提取关心的是文本和非文本之间的差异,并不不在乎树叶的颜色是深一些还是浅一些。

2 数字图像的表示

一副灰度数字图像可以利用一个二维函数f(x,y)来表示,其中(x,y)表示数字图像中某一点的空间坐标,f表示该点的亮度,这样,可以得到如式(1)的数字图像函数的表示。

图2 真彩色图像的RGB空间分量

通常,在自然场景中捕获到的图像是彩色图像,本质上,彩色图像可以认为是由多幅单色的灰度图像组成的,根据组成方式的不同,就形成了不同的彩色空间,常见的彩色空间有RGB、HIS、YCb-Cr、HSV、CMYK、NTSC 等。文中采用 RGB 彩色空间,彩色图像被分成R(红)、G(绿)、B(蓝)三个单色灰度图像,每幅图像的灰度级别为256级(也可采用65536级等)[3]。习惯上把单个分量采用256级灰度的图像称为真彩色图像,这也是常用数码采集设备的输出格式。图2给出了真彩色图像的RGB空间分量示例。

3 常见的图像预处理方法

对图像进行预处理的目的是降低图像的复杂程度,消除各种干扰和过多的图像细节。常见的方法归纳起来大致有以下几种。

3.1 基于阈值的方法

这类方法通过一个亮度阈值来区分文字和非文字区域,阈值的选取通常依据亮度直方图和图像的统计信息,典型的如Ostu’s阈值分割算法,但是这类算法适用场合有限,一般要求背景十分简单,不适用于自然场景。

3.2 低通滤波的方法

源图像由于干扰和其它原因导致的颜色频繁变化和扰动在频率空间表现为高频信号,它是对图像进行低通滤波,消除图像的高频分量,使图像更平滑。这类方法适用范围很广,是经常采用的方法之一,缺点是对图像复杂程度的改善十分有限,并且还会破坏文字的边缘。

3.3 颜色聚类的方法

颜色聚类也是降低图像复杂度的方法之一,其思想是把原图像首先利用颜色聚类算法聚为一定数目,从而减少图像中的颜色成分而达到降低图像复杂度的目的,这类算法能大大降低图像的复杂性,减少了后续工作量,但由于合适的聚类数目确定比较困难,限制了它的适用范围[4]。

4 RGB亮度分级的图像预处理

自然场景下的彩色图像可以采用多种不同的色彩空间来描述,如CMYK、HLS、RGB等,事实证明,RGB色彩空间更适合表示自然场景[5]。

对自然场景下的彩色图像的R、G、B分量分别实施亮度分级合并,减少了每种颜色分量的灰度级别,从而减少了图像颜色的数量,将大致相近的颜色归并为同一种颜色,达到降低图像复杂度的目的。

通常,在自然场景下,为了吸引观察者的注意力,文字信息都具有一个共同的特点,就是比较醒目。醒目意味着文字与背景的颜色相差很大或者是与背景的对比度很大,根据RGB彩色空间的形成原理,无论是颜色的明显差异还是亮度的明显差异,都会导致R、G、B三个颜色分量中至少有一个呈现为明显的亮度差别。对R、G、B三个颜色分量实施亮度分级,本质上就是分别合并三个分量上的相近灰度,尽管这样的合并会导致大量的颜色信息损失,但是至少在一个颜色分量上保持了文字和背景的差异,从而保证了文字和背景在分级合并之后仍然在颜色上是可区分的,这意味着算法最关心的图像信息被保留下来,图像的结构没有被破坏。总的来说,该算法使得醒目的信息被保留,不够醒目的信息被消除。由于颜色大量减少,图像的复杂度显然降低了。

观察图3标准的256级、16级、8级和4级全灰度色带,容易发现,当灰度均匀地分成16个等级时,对于肉眼来说,相邻的两级之间的差异就已经不太明显,考虑到前面提到的醒目原则,8级的分级数量所体现的级间差异完全能够保持图像在文字提取算法上的结构完整性。实际上,实验表明,在分级数量为4级的时候,就能够满足大多数的文本提取场合的要求。根据RGB色彩构成原理,一幅具有65536(256*256*256)种颜色的真彩色自然场景图像,在分级数量为8级和4级的时候,颜色被精简为512(8*8*8)种和64(4*4*4)种,复杂程度大大降低。

图3 不同分级时的全灰度色带

根据上述思路,设每个颜色分量的灰度级别分为n个等级,则算法可表示如下:

式中,I(i,,j)表示原彩色图像的一个 R、G、B分量,maxG、minG分别表示 I(i,,j)的最大和最小灰度值,为分级后的图像。图4为一个亮度分级预处理示例。

图4 n=4时,亮度分级预处理效果

5 结束语

基于RGB亮度分级的图像预处理,在不破坏图像结构的前提下,减少了图像的颜色数量,降低了图像的复杂程度,与传统的图像低通滤波方法相比,准确的保留了文字的边缘,与一般的聚类方法相比,避免了依赖更多的先验知识来进行聚类数目的选择,对源图像的预处理取得了较好的效果。

[1]周慧灿,刘琼,王耀南.基于颜色散布分析的自然场景文本定位[J].计算机工程,2010,(8):197-202.

[2]史萌,陈勇,郭爱平.基于Matlab的几种常用边缘检测算子的研究[J].软件导刊,2011,(8):47-48.

[3]赵娜娜.视频图像预处理关键技术研究[D].杭州:杭州电子科技大学,2012.

[4]易剑,彭宇新,肖建国.基于颜色聚类和多帧融合的视频文字识别方法[J].软件学报,2011,22(12):2919-2933.

[5]张德丰.MATLAB数字图像处理(第2版)[M].北京:机械工业出版社,2012:224-283.

猜你喜欢

彩色图像亮度灰度
采用改进导重法的拓扑结构灰度单元过滤技术
基于FPGA的实时彩色图像边缘检测
亮度调色多面手
亮度一样吗?
基于最大加权投影求解的彩色图像灰度化对比度保留算法
基于灰度线性建模的亚像素图像抖动量计算
基于斩波调制的LED亮度控制
人生的亮度
基于颜色恒常性的彩色图像分割方法
基于Arnold变换和Lorenz混沌系统的彩色图像加密算法