APP下载

基于Gabor变换的中文字符特征提取方法研究

2012-07-13毅,莺,锴,

电子设计工程 2012年15期
关键词:字符识别字符特征提取

罗 毅, 李 莺, 王 锴, 李 斌

(1.四川理工学院 自动化与电子信息学院,四川 自贡 643000;2.四川理工学院 计算机学院,四川 自贡 643000)

字符识别是模式识别技术的一个重要研究方向,属于图像模式识别的范畴。目前,随着计算技术的不断发展,越来越多的信息都要实现数字化存储与处理,尤其是海量的、具有重要价值的文字信息都要利用现有的技术手段实现数字化存储,才能够不断的传承下去,同时随着节能环保理念的不断的深入人心和推进,也要求各种文档要由纸质向电子文档转变,这些过程中都不可避免的要利用到字符识别技术,尤其是字符的结构复杂,相似字符众多的中文字符的识别,本文的研究的对象就是中文字符的识别问题。

中文字符识别的一个难题就是对于复杂结构的汉字的特征的提取,由于汉字的结构复杂,字体众多,如何选择合适的特征映射来描述一个汉字能够直接决定最终汉字识别的结果,目前常用的特征提取方法有统计特征提取、结构(句法)特征提取[1-2]和基于神经网络的方法[3]。统计特征方法由于是对字符图像的每一个点进行统计形成一定的统计特征,所以也就决定了它对于图像中的噪声不敏感,但是对字符的细节区分性较差;结构特征提取的方法能够对形近汉字较好的区分,但是对字符图像的噪声非常敏感,影响识别结果;近年来新兴的人工神经网络理论具有一定的并行处理和自学习能力,但是在学习过程中容易陷入局部最小值,也就是泛化能力非常差的情况,所以上述的字符特征提取方法都存在一些急需解决的问题。笔者在研究现有的中文字符特征提取方法基础上,提出了一种基于Gabor变换的特征提取方法,利用Gabor变换对图像的纹理方向敏感性获取汉字笔画方向特征,实验结果表明这种特征提取方法能够较好的获取中文字符的特征,对识别系统具有较好的支持作用。

1 Gabor变换理论和2D-Gabor滤波器

1.1 Gabor变换理论

Gabor变换是Gabor在1946年的论文”Theory of communication”中提出的以一个高斯函数为平移窗口做短时傅立叶变换的方法,作为时-频域分析的工具后人命名为Gabor变换[4-5]。Gabor变换就是通过信号进行加窗函数Fourier变换来实现将非平稳的信号分解成一系列的短时间内平稳的信号组合,定义如下:

式中的ga(t)是用于对信号进行窗口操作的窗口函数,一般选用高斯函数,因为高斯函数和其傅立叶变换都是高斯函数的形式,也就能够实现时域和频域的局部化分析。常数b确定窗函数的中心位置,a的大小决定窗函数的宽度。a选较小的数值,也就是高斯函数的方差很大,其窗口也就越窄,在时间域的划分就越细致,时域分辨率也就越高,但频域的分辨率就会降低。如果a的值越大,则其窗口也就越宽,时域分辨率低,而频域分辨率高。

1.2 2D-Gabor滤波器

将Gabor变换应用到图像的特征提取就是设计相应的Gabor滤波器对需要提取特征的图像进行滤波处理,这是因为由上面的(1)式可以看出Gabor变换就是利用一定的Gabor核函数与信号进行时域的卷积运算,也就是频域的相乘,所以利用一个Gabor滤波器对图像进行滤波操作就能够计算相应的Gabor特征向量[6]。

2D-Gabor滤波器是一种方向滤波器,对于图像中的方向纹理具有很好的检测效果,本文中采用二维高斯变换调制的一个复正弦波作为Gabor核函数,其形式如下所示。

对Gabor核函数的傅立叶变换,如式(4)。

式中 σu=πσx/2,σv=πσy/2,σx和 σy是 gabor核函数在两个空间维度x、y方向上的标准差,决定着窗函数的窗口宽度,也就是对图像的观察尺度,尺度越大,频域中局部分辨率也就越低,反之越高;θ是窗口函数的方向角,一般取0~180°,对不同方向的纹理特征进行观察。

2 Gabor特征提取

2.1 字符图像预处理

首先,将获取的灰度字体图像进行二值化处理。利用一定的阈值分割的算法确定灰度阈值T,对图像中的每一个像素点进行灰度值判决,大于阈值T的设置为255,反之,小于阈值T的设置为0,从而实现字符图像分黑白二值化处理。

其次,对二值化处理得到的字符图像进行归一化处理。归一化处理是为了对字符图像的尺寸进行统一,使得提取的特征能有相同的维数。一般采用双线性插值的方式进行缩放,实现归一化。

2.2 Gabor特征提取

对一幅输入的图像提取Gabor特征就是对图像使用以(0,0)为中心的Gabor滤波器进行滤波,滤波响应即为输入图像的 Gabor特征。 如果 Gabor滤波器的时域表示为 g(x,y,σx,σy,f,θ),图像的表示为 I(x,y),那么图像的 Gabor特征也就可以表示为图像和Gabor滤波器的卷积,即:

Gabor滤波响应其实是一个复数,包含了实、虚两部分,实部偏重于图像的内部纹理特征,虚部重点突出图像的边缘信息。文中的汉字识别以G(x,y)的幅值做为特征,选取 σx=σy=2,f=4,0°、45°、90°、135°4 个方向对字符图像进行特征提取,下面是“社”、“会”两字的2个方向的Gabor变换示意。

图1 Gabor特征示意Fig.1 Example of gabor feature

根据上图可以发现0°的Gabor特征是获取字体的竖直方向的笔画,45°是获取笔画中和“丿”近似方向的笔画,90°是获取横向的笔画,135°获取的是汉字的 “”近似方向的笔画特征。对于16×16大小的字符图像,获取了256维的4个方向的一共4组Gabor特征做为字符识别分类器的输入,实现字符的识别。

3 实验结果及分析

本文为了对比利用Gabor滤波器获取的字符特征与传统的统计结构特征与结构特征对字符识别系统识别率的影响,选取了100个常用汉字的3种字体(宋体、黑体、楷体)作为样本,其中80个汉字的不同字体作为分类器的训练样本,20个汉字作为测试集,分别利用Gabor滤波的方式和黑像素统计特征以及对字符的不同方向贯穿交点次数特征作为分类器的输入,得到各自的识别率,各自的识别结果如表1所示。

表1 不同特征提取方法的识别率Tab.1 Recognition rate based on dfferent

实验结果表明在同样的分类器条件下,Gabor特征提取方式具有更高的识别率。

4 结束语

根据人类的视觉特征,结合中文字符中笔画具有不同的方向特征,本文提出了一种基于Gabor滤波器的汉字特征提取方法,与传统的汉字特征提取方法相比具有较高的识别率。当然,如果Gabor核函数选择得更佳,效果会更好。

[1]赵继印,郑蕊蕊,吴宝春,等.脱机手写体汉字识别综述[J].电子学报,2010(2):405-415.

ZHAO Ji-yin,ZHENG Rui-rui,WU Bao-chu,et al.A review of off-line handwritten chinese character recognition[J].Acta Electronica Sinica,2010(2):405-415.

[2]涂岩恺,陈庆虎,黄亮.手写汉字识别的伪二维弹性网格方法[J].华中科技大学学报:自然科学版,2010,38(11):37-40.

TU Yan-kai,CHEN Qing-hu,HUANG Liang.Pseudo twodimension elastic mesh method for recognizing Chinese characters written by hand[J].J.Huazhong Univ.of Sci.&Tech:Natural Science Edition,2010,38(11):37-40.

[3]居琰,汪同庆,彭建,等.特征融合用于手写体汉字识别研究[J].电子科技大学学报,2007,31(3):229-233.

JU Yan,WANG Tong-qing,PENG Jian,et al.Research onhandwritten chinese characterrecognition using feature fusion andmodular RBF classifier[J].Journal of UEST of China,2007,31(3):229-233.

[4]冉启文.小波变换与分数傅立叶变换理论及应用[M].哈尔滨:哈尔滨工业出版社,2001.

[5]王林.基于Gabor变换的木材表面缺陷识别方法的研究[D].哈尔滨:东北林业大学,2010.

[6]康俊芳.基于Gabor变换的图像特征提取方法研究[D].昆明:云南大学,2010.

猜你喜欢

字符识别字符特征提取
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
基于Gazebo仿真环境的ORB特征提取与比对的研究
HBM电子称与西门子S7-200系列PLC自由口通讯
基于Daubechies(dbN)的飞行器音频特征提取
一种改进深度学习网络结构的英文字符识别
Bagging RCSP脑电特征提取算法
仪表字符识别中的图像处理算法研究
基于CUDA和深度置信网络的手写字符识别