一种基于交点特征的印刷体数字识别方法

2014-07-02胡钊政白建川

电视技术 2014年13期

关键词：印刷体特征向量交点

戴静，胡钊政，白建川

(河北工业大学信息工程学院，天津300401)

一种基于交点特征的印刷体数字识别方法

戴静，胡钊政，白建川

(河北工业大学信息工程学院，天津300401)

为了进一步提高印刷体的数字识别准确率，提出了一种基于交点特征和径向基函数神经网络的数字识别方法。首先利用交点特征对数字进行特征提取，即提取某一数字的划水平线得到的交点数作为水平特征分量，提取划垂直线得到的交点数作为垂直特征分量，将水平特征向量与垂直特征向量组合成数字的交点特征向量;然后利用径向基函数神经网络学习不同模式类别中的学习样本，学习过程完成后，利用此网络对样本进行识别。实验结果表明，该数字识别方法在印刷体数字识别中正确率可达到100%，处理效果良好。

印刷体数字识别;交点特征;径向基函数神经网络

模式识别是对表征事物的各种形式的信息进行分析和处理，以对事物进行描述、辨认、分类的过程［1］。印刷体数字识别是模式识别的一个分支，是指对0～9这10个印刷体数字进行识别的过程，它在信息处理、机器翻译、身份证识别、车牌识别等高技术领域有着广阔的应用前景。在实际应用的过程中，对印刷体数字的单字识别正确率的要求很高。此外，在对大批量数据进行识别处理时，还必须要考虑到对系统速度的要求［2］。因此，研究低错误率、高性能的数字识别算法是一个很有实际意义的研究任务。

传统的印刷体数字识别方法存在识别正确率低、识别速度慢等缺点，因为传统的特征提取方法需要对数字所包含的线段、弧、锐角、圈等进行大量的形状分析与笔画拟合，系统运行效率与准确率低［3］。由于印刷体数字具有结构简单、字符集小等特点，为此本文提出基于交点特征的特征提取方法——仅对待识别的对象进行水平与垂直方向的若干次切分即可，快速且准确。另外，径向基函数(Radial Basis Function，RBF)神经网络具有学习速度快且能避免局部极小问题等优点［4］，本文则采用RBF神经网络来对数字进行训练与识别。

1 数字识别理论基础

一个完整的数字识别系统分为原始数字图像采集、预处理、特征提取、模式识别与结果输出5个模块［5］，如图1所示。

图1 数字识别过程模型

本课题研究对印刷体数字的识别，图像采集的过程中所采集的数字图片、位置、字体、颜色有所不同。

通过对图像进行灰度化、二值化、边缘检测、归一化等预处理过程，为接下来的特征提取做了充足的准备。

2 基于交点特征的特征提取方法

模式识别是使用特征来区分不同类别［6］，为了能有效地实现分类识别，就要对原始数据进行变换，得到最能反映分类本质的特征［7］。对于数字的特征提取应既突出每个数字的形状特点，又减少冗余信息量［8］。

对此，本文提出了一种新的特征提取方法——基于交点的特征提取方法，其中交点特征包括划水平线得到的交点数和划垂直线得到的交点数特征。采用此方法特征向量便于提取，算法比较简便，运算速度较快。

该提取方法的具体步骤如下:

步骤1，读取经过预处理的图像文件的高度h和宽度w。

步骤2，定义一维数组水平特征分量hsum［10］、垂直特征分量wsum［10］、交点特征向量sum［20］并初始化。

步骤3，从上到下对数字进行逐行扫描，将水平扫描线切分黑像素区域形成的发生像素从0～1或者从1～0改变的交点个数保存在数组hsum［10］中。

步骤4，从左到右对数字进行逐列扫描，将垂直扫描线切分黑像素区域形成的发生像素从0～1或者从1～0改变的交点个数保存在数组wsum［10］中。

步骤5，将水平方向提取的特征分量hsum［10］和垂直方向提取的特征分量wsum［10］合成数字的交点特征向量sum［20］。

经过以上步骤形成的交点特征向量sum［20］即为将要作为神经网络输入的数字的特征向量。

例如对数字“0”的特征提取，其水平交点特征如图2所示，垂直交点特征如图3所示。通过求单个水平方向或垂直方向上的过线交点数，很难区分开数字。因为在不同类型的印刷体数字中单一方向的交点数有可能相等，因此需要将其两个特征结合起来使用，这样可以较好地识别数字。对于数字“0”的提取特征示意图如图4所示。

图2 水平交点特征图

图3 垂直交点特征图

图4 数字“0”特征提取示意图

此特征的提取方法为:用MATLAB编程使得10条水平线和10条垂直线分别均匀穿过数字图像，求得水平方向和垂直方向的分割线和数字交点的个数，所求得的20个交点个数即为反映数字特征的特征向量。数字“0”的特征向量如图5所示。

图5 数字“0”的特征向量

为了体现出对于不同数字所提取出来的特征向量各有不同，下面将对数字“1”进行特征提取的详细过程列出，如图6所示。

图6 数字“1”的特征提取过程

对数字“1”进行特征提取后，所得的特征向量如图7所示。

图7 数字“1”的特征向量

对比图5和图7可知，对于不同数字以相同的方法进行特征提取后，所得的特征向量不同，而对于同一个数字进行特性提取后，所得的特征向量是相同的或极其相似的，则通过此种特征向量的提取方法可以很好地将数字0～9区分开来。

对于训练样本的其中一组图片0～9进行特征提取后，提取的特征向量如表1所示。

表1 不同数字的特征向量表示

3 基于RBF神经网络的数字识别

RBF网络是一种三层前馈神经网络。第一层为输入层，它由信号源节点组成，用来连接网络与外界环境;第二层为隐含层，隐单元的变换函数是对中心点径向对称非负非线性的衰减函数;第三层为输出层，网络的输出是隐单元输出的线性加权［9］。从输入空间到隐含层空间的变换是非线性的，从隐含层空间到输出层空间的变换是线性的［10］。图8为RBF神经网络的拓扑结构图，它具有n个输入结点、h个隐层结点、m个输出结点。

图8 RBF神经网络拓扑结构图

本文所使用的网络是20个输入、10个输出，则输入模式记为X，X=［x1，x2，…，x20］T，输出模式记为Y，Y=［y0，y1，…，y9］T，本文取径向基函数为Gauss函数，则隐单元输出为

式中:φj(x)为隐含层第j个神经元的输出值;cj为隐含层第j个神经元的中心;δj为隐含层第j个神经元的半径;‖x－cj‖为欧氏范数。

输出层神经元的输入输出关系表达式为

式中:yk为输出层第j个神经元的输出值;Wkj为输出层第k个神经元与隐含层第j个神经元之间的权值。

由于对于数字识别问题可以预先知道期望输出值的所有情况，故可利用提取的特征向量数据和期望输出数据组成样本空间，网络的输入是一个20×1的列向量，对应的期望输出是一个10×1的列向量。对网络进行训练后能够得出合适的网络权值，然后将实际检测的用于识别的数字特征向量输入训练好的RBF网络进行识别，得出识别结果。

4 识别结果

学习样本个数定为200，每个数字选取1 000个样本进行测试，比较不同的特征向量维数对识别结果的影响如表2所示。

表2 不同的特征向量维数对识别结果的影响 %

由表2知，当选取数字的特征向量维数增多时，识别结果的正确率增高了。实际测试过程中发现若特征向量维数过高，会增加机器开销，降低运算速度。测试结果表明，当特征向量维数选定为20，学习样本个数选定为200时，识别速度较快，对1 000×10个样本进行测试，对于大多数数字的识别准确率可以达到100%。对于数字“4”和“9”的识别率有待提高。

5 结束语

随着信息化技术的不断发展，数字识别技术也得到了很大的提高。本文所提出的基于交点特征和径向基函数神经网络的印刷体数字识别方法有着较高的识别率，较短的识别时间，能够对数字进行正确高效的识别。

［1］陈展东，白宝兴，韩成，等.数字识别算法研究［J］.长春理工大学学报，2010，33(1):147-151.

［2］杨志华.利用Radon变换实现手写数字识别的新方法［J］.计算机工程与应用，2008，44(30):13-15.

［3］孔月萍，曾平，李智杰，等.基于组合特征的高效数字识别算法［J］.计算机应用研究，2006(10):172-173.

［4］GONZALEZ-CAMACHO J，CAMPOS G，PEREZ P.Genome-enabled prediction of genetic values using radial basis function neural networks［J］.Theoretical and Applied Genetics，2012，125(4):759-771.

［5］张阳.基于DSP的人民币序列号识别系统的研究［J］.电视技术，2012，36(15):140-143.

［6］夏国恩，金炜东，张葛祥.基于组合特征的手写体数字识别方法［J］.计算机应用研究，2006(6):170-172.

［7］双小川，张克.基于统计和结构特征的手写数字识别研究［J］.计算机工程与设计，2012，33(4):1533-1537.

［8］闫雅楠，夏定元.结合边缘检测和区域分割的形状特征提取［J］.电视技术，2007，31(3):12-15.

［9］LINA J，CHENB B，SZEA K.A new radial basis function for helmholtz problems［J］.Engineering Analysis with Boundary Elements，2012，36 (12):1923-1930.

［10］王晔，吴小俊，王士同，等.基于改进人工鱼群算法的RBF网络及其在人脸表情识别中的应用［J］.计算机应用研究，2008，25(9): 2643-2646.

Approach to Printed Digital Recognition w ith Intersection Features

DAIJing，HU Zhaozheng，BAIJianchuan
(School of Information Engineering，Hebei University of Technology，Tianjin 300401，China)

In order to further improve the accuracy rate of printed digital recognition，a new digital recognition approach which combined intersection features and Radial Basis Function(RBF)neuralnetwork is proposed.Firstly，the intersection features ofnumbers are extracted.Namely，the numbers of the intersection points of the number with some dividing lines in horizontal direction are extracted as the horizontal features and the numbers of the intersection points of the number with some dividing lines in vertical direction are extracted as the vertical features.And all of the horizontal features and the vertical features of the number are combined as the intersection features.Secondly，the samples in differentmodesare trained in the RBF neuralnetwork. After training，the samples are recognized in the RBF neural network.The results of experiment show that the recognition rate of printed numbers can achieve 100%.The treatment effect of this approach is good.

printed digital recognition;intersection features;RBF neural network

TN391.4

戴静(1988—)，女，主研电子与通信技术;

�� 雯

2013－08－18

【本文献信息】戴静，胡钊政，白建川.一种基于交点特征的印刷体数字识别方法［J］.电视技术，2014，38(13).

国家自然科学基金项目(60972106;51208168);天津市自然科学基金项目(11JCYBJC00900;13JCYBJC37700);河北省自然科学基金项目(F2013202254;F2013202102);河北省引进留学人员基金项目(C2012003038)

胡钊政，教授，博士生导师，主研电子与通信技术;

白建川，博士生，主研智能信息处理。