APP下载

手写数字识别研究

2017-07-18杨美程

无线互联科技 2017年11期
关键词:结构特征手写端点

王 群,杨美程

(郑州大学物理工程学院,河南 郑州 450001)

手写数字识别研究

王 群,杨美程

(郑州大学物理工程学院,河南 郑州 450001)

图像中手写数字的识别一直被人研究探索,目前国内外提出的识别方法大致分为两种:基于BP神经网络统计特征识别算法、基于几何形体结构特征识别算法。文章在前人探索的形体结构特征算法基础上进行改进优化,利用孔洞、端点、交叉点等特征进行识别外,同时发现新的特征、新的方法:离心率、行列扫描区域数量、区域骨架搜索。组合这些形体特征和方法,可完成手写数字的识别。实验证明手写数字识别在识别准确率上优于先前传统形体结构特征方法。

手写数字识别;形体结构特征;离心率;行列扫描区域数量;区域骨架搜索

目前,手写数字有两种经典方法:基于BP神经网络统计特征识别算法和基于几何形体结构特征识别算法,其中神经网络算法优点在于通过大量统计训练,可以实现较高识别率,但它对特征向量的选取有较高要求,需要大量样本,仍存在如何提高学习效率、算法收敛性的问题。第二种形体结构特征算法中,是通过图像中的数字具有的一些结构特征进行分类区分。但由于手写数字的随意性,有些数字并不存在这些特征,造成误识,所以在前人探索的形体结构算法上,扩充了数字的形体结构特征和方法进行组合,实现手写数字的识别。本文将以样本—试卷中的学号为例主要分析数字识别方法。

1 主要内容

1.1 获取学号图像

用摄像头对学号区域内的手写体数字进行扫描采集,此过程中会受外界因素的影响,增加了识别的难度,为了解决这些问题,需要 对图像进行预处理,方便数字的识别。

1.2 图像预处理

预处理包括灰度化、二值化、 膨胀细化、分割裁剪等操作,将图像带来的外无干扰排除,得到清晰图像。

彩色图像使用:RGB=B×0.114+G×0.587+R×0.299公式进行灰度化处理;对于试卷学号这种背景色比较单一的图像采用全局阈值二值化处理效果比较好,速度快,噪声小;由于算法会使用数字骨架特征,对膨胀细化要求较高。主要的步骤包括:首先将图像进行使用圆形结构元素的膨胀,使边界更圆滑,减少多余分支。然后用过函数bwmorph进行细化,参数选择为‘thin’和n=‘Inf’;对于数字分割,本文采用的方法为垂直投影法,利用每个数字之前存在空白间隙灰度值之和为0,将数字分割;图片裁剪同样采用垂直和水平投影法,找出每个数字的上下左右界限,进行裁剪。

1.3 数字识别

分割并裁剪了数字之后进行识别工作,提取的结构特征均在下面所述的过程中介绍:

新方法一:行列扫描区域数量,在工具MATLAB中的bwboundaries函数能够提取区域边界,扫描行列区域(在8连接边界下,相互连接的一组像素)数量,函数目的如图1所示,同时此函数还可以搜索孔洞及孔洞的数量和位置。

有孔洞的数字可能为0,2,3,4,6,8,9,一般数字8孔洞数为2;因为每张图片均是沿数字边界裁剪,所以数字0的孔洞在上下边界均有像素;部分数字2、部分数字8、数字6的孔洞只在下边界有像素,如图2所示,3个数字再通过端点特征进行区分。

将图像分成4宫格区域,如图3所示,在区域4里存在端点的数字只可能是数字2;数字6在1或2区域只能存在一个端点;数字8在1或2区域则会有两个端点。

部分数字2,3,4的孔洞在中间部分,如图4中(1)—(3)所示。

图1 函数目的

图2 下边界有像素的数字

图3 4宫格区域

图4 部分数字2,3,4的孔洞在中间部分

图5 数字4的4交叉点结构形成的模板

首先通过bwboundaries函数找到孔洞右边界,对右边界右侧进行垂直投影法,灰度值之和为0即为数字4;剩余数字2,3通过端点位置区分,若4区域存在端点则为数字2;若端点均在2,3区域则为数字3。

对于图4(4)—(9)的数字通过端点数、交叉点模板和行列存在区域数量进行区分。

首先,数字4有4交叉点结构,经大量数据的证明,得到上面图5模板,如图6所示,如果匹配到图5中(1)—(7)任意两个模板或图5中(8)—(12)其中一个模板,即可识别;像弧度较大的数字4,如图6(图4细化而来)所示。图6中(6)—(7)则无这些结构,只需和图6中的(9)区分,通过对整体图像进行孔洞上下边界范围内的行扫描,数字4最多存在3个区域,而数字9最多存在两个区域。以上为有孔洞的数字分析过程,以下分析无孔洞数字。

图6

图7

部分数字4,5存在4个端点,如图7所示,部分数字5可能有4交叉点存在的部分模板(圆圈标出),因此利用列区域数量进行区分:从右侧开始进行列扫描,数字5最多存在3个区域,数字4一般只会存在一个区域,极限会出现两个。

新方法二:区域骨架搜索,在行列扫描下得到所有区域,以区域为起点中心,开始时为定向骨架搜索,随后在九宫格中存在连接点则继续搜索,直到与其他区域重合或搜索到尽头(端点),以图8体现其过程。

图8 区域重合或搜索到端点

图9 数字2,3,5未裁剪

数字2,3,5,如图9(未裁剪),通过端点位置、行列扫描法和区域骨架搜索进行区分:将图分成1,2,3,4区域,只有数字2[(除图9(2)]的端点会出现在4区域;数字3的端点均在2或3区域;数字5和极少部分数字2(图9(2))的端点会出现在1区域:首先从右侧开始进行列扫描,直到搜索到3个区域,然后区域骨架搜索:数字2最下面的区域向右进行搜索时可以搜索到尽头(端点),数字5则相反。

新方法三:离心率,指圆锥曲线上的一点到平面内一定点的距离与到不过此点的一定直线的距离之比,图像越扁长,离心率越大。

经过大量数据得出:数字1,7离心率均大于0.970 0,并且当离心率大于0.997 0时必为数字1;通过求3/4图像上半部分的离心率和灰度值之和区分数字1,7,当离心率大于0.960 0且灰度值之和等于其高度时则为数字1;否则为数字7。对于图9(7)—(8)的数字9同样无孔洞,取1/2图像下半部分求离心率,当离心率大于0.970 0时则为数字9。

2 实验结果

综上,文章通过孔洞、端点、交叉点、离心率、行列扫描区域数量、区域骨架搜索等特征和方法进行组合设计一套算法。在针对本方法的功能测试试验中,笔者选取了500个人手写学号作为样本进行试验。其中,数字拒识率为4%,原因是数字粘连问题。排除后识别率均达到了99.167%以上。采用传统组合形体结构算法方法对其进行识别时,对于像图4(7)—(9)和横线有斜度的数字等均会误识;采用拓扑特征构造算法时对于本文所示数字2,3,4,8等数字也会误识;通过统计或轮廓进行神经网络训练深度学习的方法对其进行识别时,在经过大量样本和时间训练后,所有数字能达到99.3%以上的识别率。

3 结语

本文既有前人好方法的继承,也有自己的一些想法和创新,能够很好弥补传统方法的不足。现在唯一的缺点就是不能分割识别粘连的数字,需要再进行研究探索。

[1]冈萨雷斯,理查德.国外电子与通信教材系列:数字图象处理(MATLAB版)[M].2版.阮秋琦,译.北京:电子工业出版社,2014.

[2]郝梦琳.手写体数字识别方法的研究与实现[D].太原:太原科技大学,2013.

[3]陈军胜.组合结构特征的自由手写体数字识别算法研究[J].计算机工程与应用,2013(9):179-184.

[5]梁淑芬.基于深度学习的数字识别模块在安卓系统的实现[J].五邑大学学报(自然科学版),2017(1):40-45.

Research on handwritten numeral recognition

Wang Qun,Yang Meicheng
(Physics and Engineering School of Zhengzhou University, Zhengzhou 450001, China)

Handwritten recognition in digital images has been studied at home and abroad, recognition methods proposed can be divided into two types:one is statistical feature recognition algorithm based on BP neural network, the other is structural feature recognition algorithm based on geometric structure. This paper improves and optimizes the algorithm based on the structure and feature of the previous researchers, takes advantage of holes, endpoint, cross point feature and discover new features and new method, such as eccentricity, the number of row scanning region and region skeleton search. The combination of these form characteristics and methods is able to complete handwritten numeral recognition. The experimental results show that the recognition accuracy of handwritten numeral recognition is better than that of the traditional form structure feature method.

handwritten numeral recognition; form structural feature; eccentricity; number of row scanning region; region skeleton search

郑州大学大学生创新创业训练计划资助项目(国家级项目);项目名称:基于机器视觉的试卷统分登分及成绩分析系统;项目编号:201610459047 。

王群(1995— ),男,河北唐山。

猜你喜欢

结构特征手写端点
非特征端点条件下PM函数的迭代根
抓住身边事吾手写吾心
基于集成学习的MINIST手写数字识别
参数型Marcinkiewicz积分算子及其交换子的加权端点估计
结构特征的交互作用对注塑齿轮翘曲变形的影响
特殊环境下双驼峰的肺组织结构特征
深度学习在手写汉字识别中的应用综述
基丁能虽匹配延拓法LMD端点效应处理
2012年冬季南海西北部营养盐分布及结构特征
C-PRrpp半群的结构特征