APP下载

基于MATLAB的图片中字符的分割与识别

2016-10-14张雯李浩进

科学与财富 2016年28期
关键词:字符识别

张雯+李浩进

摘 要:本文主要介绍字符识别的基本原理,并且利用MATLAB工具软件实现图片中字符的分割和识别,对于满足一定要求的图片可以实现字符的分割与识别 ,通过图像读取,图像预处理,图像投影,字符分割,字符识别五个步骤实现.

关键词:图像预处理;字符分割;字符识别

Abstract:this paper mainly introduces the basic principle of character recognition, and using MATLAB tool software to realize the image segmentation and recognition of the characters, pictures to meet certain requirements to achieve character segmentation and recognition, image reading, image preprocessing, image projection, character segmentation and character recognition five steps.

Keywords:Image preprocessing;Character segmentation;Character recognition

0.引言

近年来,字符分割和识别的技术发展,其中最广泛的应用是停车场出入口车辆牌照的识别结合计算系统自动确定车辆在停车场中停留的时间,付费金额.大大提高了停车场的运行效率和信息的准确性.以及在公路上实现取证拍照,监控道路违规行为,已经发展成为智能交通中不可或缺的一部分, 通过引入数字摄像技术和计算机信息管理技术,采用先进的图像处理 模式识别和人工智能技术,通过对图像的采集和处理,获得更多的信息,从而达到更高的智能化管理程度。

1.字符识别原理

目前用于字符识别(OCR)中的算法主要有基于模板匹配的OCR算法以及基于人工神经网络的OCR算法。

1.1 基于模板匹配的OCR的基本过程是:首先对待识别字符进行二值化并将其尺寸大小缩放为字符数据库中模板的大小,然后与字符库中的所有的模板进行匹配,选最佳匹配作为识别结果。

1.2用人工神经网络进行字符识别主要有两种方法:一种方法是先对待识别字符进行特征提取,然后用所获得的特征来训练神经网络分类器。识别效果与字符特征的提取有关,而字符特征提取往往比较耗时。字符特征的提取主要方法是充分利用神经网络的特点,直接把待处理图像输入网络,由网络自动实现特征提取直至识别。本文主要研究基于模版匹 配的字符识别技术。

2.字符识别流程

2.1图像预处理

在读取到图像后进行灰度化,二值化,对比度增强,腐蚀,膨胀,滤波等处理增强图象。

2.2字符分割和识别

由于灰度图像只有0和1两种取值,先进行像素点的差分运算,寻找突变位置,截取第一行字符,再截取后面各行字符拼接到第一行字符上,横向连接图像块,以第一行字符为基准,对其余的字符进行归一化大小,进而和字符模版库中的字符大小相匹配。

3.效果图

4.结语

利用MATLAB软件,对图片中文字进行识别,为了提升检测结果的准确率,通过大量的数据进行试验,并且对出现的错误检测分析图片中字符的结构,进行代码优化,单一背景的图片背景的处理过程简单,仅仅需要图片灰度化处理,二值化处理,然后进行水平方向上整行文字的分割,再进行垂直方向上的分割,特殊字体上下结构,左右结构,左中右结构,上 中下结构如“非”,“船”,“品”通过正向延拓寻找小于 3 的点,再反向延拓寻找小于 3 的点,可以实现该类字体的切割。但是没有加入对斜体字的矫正,因此对于该类字体的检测结果错误率比较高。

参考文献

[1]朱小燕,史一凡,马少平.手写体字符识别研究[J].模式识别与人工智能.2000.

[2]张圻中.汉字识别技术[M].北京:清华大学出版社,1992.

[3]王 勇,吴立德.图像恢复和边缘提取的后验均值方法.电子学报,1994,22(2):70-75.

[4]阮秋琦.数字图像处理学.北京:电子工业出版社,2001.317-320.

[5]T, Kasar, Font and Background Color Independent Text Binarization. ICDAR 2005.

猜你喜欢

字符识别
一种改进深度学习网络结构的英文字符识别
车牌识别系统的设计与实现
基于深度学习法的视频文本区域定位与区别
融合字符及字符排列特征的铭牌识别方法
一种基于OpenCV的车牌识别方法
仪表字符识别中的图像处理算法研究
一种实用的金融票据框线去除算法
纸币冠字号提取的方法研究
基于CUDA和深度置信网络的手写字符识别
机加工件点阵字符识别研究