APP下载

用于动车组故障检测的车号识别算法

2016-02-17

铁路计算机应用 2016年5期
关键词:车号字符动车组

方 凯

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

用于动车组故障检测的车号识别算法

方 凯

(中国铁道科学研究院 电子计算技术研究所,北京 100081)

列车车号是其身份的唯一标识,动车组运行故障动态图像检测系统(TEDS)根据列车车号在图像库中找寻该列车拍摄的历史图像,以其比对现场采集图像,从而实现对运行列车状态的实时监测。然而动车组目前尚未安装射频识别电子标签,鉴于此,利用视频分析技术对动车组车号图像进行自动识别成为亟需解决的问题。文章提出一种基于语义共生概率的模板匹配算法对车号字符进行识别。实验结果表明,本算法对车号的识别正确率和有效性满足铁路总公司的相关要求,保障了TEDS的工作效果。

动车组运行故障动态图像检测系统;车牌定位分割;模板匹配;车号识别

高速铁路已成为当今旅客出行的重要交通工具,如何实时监测高速铁路动车组的运行安全显得尤为重要。现有的监控方式为入库地沟式静态监控,缺乏运行过程中的动态监控,这将导致动车组可能长距离带病行进,从而增加事故发生的概率。高速行进中的动车,其关键部件易受到石块等异物的强力撞击,加之由于长期承受传动力及制动力,其螺栓可能发生不同程度的松动,因此行进中的动态监控对于保障动车运营安全起到至关重要的作用。鉴于此,铁路部门提出了动车组运行故障动态图像检测系统(TEDS,Trouble of moving EMU Detection System)[1~3]。该系统需要通过车辆的车号标识和索引,在列车图像库中找寻其历史图像,实现图像异常分析和预警。然而,目前动车组并未安装射频识别电子标签,很难自动依据列车车号寻找其相应的历史列车图像。鉴于此,利用视频分析技术对动车组车号图像进行动识别成为亟需解决的问题。

1 车号识别算法

本文提出一种用于动车组故障检测的车号识别算法,其车号识别流程如图1所示,步骤是:(1)自适应综合列车车号图像的灰度水平差分值和灰度垂直差分值,定位分割图像中的列车车号区域;(2)对该区域进行Hough变换,得到其倾斜角度并进行相应的水平校正;(3)结合特定领域知识,采用一种基于语义共生概率的模板匹配算法对车号字符进行识别。鉴于车号作为车辆唯一标识的特性,通过识别得到的车号信息在动车图像库中找寻其历史图像,与现场采集的列车图像进行故障比对,实现列车运行状态的实时监测和自动报警。

图1 动车组车号识别流程

1.1 车号定位分割

车号区域的准确定位是车号字符识别的前提条件。本文基于灰度图像水平差分和垂直差分图像的相关特点,从列车图像中进行车号区域的定位和分割。

(1)对图像进行预处理,采用中值滤波剔除其中的噪声点,并结合直方图均衡化对其进行颜色均衡;(2)采用自适应阈值法二值化图像,提取其灰度水平差分和垂直差分;(3)根据水平方向的灰度差分直方图粗定位车号字符区域;(4)利用垂直差分图像,投影映射的相关特征对车号候选区域进行精细定位,从而得到准确的车号水平和垂直范围。

车号图像中,字符区域与无字符区域的灰度特征存在相对较大的差值,而且车号图像区域较之其他区域具有更丰富的边缘特征。为此,对列车车号灰度图像进行水平差分累加运算,以突出边缘信息:

其中,f(x,y) 为图像灰度值,HD(x,y) 表示差分累加结果,x、y 分别为图像横、纵坐标值,d 为偏移量。

将累加得到的差分图像进行二值化处理,可以得到边缘图像,具体方法如下:

其中,T为图像二值化的阈值。

以动车组车号图像CRH380E 为例,图2 显示了车号图像的二值化处理流程,以及腐蚀操作后的图像。

图2 动车组车号定位图像处理流程

1.2 车号倾斜校正

基于已经定位的车号字符区域,进行Hough变换,得到图像中的两条平行线,计算平行线的斜率;根据所得斜率确定水平倾斜角度,进行上下边界的水平校正,如图3所示。

图3 动车组车号倾斜校正处理流程

Hough变换旨在将图像空间映射到变换后的参数空间中。如图像空间中的一条直线,在Hough变换后的二维图像空间里表示为:x·cosθ+y·sinθ=ρ,其中,ρ 和θ(0<θ<2π)为参数,即一条处于图像空间中的直线被映射到参数空间中的一点(ρ,θ)。基于这一点,将直线的检测问题转换为参数空间寻找局部最大值的问题。一般车号的水平倾斜角度不会超过一个范围(±25。),这样可以缩短Hough变换的计算时间,也在一定上程度了提高了校正的准确性。

1.3 车号字符识别

1.3.1 车号字符分割

我们将图像的各列像素数据进行叠加得到水平方向上的投影,将图像各行的像素进行叠加,得到竖直方向上的投影,如图4所示。从图中可以看出,水平方向上,车号区域的投影呈现出“波峰-波谷”多次交替现象,此外,与波峰各不相同的特征对比,各个波谷所处的位置大体一致。这在实际情况下也不难解释:车号的字符有各种变化,从而使得各个峰值的变换各异;而字符中间的空白区域却全是背景(除非存在污渍),因此其水平投影的位置基本保持一致。同理可见,竖直投影也会呈现出相似的特征。由此可知,依据车号区域的水平投影和竖直投影可以很好地将车号字符进行分割。

图4 图像在水平方向上的投影

1.3.2 车号字符识别

对于车号数据,相邻车号字符之间存在很强的上下文语义相关性[4~6]。传统的模板匹配算法[4]仅考虑了特征域中模板图像与目标图像的相似性,而将图像在空间域中的语义关系完全忽略掉。为了弥补传统方法的上述缺陷,本文基于特定领域知识,改进了模板图像和目标图像的相似性定义方法,从而得到一种更加准确的模板匹配算法。实验结果表明,本算法能高效地完成字符模板匹配,并且针对目标图像出现遮挡问题、油迹污染、光照情况不可控的情况仍可达到比较高的故障识别率。

1.3.3 基于语义共生概率的模板匹配算法

本文提出一种基于语义共生概率的模板匹配算法,该算法不仅考虑到车号字符与模板在特征域上的相似性,而且还结合了CRH动车组的车号排序规则[7],分析邻近字符的语义共现概率关系。

(1)利用平均绝对差算法[8~9](MAD,Mean Absolute Differences)衡量车号字符图像u与字符模板库中第k个字符vk的匹配程度:

对两幅图像进行归一化,形成一个大小为N · N的图像。模板匹配是将模板vk叠放在车号字符图像u上,通过比较vk和u的相似性,完成模板匹配过程。该方法利用图像本身具有的灰度统计信息来衡量图像之间的相似程度,精度较高,但对于尺度变化、旋转以及不均匀光照等因素比较敏感。

(2)根据CRH动车组的车号排序规则,构建邻域字符u和u+1之间的共生概率p(u,u+1)。动车组的型号和编号规则如图5所示。

图5 CRH动车组车号编号规则

由上述规则可以看出,“C”“R”“H”3个字符的共生概率相对较大,而“C”“S”的共生概率就比较小。综合考虑车号字符与模板图像在特征与相似性以及车号字符邻域之间的语义共生概率,本文定义了模板图像与任一字符图像的相似性衡量函数,其中,vk和u与公式(3)定义一致,u+1为字符u的邻域字符:

基于语义共生概率的模板匹配算法旨在结合上下文语义特征,在目标图像中寻找匹配区域。这里以字符“8”和“B”为例,当其邻域字符出现“3”,即使其特征域中更相似于“B”,结合特定领域的共生概率p(u,vk),共同约束也将其匹配到“8”;反之亦然。具体流程算法实现如表1所示:(1)利用平均绝对差算法(MAD)和衡量法计算字符与模板图像库中的每个模板视觉特征相似性D(u,vk)。(2)根据CRH动车组的车号排序规则,构建字符之间的语义共生概率p(u,u+1)。(3)基于语义共生概率的模板匹配算法,完成车号字符的识别。

表1 基于上下文语义信息的模板匹配算法流程

2 实验研究

从多个方面对用于动车组故障检测的车号识别算法性能进行评估:(1)利用TEDS轨边车号采集像机采集的车号图像进行算法性能的评价;(2)考察模板匹配算法的阈值对识别性能的影响;(3)分析传统模板算法与基于特定领域知识的模板匹配算法的性能比较;(4)利用图示的方式,展示TEDS中本算法的车号识别性能。

2.1 模板匹配性能

为了评价模板匹配的性能,我们使用SR=[BG∩BM]/[BG∪BM]衡量准确性,其中,BG和BM分别表示模板图像在目标图像的准确位置和匹配位置,如图6 所示。为了很好地评价本算法,本文将数据集随机划分5 次并重复相应的实验,取多次实验的平均值。算法软件运行环境为:Matlab7.0 和Windows XP;硬件环境是:Pentium-4 3.0 G 计算机、1 G 内存。平均匹配准确率定义为:,N是运行次数。匹配准确率接近于99.8%。

图6 模板图像在目标图像中的准确位置和匹配位置的3种相互关系

2.2 阈值参数的性能影响

本节分析模板匹配算法的阈值参数对于故障识别性能的影响,具体的性能比较如表2所示。不难看出,阈值对故障识别性能确实有一定的影响,当模板匹配选取较小的阈值时,车号识别准确性较低。主要原因是阈值较低时,依赖特征相似性很难得到准确的字符模板图像,因此借助特定领域知识,更难得到准确字符。而随着模板匹配的阈值逐步增加,车号识别准确率也在稳步提升。但当阈值大于一定值后,阈值继续增加,识别性能增加不大。模板匹配采用较低的阈值时,虽然降低了漏报的可能性,但是却提高了误报率;而当阈值较高时,其漏报率将会增加,也在一定程度上降低了算法的性能。为此,综合分析上述两个阈值,本算法选取较好的故障识别性能阈值参数,即模板匹配算法选取阈值为0.8。

表2 不同阈值对车号识别率的影响

2.3 算法性能比较

对比分析传统模板匹配算法与基于特定领域知识的模板匹配算法的车号识别性能。从表3中可以看出,传统的模板匹配算法虽然可以进行车号识别,但是其准确率还有待提高,主要原因是由于拍摄的光线、天气、油污等问题,使得单纯依赖于特征相似性的字符识别准确率较低,而且其性能在很大程度上受到模板的影响,且匹配计算量大,速度慢,实时性不强。本文提出的一种基于语义共生概率的模板匹配算法,通过自适应融合特征域相似性和空间域语义共生关系,进行车号字符匹配,从表中可以看出对于所有的匹配阈值,其字符匹配性能均有所提升,因此可以在很大程度上提升动车运行过程中的安全监控质量。

表3 不同模板匹配算法对车号识别率的影响

2.4 车号字符识别性能

本文算法的识别性能如图7所示。

图7 车号识别结果

我们将所提出的车号识别算法运用于动车组动态故障检测。每辆车的平均处理时间为5 min,图8为检测结果示例图。

图8 动车组动态故障检测结果示例图

3 结束语

本文提出了一种基于语义共生概率的模板匹配算法,用于动车组运行故障的车号识别系统。实验结果表明,本算法对车号的识别正确率和有效性都满足铁路总公司的相关要求,保障了TEDS的工作效果。

[1]李 骏.动车组运行故障动态图像检测系统(TEDS)设计与实现[D].北京:北京邮电大学,2012.JUN L.The Design and Implementation of TEDS System[D].Beijing:Beijing University of Posts and Telecommunications,2012.

[2]许艳峰.动车组故障轨边图像自动检测系统图像对比算法研究[J].铁路计算机应用,2013,22(5):23-26.XU Y F.Research on image contrasting algorithm for TEDS [J].Railway Computer Application,2013,22(5):23-26.

[3]赵俊彦,任崇巍.关于动车组故障对边图像检测系统的设计[J].铁道机车车辆,2011,31(6):19-22.ZHAO J Y.Design of EMU Fault Imagine Edge Detection System [J].Railway Locomotive &Car,2011,31(6):19-22.

[4]周景超,陈 锋.车牌字符分割的研究和实现[J].计算机工程,2006,32(5):239-243.ZHOU J C.Study and Implementation of Vehicle Plate Characteristics Segment[J].Computer Engineering,2006,32(5):239-243.

[5]王少杰,朱志刚.货运列车车型车号自动分割和识别算法[J].模式识别与人工智能,1998,11(3):328-334.WANG S J.Automatic segmentation and recognition of freight train characters[J].Pattern Recognition and Artificial Intelligence,1998,11(3):328-334.

[6]刘祖胜,方 凯,刘硕研.用于动车组故障检测的图像识别算法[J].铁路计算机应用,2015,12(24):1-4.LIU Z S.Image recognition algorithm for EMU trouble detection[J].Railway Computer Application.2015,12(24):1-4.

[7]陈春雷,王阳萍.基于视频列车车号识别系统的研究[J].兰州交通大学学报.2007,26(6):99-103.CHEN C L.Research on Recognition System of Train Character Based on Video[J].Journal of Lanzhou Jiaotong University,2007,26(6).

[8]YU Z.Object Matching Using Deformable Templates [J].IEEE Trans.On Pattern Analysis and Machine Intelligence,1996,18(3):267-278.

[9]陈 智.图像匹配技术研究 [D].武汉:华中师范大学,2006.CHEN Z.Research on image matching technology [D].Wuhan:Central China Normal University,2006.

责任编辑 杨琍明

表3 列车交路优化方案

5 结束语

不同于单线独立运营场景,互联互通下网络化行车交路更为复杂,运营组织更灵活。本文选取两条互联互通的城市轨道交通线路作为研究对象,提出了交路方案的设计思路,并以候车时间最小化、换乘客流最小化、企业运营成本最小化为目标建立了交路方案多目标优化模型,通过简化处理可以利用计算机优化软件进行求解。最后,通过实际案例分析验证了模型的有效性。虽然研究对象界定为两条线路互联互通,但为更复杂的多线路互联互通网络化列车交路方案的后续研究奠定了基础。

参考文献:

[1]付慧伶,聂 磊,杨 浩.基于备选集的高速铁路列车开行方案优化方法研究[J].铁道学报,2010,32(6):1-8.

[2]王艳艳.城市轨道交通列车交路方案优化模型研究[J].西华大学学报,2013,32(5):42-44.

[3]凌 俊,胡 雄,何红弟.城市轨道交通非高峰期列车交路方案优化[J].铁道科学与工程学报,2015,12(1):190-195.

[4]王媛媛,倪少权.城市轨道交通大小交路模式列车开行方案的优化[J].铁道学报,2013,35(7):1-8.

责任编辑 陈 蓉

Train identifcation algorithm for EMU trouble detection

FANG Kai
( Institute of Computing Technologies,China Academy of Railway Sciences,Beijing 100081,China)

The train number is a unique identifcation of the train.The Trouble of moving EMU Detection System (TEDS) is aimed to detect the trouble of moving EMU images based on the matching between present image and previous one which searches in the image database of the train number.However the RFID electronic tag does not installed in the EMU.Hence,the EMU train number recognition has become urgent to solve the problem.The article proposed a template matching algorithm based on semantic symbiosis probability to identify the train number.The experimental results showed that the correct rate and effectiveness of the proposed approach could conform with the regulation of China Railways,ensure the effect of TEDS.

TEDS;train number location and segmentation;template matching;train identifcation

U266.2∶U284.55

A

1005-8451(2016)05-0014-05

2015-10-08

中国铁道科学研究院基金资助项目(2013YJ05)。

方 凯,副研究员。

猜你喜欢

车号字符动车组
论高级用字阶段汉字系统选择字符的几个原则
铁路车号识别设备太阳能供电技术的探讨
“95后”动车组女司机的首个春运
阳泉站车号识别智能管理 系统构建研究
“湖南造”首列CJ6动车组上线运营
字符代表几
一种USB接口字符液晶控制器设计
图片轻松变身ASCⅡ艺术画
基于小波分解的客运列车车号定位及阈值分割∗
动车组BTM带内干扰的排查与整治