基于卷积神经网络的接触网支柱号识别方法研究

2019-09-19薛宪堂王登阳王燕国

铁路计算机应用 2019年9期

薛宪堂，王登阳，张翼，周威，王燕国

（1.中国铁道科学研究院集团有限公司基础设施检测研究所，北京 100081；2.北京铁科英迈技术有限公司研发中心，北京 100081）

铁路基础设施动态检测一般通过安装在专业检测车上的检测设备获取基础设施状态，发现基础设施相关设备缺陷。其中，缺陷问题的准确定位是检测系统中非常重要的部分，常见的定位方法通过公里标进行关联定位，该方法通过综合定位的手段能够实现精确定位[1]。然而，对于供电系统，公里标定位方式在现场运行维修中具有查找时间较长、操作不直观等问题。接触网支柱号在接触网检测和日常供电维护中能够提供重要的定位标志信息，对于供电设备缺陷的复核整治、修复都能够起到快速、准确的定位作用。高速铁路供电安全检测监测系统（6C系统）总体技术规范中对接触网检测数据的定位和存储都提出了一杆一档的要求[2]，一杆一档的存储方式符合铁路供电系统的专业特点和设备管理方式，在这种背景下接触网支柱号的作用尤为重要。

国内很多研究人员都研究了通过图像的方式识别支柱号的方法，吴光龙提出了基于支持向量机的自动识别接触网支柱号的方法[3]；杨文静等人提出了基于多帧杆号字符识别的接触网检测系统[4]。但是这些研究方法都依赖经验阈值或者图像阈值，容易受天气、环境和光照等因素的影响，难以普适。基于

1 卷积神经网络

卷积神经网络的每个神经单元,如图1所示。

图1 神经单元示意图

对应式如式（1）所示：

式中：yj为第j个神经元的输出结果；f(x)为激励函数（常用的激励函数有sigmoid函数、线性纠正函数、tanh(x)函数等）；xi为输入信号；wij为第j个神经元的第i个输入的系数；bj为神经元的偏移量。

该单元可以被称作是Logistic回归模型。当将多个单元组合起来并具有分层结构时，就形成了人工神经网络模型[9]。

卷积神经网络在上述理论基础上发展而来，它的基本结构包括卷积层、池化层、全连接层和输出层。在卷积神经网络的卷积卷积神经网络的目标检测是目前快速发展的目标检测技术之一，已经成为了研究的热点。先后出现了rcnn、fast rcnn、faster rcnn、YOLO和SSD等目标检测算法。Caffe、TensorFlow等开源深度学习框架的发展使得卷积神经网络能够快速实现，一些公司也相继开源了他们的深度学习框架，降低基于深度学习的开发成本，推广卷积神经网络的应用。目前,基于卷积神经网络的研究取得了优秀成果，本文也探索将其应用到铁路基础设施检测的相关实际问题中，并取得了较好的结果[5-8]。

结合铁路基础设施检测环境的实际特点提出了一种基于卷积神经网络的接触网支柱号识别方法，为铁路供电基础设施检测的缺陷定位和建立一杆一档数据库提供了有效手段。层中，神经元只与部分邻层神经元连接，这层通常包含若干个特征平面，每个特征平面由一些矩阵形式的神经元组成，同一特征平面的神经元共享权值，这里共享的权值就是卷积核。卷积核一般以随机数的形式初始化或者通过已经训练好的网络参数初始化（网络精调），在网络的训练过程中卷积核将学习得到合理的权值。共享权值（卷积核）带来的直接好处是减少网络各层之间的连接，同时又降低了过拟合的风险。池化层通常有均值子采样和最大值子采样两种形式。子采样可以看作一种特殊的卷积过程。卷积和子采样简化了模型复杂度，减少了模型的参数。全连接层通过矩阵向量乘积操作把特征空间线性变换到另一个特征空间，从而为分类做好准备，全连接层通常出现在网络的后几层。输出层起到分类器的功能，可以采用Logical回归、Softmax回归、或者支持向量机等方式进行分类。

1.1 SSD网络结构

网络模型基于SSD（single shot multibox detector）网络结构。该网络结构同时实现了检测和分类，进行端对端的一体化训练和目标检测。SSD网络结构，如图2所示。

SSD网络结构方法将结果转化为每一个特征图对应不同的比例和尺度的候选结果集合。预测时，网络为候选结果对应的每一个存在类别进行评分，并据此改进候选结果来更准确地匹配识别物的形状。该网络结合不同规格的特征图加强了其多尺度检测的性能。网络模型是可用于多个分类的单次检测器，和以往的单次检测器相比速度更快，准确性并没有下降，该方法在特征图上使用小卷积核，增强了对检测物特征的表达力。

图2 网络结构

总体目标损失函数是位置损失函数（loc）和置信损失函数（conf）的加权和，如式（2）所示，其中，N为匹配的默认框的数量，如果N为0则损失函数为0。位置损失函数（loc）为关于预测框（l）和真实标签（g）的平滑L1损失。置信损失函数（conf）是多类别置信的softmax loss。权重项α为设置为1的交叉验证。式（3）为在类别p中第i个默认框与第j个真实标签匹配结果[10]。

1.2 网络压缩

随着深度学习的不断发展研究，人们发现并不是所有的参数都在模型中发挥作用，存在着参数冗余的问题。因此，在不改变网络准确性或者准确性在可接受范围内的情况下，如何进行网络压缩也成为一个迫切的问题。常用的网络压缩的方法有网络剪枝、网络精馏、网络分解和权值量化等方法[11]。本文的网络压缩用到了网络剪枝和权值量化方法。

1.2.1 网络剪枝

（1）训练一个普通的卷积神经网络；

（2）根据经验选择一个合适的阈值，将权重绝对值小于阈值的连接剪开；

（3）剪枝后网络性能有可能会下降，根据需要对这个剪枝后的网络再次训练。通过大量的研究表明网络剪枝能够有效的减少网络规模、加快运行速度。

网络剪枝前、后比较，如图3所示。

图3 网络剪枝前、后比较

1.2.2 权值量化方法

通过减少表示每个权重所需的比特数来压缩原始网络，如果把权值压缩为1和-1的集合，那么卷积的除法运算将变成加法运算，加快计算速度。这方面有很多可靠的可以借鉴的方法，包括K均值标量量化、8 bit参数量化研究、16 bit定点表示法和权值的霍夫曼编码等。这些方法都在准确率损失极小的情况下使得存储大为减少并且运算速度大为提高[12-13]。

2 支柱号识别方法

在SSD VGG16网络的基础上，在几乎不改变网络准确性的情况下，通过网络剪枝和权值量化的方法减少网络规模和计算量。由于SSD目标检测方法对小目标对象的检测效果较差，而在实际的应用环境中，支柱号数字相对于整个图像的比例较小，直接应用检测识别支柱号效果不理想，所以采用分步检测的方法，先检测支柱号牌，然后在支柱号牌图像附近位置检测支柱号。

支柱号识别流程，如图4所示。

2.1 图像预处理

采用高斯滤波等图像预处理技术平滑支柱号区域以外的无关细节、将图像的支柱号区域清晰度保持在一定的范围内，也将不同环境拍摄的图像进行归一化处理，使得卷积神经网络专注于支柱号内容特征的学习。图像预处理的效果，如图5所示。

2.2 检测支柱号牌

检测支柱号牌时，置信度门槛设置为0.2，如果有多个大于0.2的检测结果，则选择最高的2个检测结果。

2.3 预测当前支柱号

根据现场经验，接触网的支柱号大部分是按照区间内奇数递增、奇数递减、偶数递增、偶数递减、顺序递增和顺序递减依次排列的，所以在算法初始化时或者稳定运行时输入支柱号信息，后续的支柱号大部分是可以预测的。即根据前序识别的支柱号可以推断出支柱号是奇数、偶数或者连续变化；支柱号变化方向为增序或者降序。例如，已经推断出前序支柱号为206，支柱号方向为偶数增序则可以预测当前支柱号为208。

图4 支柱号识别流程

图5 图像预处理效果

2.4 确定当前支柱号和杆位结果修正

在进行支柱号检测时，先检测支柱号牌结果集中的置信度最高的检测结果，图像检测支柱号内容后，将预测数字置信度的top10且选置信度＞0.2的结果为候选序列；比对候选序列集和预测支柱号，如果候选序列里面包含预测支柱号的内容则直接返回预测支柱号，否则利用候选序列的结果确定当前支柱号；若最终确定的支柱号不同于预测的支柱号和上一杆位的支柱号，则对之前的杆位识别结果进行修正。修正逻辑为反向预测上一杆位的支柱号，比对反向预测的支柱号内容是否在上一杆位识别的候选序列中，如果在则修正，否则不修正。

3 实验结果与分析

3.1 实验环境

实验用计算机硬件配置为双颗 E5 2650 v2 处理器（主频2.6 GHz，单颗8核16线程）、1TB固态硬盘、内存16 Gb、Quadro M4000显卡；系统为Windows 7 64位操作系统；开发环境为VS2013开发环境；卷积神经架构采用快速特征嵌入的卷积结构（CAFFE，Convolutional Architecture for Fast Feature Embedding）进行实验。

3.2 实验过程与结果

选取了陇海线连续杆位的5 323张支柱号图片进行试验，其中，1 331张连续杆位数据为测试数据，3 992张图像为训练数据，图片分辨率为1 280×1 024。

支柱号牌训练数据，如图6所示。

图6 支柱号牌训练数据

支柱号牌数字内容识别训练数据，如图7所示。

图7 支柱号牌内容训练数据

3.3 实验结果分析

对1 331张连续杆位测试图像数据按照实际运行情况进行支柱号识别测试分析。正确识别的支柱号图像为1 320张，错误的为11张，综合识别速度为15张/s，完整支柱号的识别正确率为99.17%。支柱号识别结果，如图8所示。

图8 支柱号识别结果

通过对识别错误的图像进行分析，识别错误的图像普遍存在接触网杆号牌存在遮挡或者拍摄不全的现象。候选序列中缺少实际的杆号数字结果所致。杆号牌遮挡图像，如图9所示。

图9 杆号牌遮挡图像

4 结束语

为解决车载检测过程中接触网支柱号识别的问题，从实际工程应用出发，提出一种基于卷积神经网络的接触网支柱号识别方法，该方法针对SSD网络检测小目标对象效果较差的现状提出分步检测的思想，结合网络压缩技术提高了识别速度。通过实验分析，采用卷积神经网络的支柱号识别方案可行，识别速度和准确率满足现场实际应用的需求，能够辅助铁路基础设施检测系统中缺陷的定位，指导现场运营维修。通过测试也发现了一些问题，后续将通过提高采集图像的稳定性进一步提高识别的效果，研究依据支柱号字符的几何位置关系判断接触网支柱号的方法。