APP下载

基于数值分析和神经网络的轨道过车信号判断

2022-04-13陈洪根黄春雷禹建丽

郑州航空工业管理学院学报 2022年1期
关键词:轨道电路个数神经元

邓 阳,陈洪根,黄春雷,禹建丽

(1.郑州航空工业管理学院 管理工程学院,河南 郑州 450046;2.黑龙江瑞兴科技股份有限公司,黑龙江 哈尔滨 150030)

1 引 言

轨道电路是铁路信号工程的重要构成部分[1],对于保障列车行驶安全和提高城市轨道交通系统运营效率起着关键性作用[2]。ZPW-2000系列无绝缘轨道电路作为地—车信息传输基础的列车运行控制系统,具有可实现轨道电路全程断轨检查、减少调谐区分路死区等优势,在我国高铁、地铁等各类轨道交通中得到广泛应用,并且保持快速发展的趋势[3]。然而,我国各路段对ZPW-2000R等轨道电路信号的判断,目前仍处于较原始的人工识别阶段,不仅识别效率低下,人力物力耗费巨大,而且由于人因不可靠性的存在,容易造成误判、漏判,进而可能导致轨道交通安全事故的发生,甚至波及网络中其他线路的正常运营[4]。如何实现ZPW-2000R系列轨道电路信号的准确快速判断,成为轨道电路工程应用及2021年第八届全路ZPW-2000系列轨道电路技术交流会的关注焦点之一。

围绕ZPW-2000系列轨道电路的应用问题,近年来不少学者开展了广泛而深入的研究。王瑞峰等(2021)[5]针对ZPW-2000A轨道电路状态评估、诊断过程中故障类型与征兆间存在不确定性等问题,将集对分析及隶属函数引入轨道电路状态评估及故障诊断中。田粉霞等(2020)[6]建立了分路状态下机车信号电压模型,采用卷积神经网络(Convolutional Neural Networks, CNN)实现调谐区的故障诊断。陈光武等(2021)[7]针对传统无绝缘轨道电路故障诊断精度不高和诊断结果不稳定的问题,提出一种将模拟退火算法和粒子群最小二乘支持向量机相结合的方法,用其进行故障诊断。李德威等(2020)[8]以ZPW-2000A轨道电路为例,提出了一种基于模糊灰理论的风险评估方法,分析确定了重要设备的故障模式及对应的风险等级,并进行了灰排序。刘伯鸿(2020)[9]等人采用融合深度置信网络,建立了轨道电路剩余寿命预测的隐半马尔可夫模型。黄斌(2019)[10]针对传统电务部门对ZPW-2000A型轨道电路维护中所沿用的“故障修”和“定时修”在保证行车安全、提高运营效率及经济性等方面存在的不足,采用改进GM(1,1)和支持向量机(Support Vector Machine,SVM)方法,建立了轨道电路故障最优化组合预测模型。Alvarenga Tiago A(2020)[11]等人提出了一种基于频域反射技术的轨道电路误占用故障诊断与定位方法。Haoyue Zang(2020)[12]等人引入集对分析理论,将其应用于轨道电路的状态评估。Li Junwu(2019)[13]等人提出了一种基于粗糙集(Rough Set,RS )约简模型和贝叶斯网络(Bayesian Network,BN )结构学习融合的故障诊断方法,并将其应用于ZPW-2000K轨道电路的故障诊断。杨璟(2021)[14]等人针对轨道电路稳态条件下诊断的时效性不足的问题,利用梅尔频率系数和动态时间规整模型,建立了一种基于暂态信号的轨道电路故障诊断方法。王梓丞(2021)[15]提出将神经网络与模糊逻辑相结合,构建了区间二型神经模糊系统(interval type-2 neural-fuzzy system,IT2NFS)的轨道电路故障智能识别模型。

以上研究成果主要集中于轨道电路的故障诊断方面,对于如何对轨道电路所传回数据进行信号识别和判断并未涉及,因此难以为ZPW-2000R系列轨道电路信号的准确快速判断提供有效解决方案。为此,本文基于我国高铁某区段ZPW-2000R轨道电路的实际运行数据,针对不同列车物理属性差异导致ZPW-2000R轨道电路输出信号数据长度不一致问题,利用数值分析和神经网络方法,构建ZPW-2000R轨道电路过车信号的智能判断模型。

2 基于数值分析的神经网络模型

一个标准的神经网络通常包括三层:输入层、隐含层和输出层[16]。其输入层神经元个数可根据输入样本大小算法自动确定,但要求同一神经网络架构相同。所以,同一神经网络输入层神经元个数一旦确定,则不能再更改,且样本中每个特征值所对应的参数意义应保持一致。为此,对于同一网络,要求其输入样本的长度应保持一致。然而,由于不同列车物理属性存在差异,使得ZPW-2000R轨道电路在列车通过时的输出信号长度并不完全一致。针对样本长度不一致的问题,一般有两种处理思路:一是针对每种长度都构建一个神经网络,通过多个网络的构建来保证每个网路的输入样本长度一致,如此则必然导致计算量和数据的冗余迅速增大,且使得每个神经网络所能训练使用的数据样本量大大减少,以致训练结果较差;二是采用数值分析的方法将样本处理成长度一致,然后再建一个神经网络进行数据的训练和预测。鉴于第二种方法在运算速度和训练效果方面的优势,本文采用第二种思路进行模型构建,建立的基于数值分析的神经网络模型如图1所示。

图1 基于数值分析的神经网络模型

2.1数值分析

数值分析主要有插值与拟合方法、线性方程组的解法、非线性方程组的求根方法、数值积分与数值微分方法、常微分方程初值问题数值解法五大模块。本文主要采用插值法和提取法进行数据处理。

本文运用插值法对轨道电路信号较短数据进行处理。其基本思想是:假定区间[a,b]上的实值函数f(x)在该区间上n+1个互不相同点(x0,x1,…,xn)处的值是f(x0),f(x1),…,f(xn),若要估算f(x)在[a,b]中某点x*的值,则可以寻找一个在x0,x1,…,xn的节点上与f(x)函数值相同的函数P(x),用P(x*)的值作为函数f(x*)的近似。[17]

提取法主要用于本文对轨道电路信号较长数据的处理。具体操作如下:在不改变原始数据顺序的前提下,从原始数据中随机提取出所需数据长度的一段数据作为原始数据信息的代表样本。

2.2神经网络

经数值分析将数据长度处理一致后,将其输入神经网络模型中进行训练。假设输入向量为X=(x1,x2,…,xn)T,n为输入层神经元个数,则经隐含层传递函数可得

(1)

式中:x0=-1,w0j=θ,yj表示隐含层第j个神经元的输出,wij为输入层第i个神经元与隐含层第j个神经元之间的连接权值。

进一步经输出层传递函数可得仿真输出结果

(2)

式中:zk表示输出层第k个神经元的输出,wjk为隐含层第j个神经元与输出层第k个神经元之间的连接权值。Z=(z1,z2,…,zm)T为输出向量,k=1,2,…,m。

令T=(t1,t2,…,tm)T为目标输出向量,则可得目标输出与网络输出间误差为

(3)

神经网络训练的目标,就是得到使ε最小的网络模型。

由于负梯度方向是函数值减小最快的方向,因此本文使用梯度下降法来构建误差减小的算法[18]。设定步长η,每次沿负梯度方向调整η个单位,每次权值调整为Δwpq=-η∂ε/∂wpq,wpq为某两个神经元之间的权值。则神经网络反向传播时的算法如下:

(1)先调整隐含层到输出层的权值。

定义vk为输出层第k个神经元的输入,且

(4)

h为隐藏层神经元个数。则

(5)

由式(2)—(5)可得

(6)

其中,δk=(tk-zk)g'(vk)

于是隐含层到输出层的权值调整迭代公式为

wjk(t+1)=wjk(t)-ηδkyj

(7)

其中t为当前迭代次数。

(2)再调整输入层到隐含层的权值。

定义uj为隐含层第j个神经元的输入,且

(8)

(9)

由于隐含层第j个神经元与输出层的各个神经元都有连接,因此由式(1)—(9)可得

(10)

于是,输入层到隐含层的权值调整迭代公式为

wij(t+1)=wij-ηδjxi

(11)

通过上述调整神经网络权值方法,可实现各神经元之间权值的调整。若目标输出与网络输出间误差仍未达到期望值则再次进行误差调整,如此反复迭代,直至目标输出与网络输出间误差达到期望值,则神经网络拓扑结构构建完毕。

基于数值分析的神经网络流程图如图 2所示。

图2 神经网络流程图

3 基于数值分析的轨道电路列车运行数据处理

3.1数据特征分析

ZPW-2000R设备每秒采集一次数据,将数据存入后台数据库中。由于设备的特殊性,判断轨道此时是否空闲,主要根据主机调接入电压来判断。列车经过该轨道区段与该区段空闲时的主机调接入电压呈现趋势的对比结果如图3所示。从图中可明显看出,轨道占用与空闲时设备所传回的电压震荡有明显差别:空闲时电压呈稳定状态,而占用时电压呈震荡状态。

图3 轨道空闲、占用时电压呈现趋势对比图

这是因为,当轨道区间空闲时,无列车经过,不会对该区间发送器带载产生影响,其电压呈现趋于一条直线;当轨道区间有列车经过时,由于列车对后方发送器带载产生影响,从而引起电压数据的震荡变化。当设备发生短路、开路、损坏等故障时,所引起的电压震荡与有列车经过轨道区间所引起的电压震荡趋势不一致,因此用主机调接入电压判断轨道是否空闲具有可识别性。

3.2数据处理

列车存在长度、重量以及行驶至某区间时的速度等物理属性不同,因此会导致不同列车经过同一区段时设备所传回的电压震荡时间长度不一样。选取6列列车经过同一区段时的电压变化数据如图4所示。如果对每种列车都建立神经网络模型,则会大大增加不必要的工作量。因此可通过数值分析方法将数据长度处理一致,以提升判断效率。

图4 不同列车所引起的电压震荡

基于图4数据,利用前文所述的数值分析方法,使用matlab线性插值函数和数据提取代码,将数据长度处理一致,得到的结果如图5所示。

图5 数据处理后的电压震荡

由图5可知,数值分析法可在基本不改变原始数据呈现趋势的前提下,将轨道电路长度不等的原始数据处理成长度一致的数据,从而为后续构建神经网络模型奠定数据输入基础。

由于插值法和提取法都不可避免地在不同程度上造成了数据的损失以及噪音的出现,且过长的数据会造成神经网络输入层的个数增加,进而使神经网络计算量加大。因此,需要根据实际运行情况,确定一个合适的数据长度,以实现原始信息覆盖和计算量两者之间的平衡。由我国高铁某区段ZPW-2000R轨道电路的实际运行数据,得到其轨道占用时的电压震荡数据长度,如表1所示。

表1 数据长度分布统计

由表1可知,60秒以下的数据占比较高,高达64%。为了避免带来过多的噪音以及特征损失和计算冗余,本次实验的数据长度最终选为60秒。

4 神经网络训练与过车判断

4.1网络拓扑结构

网络拓扑结构的确定,本质就是确定神经网络的输入层神经元个数、隐层神经元个数和输出层神经元个数。

4.1.1输入层和输出层神经元个数确定

输入层神经元个数由输入数据长度确定,一般用a表示。由上文分析可知,本文确定的数据输入长度为60,因此可知输入层神经元个数a为60。

输出层神经元个数由分类情况决定,一般用b表示。由于本文轨道电路状态可分为空闲和占用两种,因此b为2。

4.1.2隐层神经元个数确定

首先,考察c值变化对模型预测准确率的影响。随机选取60组空闲或占用数据集进行实验,不同c值对神经网络模型训练结果准确率的影响如图6所示。由图6可知,c值对准确率的影响并无显著差异。

图6 c值对准确率的影响

接下来,进一步考察不同c值对神经网络模型训练所用时间的影响。随机选取60组空闲或占用数据集进行实验,结果如图7所示。由图7可知,c值与神经网络模型训练所用时间具有明显的正相关关系。

图7 c值对训练所用时间的影响

4.1.3网络拓扑结构

综上所述,可得到网络的最终拓扑结构为输入层神经元个数为60、隐层神经元个数为8、输出层神经元个数为2。

4.2神经网络训练

神经网络训练实验数据为随机选取的某轨道电路区段ZPW-2000R设备某3天的数据,一共有259 200组数据点。通过代码先将电压数据根据轨道是否空闲分离开来,共得到数据样本2 688组,随机选取70%作为训练集,30%为测试集。

采用上文确定的网络拓扑结构,隐层激活函数为logsig,输出层使用softmax函数对网络训练结果进行分类处理。采用Levenberg - Marquardt方法进行反向传播训练,使神经网络不断进行优化。输入数据进行网络训练,得到误差收敛曲线如图8所示。由图8可知,训练结果误差0.0002已满足所设定的误差结果值0.001,训练过程急速下降,训练结果良好。

图8 神经网络训练误差收敛曲线图

4.3过车判断实验

利用上文训练好的网络结构对剩余30%测试集进行测试。当输出为1时,表明轨道此时为空闲,为2时,轨道此时被占用,即该区段目前有列车经过。将期望输出值与网络输出值进行对比,得到所有测试样本集数据对比结果如图9所示(x轴表示数据集编号,y轴表示轨道电路状态,1表示空闲,2表示占用)。由于测试样本集较大,从图9无法明显看出结果对比。为此,从结果中随机选取30组结果进行对比,结果如图10所示(x轴表示随机抽取30组数据后的数据集编号)。由图10可知,测试结果与期望结果高度吻合,并且通过代码将所有网络输出结果值与期望输出结果值进行准确率判断,计算得到判断准确率高达100%。

图9 训练结果对比图

图10 随机选取部分结果展示

5 结 语

基于目前ZPW-2000R运行中存在需人工判断轨道是否占用这一问题,本文提出一种基于数值分析和神经网络的智能算法来对轨道是否占用进行判断。实例分析结果表明,利用本文模型,可实现高达100%的训练回检结果,说明网络模型良好,适用度较高。不过,本文实验所使用的数据为静态数据,只是证明了利用智能算法实现轨道电路信号的准确快速判断的可行性。如何进一步实现从实际运行的动态数据库中实时调取数据对轨道电路信号状态进行快速准确判断,以实现本文模型的工程应用,还有待于进一步研究。

猜你喜欢

轨道电路个数神经元
怎样数出小正方体的个数
AI讲座:神经网络的空间对应
基于通信编码的区间ZPW-2000轨道电路最小道砟电阻取值探讨
基于HHT及LCS的轨道电路传输变化识别探讨
HXD电力机车牵引电流高次谐波对25Hz轨道电路干扰问题的解决
全电子高压脉冲轨道电路系统设计
等腰三角形个数探索
怎样数出小木块的个数
采用GCaMP6 在体大规模记录感觉神经元的活动
怎样数出小正方体的个数