APP下载

基于深度学习与遗传算法的动车组与ATP车载设备接口试验测试序列优化生成

2018-04-27甘庆鹏李开成北京交通大学轨道交通控制与安全国家重点实验室北京00044北京交通大学轨道交通运行控制系统国家工程研究中心北京00044

铁道学报 2018年3期
关键词:型式适应度编码

袁 磊, 甘庆鹏, 李开成, 付 强(. 北京交通大学 轨道交通控制与安全国家重点实验室, 北京 00044;. 北京交通大学 轨道交通运行控制系统国家工程研究中心, 北京 00044)

ATP车载设备是高速铁路列车运行控制系统(以下简称列控系统)的车载子系统核心主控设备,其与高速动车组之间接口的适配性,是实现超速防护功能的根本。目前我国为适应不同应用需求,各种新型号的高速动车组不断投入运用。由于不同型号的ATP车载设备在接口特性方面不尽相同。因此,装备某一型号的ATP车载设备的新型动车组在投入运营前,需要通过型式试验验证其接口适配的可用性和安全性。事实上,验证不同型号的动车组与新配备的车载ATP设备之间接口以保证其安全性与适配性的第三方接口型式试验已纳入了中国列控系统技术体系要求[1]。通常新型动车组与ATP的接口型式试验在高速铁路运营线路上开展,用于试验的时间资源和线路资源有限。如何在有限的资源下,高效、安全地完成测试,是测试序列设计的主要目标。目前接口型式试验测试序列均由测试专家根据需求与试验大纲手动编写,效率低下,测试项可用性、安全性无法保证,也无法在编写过程中有效衡量测试序列的优劣。与列控系统相关试验的测试序列生成的研究,目前主要集中于基于系统功能需求的实验室仿真或半仿真功能测试序列生成[2-4],并未涉及接口型式试验或者测试序列的优化过程,方法不具有通用性。

针对接口型式试验的研究场景,本文对测试序列生成、更新与优化过程建模,寻找基于综合指标的次优解,利用深度学习算法与遗传算法,设计了序列更新过程与序列优化过程相结合的策略,以得到符合期望的测试序列。基于哈大高速铁路CRH380B型动车组与CTCS3-300S型ATP车载设备某次型式试验现场数据,对本文提出的算法策略进行了仿真分析。

1 测试序列优化生成的总体策略

接口型式试验的每个测试序列由多个基本测试项组成,序列中的测试项具体明确测试项类型、执行的位置、条件以及步骤等。单次型式试验需要多个测试序列。接口型式试验大纲指定了列车牵引、制动、测距、报文接收、空气制动以及低黏着度处理等6大类试验共25种类型的动态试验基本测试项,并可根据测试需求增加特殊测试项。动车组的运营速度等级不同,则测试项的执行过程也有区别,本文基于310 km/h的最高运营速度。

基于人工编写测试序列的经验与试验的需求,本文提出了测试序列的执行时间效率与能量消耗目标、测试项的有效性与安全性原则、测试项覆盖度与冗余度要求,用于定义测试序列生成的预期测试需求。接口型式试验测试序列优化生成策略在本文中被设计成两个过程,即测试序列的优化过程与测试序列的更新过程,两个实现过程互相结合联系,生成满足预期测试需求且优化的所有测试序列。总体策略具体见图 1。

测试序列的优化过程根据需求在测试序列解空间中寻找较优的问题解,包括母测试序列集合优化与母序列集合优化再生成两部分。测试序列的更新过程根据预定的规则更新优化过程中再生成的测试序列的测试项,使得序列中的每个测试项的安全性与有效性得以满足,同时所有测试序列总体上能够达到测试项的冗余度与覆盖度要求。其包括决策点更新、测试项决策以及子测试序列更新等部分。

决策点DP(Decision Point)在本文中定义为间隔大于500 m的应答器组的位置,在列车运行仿真过程中动态地决定DP处是否设置某个类型的测试项。测试项决策是决策网络基于列车仿真运行到DP处的条件状态计算测试项可选集,是子测试序列更新的基础。算法操作基于母测试序列并行进行,一个母测试序列由单次接口型式试验中所有测试序列(称为子测试序列)串联组成,代表1个优化问题的可能解。每个子测试序列表示在型式试验中列车在1个车次中执行的所有测试项。

2 基于深度学习的测试序列更新过程

2.1 测试序列的更新

实际测试序列在本文设计的算法策略中转换为数字向量形式,一个子测试序列对应一个列车车次,测试序列中以数字表示对应的测试项类型号,“0”表示无测试项,测试项所在位置对应线路上的不同DP。图 2为1个子测试序列的更新示意图,英文字母表示测试项类型。更新前的子测试序列属于优化再生成的母测试序列的一部分,根据测试项决策网络计算得到的测试项可选集按照预定规则从一个DP到另一个DP更新测试项:(1)列车仿真执行完上一个测试项,运行至DP1,更新前测试项为0,则保留;(2)运行至DP2,更新前为测试项a,可选集中包含a,则保留;(3)假设列车仿真执行测试项a运行至DP5处,则DP3与DP4更新为0;(4)运行至DP5,可选集为空集,则更新为0;(5)运行至DP6,更新前测试项为d,可选集包含d,则保留;(6)执行测试项d,则更新DP7为0。

2.2 测试项决策算法

列车仿真向前运行经过每个DP,为了考察在测试序列更新过程中列车仿真运行到DP处时能否满足执行某些测试项的条件,本文定义了条件状态来表征当前DP处的特征。构建了基于深度学习算法的测试项决策网络以特征向量为输入来计算得到DP处的测试项可选集。具体定义的N维条件状态向量描述了执行测试项必要的需求

x=[x1,x2,…,xN]

( 1 )

分量取值可以是0、0.5以及1,分别表征当前DP处不满足对应该分量的条件、在可接受程度上满足以及完全满足。基于型式试验的具体情况,根据速度等级、坡度、轨道电路、应答器以及不同测试项之间的耦合关系等多类别要求,确定状态向量x为18维。

为了确定与每个状态向量对应的测试项类别样本,得到DP处的测试项可选集,定义类别向量

y=[y1,y2,…,yM]

( 2 )

式中:M为测试项类别数,分量下标代表了定义的测试项类型号,若根据状态向量可以计算出符合某类型测试项实施要求,则在类别向量对应分量置1,否则置0。状态向量与类别向量之间的映射计算关系通过具有深度学习能力的决策网络来完成。利用人工或者随机生成并人工定标签的训练样本,对构建好的决策网络进行离线训练与特征学习,以条件状态向量为在线输入即可得到对应的测试项可选集,适应不同的铁路试验线路数据以及试验需求。

深度学习是人工神经网络的进一步研究的结果[6]。深度学习[7]利用低层特征组合成更为抽象的高层表示。本文利用稀疏的多层自编码[8-9]与多层逻辑回归[10]构成的神经网络来进行测试项决策,见图 3。

网络学习的第一部分为编码层的特征学习。图中多层自动编码网络有2个编码层,按照逐层贪婪方式(Layer-wise)[11]的方式逐层训练,其本质是优化层与层之间的权值使得输出能够重构输入。具体地,对第一个编码层,若有m个维度为N的学习样本,则该编码层特征学习的代价函数为

J(W,b)=

( 3 )

其中,第1项为误差项,hW,b(x)为该编码层对应的输出层输出,输出层与输入同维度,不显含于图中。第2项为稀疏项,使部分神经元都处于非激活状态,网络具有稀疏特性,其中

( 4 )

( 5 )

式中:ρ为稀疏参数,表示需要达到的稀疏程度,通常取0.05。式( 3 )中第3项为规则项,限制权值过大,其中W1为编码层的权值,Wd为该编码层对应输出层的权值。按照代价函数( 3 )以基于反向传播算法(BP Algorithm)[13]求梯度的梯度下降学习方式优化,形成稀疏自动编码,仅保留编码层权值W1。第1个编码层的特征学习完成后,其直接输出作为下一编码层的输入,按照类似式( 3 )的代价函数进行训练。

网络学习的第2部分为输出层的感知学习。编码网络仅能够提取深度的样本特征,因此,在多层编码网络后串联由多个具有二分类能力的逻辑回归构成的输出层,进行样本特征的认知学习。逻辑回归利用了Sigmoid函数,是线性回归的改进,增加了鲁棒性,多逻辑回归的输出层代价函数

( 6 )

式中:第一项为误差项;a2为第二个编码层的直接特征输出;第2项为限制权值过大的规则项。

网络学习的第3部分为整体的调优(Fine Tuning),经过前面的特征学习与感知学习的过程后,为了获得更高的精度,需要对整体的网络调优,以前馈神经网络学习的方式基于BP算法求梯度,对网络整体按照梯度下降的方式进行有监督的学习。学习过程中的网络误差损失函数为

( 7 )

学习样本可以通过专家基于试验经验手动构造或者随机大量构造。在大样本集的基础上,利用图 3具有深度学习能力的分类决策网络进行离线学习。在测试序列的更新过程中,对列车进行运行仿真计算,实算牵引过程,推导制动过程,在每个决策点形成一个当前的条件状态特征向量,输入到决策网络中,在线计算测试项可选集。测试序列的更新过程利用测试项可选集按照预定规则更新测试项。

3 基于遗传算法的测试序列优化过程

3.1 目标函数

测试序列优化过程基于二进制遗传算法,对其中的相关过程进行了相应的修改以适应本文的应用场景的需求。优化过程与更新过程相互结合与相互联系,按照综合需求的目标,以迭代的方式生成新的测试序列集合,最终得到符合需求的期望的测试序列。按照型式试验,可以决定测试序列的总数Ns,同时决定所有M类测试项各自的最低冗余度nj(j=1,2,…,M)。对应第k个测试序列有gk个测试项,由优化过程决定,该测试序列期望的测试项数Mk。若对应一个车次有sk个决策点,对应测试序列为sk维的向量xk。综合考虑测试序列生成过程中的上述限制以及需要优化的运行时间与能量消耗指标,具体的优化目标函数为

( 8 )

xk,i+1@xk,ii=1,2,…,sk-1

式中:第一项为时间项,Tk为第k个测试序列期望执行时间(小于调度计划时间),T(xk)为第k个测试序列的执行时间;第2项为能耗项,Ek为第k个测试序列消耗的最大计算能量,E(xk)为第k个测试序列消耗的计算能量。计算方法为:(1)列车以最大牵引加速到限速后,进行制动至速度为0;(2)重复该“最大牵引-制动”过程至终点处。第3项为惩罚项,1个测试序列中测试不能过多。符号A@B表示A的取值受到B的限制。若各序列向量xk确定,式( 8 )值将可以基于列车运行仿真执行测试序列来具体计算。

式( 8 )中给出的是单个测试序列中的期望测试项数目,为了使得测试项的冗余度与覆盖度在优化过程中趋于满足,修正测试序列的更新过程,符合测试项可选集的当前预设测试项需满足下式才能进行更新设置

( 9 )

3.2 用于测试序列优化过程的遗传算法

从式( 8 )以及本文设计的策略可以知道,测试序列的优化生成是一个非线性、非连续以及非凸的问题,无法利用经典的规划与优化理论求解。因此,本文通过改进的适用本文应用场景的遗传算法来优化求解式( 8 )。首先将最小化代价函数转变为求最大的适应度值

(10)

遗传算法(GA)[14]模拟自然进化过程搜索最优解,通过选择、交叉和变异3个阶段来不断产生新的染色体群。二进制编码遗传算法中,一个二进制位表示一个基因,多个连续的基因为一个基因型,其解码表示即解向量的一个分量。

在本文应用中,1个母测试序列(所有需求的子序列)代表1个染色体,总的决策点数目为Md,则对应基因型的个数也为Md。基因型解码对应测试项类型号,定义为(b0,b1,…,bL0-1)2,其位数为L0,则染色体个体基因位数为

(11)

Step1群体初始化。每个染色体个体表示一个母测试序列,群体则表示母测试序列集合。以二进制编码的形式,随机产生Ng个染色体个体的群体,长度L。

Step2个体解码。染色体个体各基因型在按照下式解码,得到测试项类型号表示的母测试序列

(12)

Step3个体更新。母测试序列集合中所有个体在解码后进行的测试序列更新过程,得到新集合。

Step4适应度更新。对解码后的群体按照式(10)计算群体中各个体适应度,并且更新群体局部最优(当前最优)适应度及其对应的个体,以及更新全局最优(历史最优)适应度及对应的个体。

Step5选择操作。首先选择最高适应度对应的染色体保留到下一代,并抛弃最低适应度对应的个体。其次计算其余个体适应度值Fl(l=1,2,…,Ng-2)占总的适应度值的比例

(13)

按照轮盘赌选择法以概率Pl选择复制对应染色体。

Step6交叉操作与变异操作。单点交叉方式,选择操作得到的群体每两个个体分为一组,在某设定基因点右侧的部分以概率μc相互交换。多点随机变异方式,不超过L/50数目的基因点按照概率μm变异。经过交叉与变异操作后,得到新的群体,即解码后得到优化再生成的母测试序列集合。

Step7终止演化。若达到最大迭代数目则终止演化过程,否则重复步骤Step2~ Step7。

迭代结束后群体终止演化,得到了整个算法周期中的全局最优适应度及其对应的最优个体,按照式(12)进行解码后即为求解得到的期望的母测试序列。母测试序列所包含的所有子测试序列中的测试项,明确了测试项类型与执行的位置,按照具体的测试项内容转换为可直接应用于试验现场的测试序列。相关的转换以及试验计划的后续形成不属于本文研究重点,不再做进一步阐述。

4 仿真试验

本文对前述算法过程进行了仿真试验,数据来自CRH380B型动车组与CTCS3-300S型ATP车载设备接口型式试验。该型式试验的线路为哈大高速铁路长约115 km的四平东站至长春西站区间。测试序列共12个,适用测试项类型为22种,包括下行正向与上行正向,以反方向进站应答器组FJZ(或进站JZ)到进站应答器组JZ(或反进站FJZ)区间的应答器组为决策点。动车组的仿真运行以CRH3型动车组的牵引特性数据进行。

测试项状态向量18维,两个编码层维度均为20,输出层维度为25,适用试验大纲中所有25类基本测试项。在人工构造与随机生成的4 000个状态样本及对应类别样本基础上,对决策网络进行离线学习。图 4为第1个编码层的重构误差,可知第2个编码层重构误差也较小。图 5为输出层感知学习的误差收敛情况,对比图 6的整体调优过程可以知道网络性能得到了提升。网络在线测试项决策实验利用了总共包含了3 520个测试项的1 000例测试样本。跟进试验结果,正确识别测试项数目为3 419,识别率97.13 %。误报识别数目217,误报率为6.16 %。因此,网络决策精度较高,结果出错概率小,性能满足要求。此外,测试项更新过程是从测试项集合中按预定规则选择1个测试项,具有随机特性,可以使得错误项影响更低。

直接对本文设计的测试序列的优化生成策略进行仿真验证。对于式( 8 ),根据试验数据,可知需求序列数目Ns为12,按JZ(FJZ)之间的应答器组为DP点,单个序列决策点数目sk为117或119。需求冗余度为1~3,覆盖22类测试项。序列的设置每个子测试序列的期望执行时间为40 min,各子测试序列期望的测试项数目为8。按照前文最大执行能耗计算过程进行计算,最大计算执行耗能设置为1.2×107kJ。权系数w1、w2与w3分别设置为0.5、0.3与0.2;项内权系数w1,k、w2,k与w3,k均设置为0.101 9(k≠10,11,12)或0.027 8(k=10,11,12)。适应度函数中Fmax取1,染色体长度经计算为7 080,交叉概率0.9,个体变异基因数目48,概率0.05。优化过程最大迭代数为400,适应度、序列执行的时间花费以及能量消耗的信息追踪结果分别见图7~图9。

图7表明算法在进行了约200次左右的迭代便收敛了,得到的全局最佳适应度对应的母测试序列,即为优化生成的期望的所有子测试序列。图 8显示了子测试序列的时间花费,包括子序列01与所有子测试序列的平均值。算法收敛时平均时间花费为39.4 min,接近期望值。子序列01在母测试序列中最靠前,在序列更新的过程中较大概率设置更多测试项,因此执行时间花费更高。图 9显示算法收敛时得到的子测试序列平均能耗约为8.79×106kJ,即总能耗约为1.05×108kJ。统计最终优化生成的测试序列的测试项数目情况,见表1,实际得到的子测试序列为10个。

表1 优化生成的测试序列测试项数目统计

与实际现场序列的时间花费与能耗的理论计算结果对比,见表2,结果根据生成的子测试序列数目进行了修正。可见相比于原人工编写的测试序列,序列总耗能降低了,执行序列平均耗时接近预期的40 min。此外,在满足式( 9 )冗余度规则下,在有限的测试序列中测试项数目更多。进一步统计可知,测试序列中测试项整体满足了覆盖度要求,各类型测试项满足其冗余度要求。

表2 实际测试序列与优化生成的测试序列对比

为了说明优化生成的测试序列可以被有效执行,以01号子测试序列(下行正向)为例进行仿真执行与分析说明。该子测试序列为[/*6(0)*/ 6 /*23(0)*/ 3 /*33(0)/ 14 /*10(0)/ 24 /*6(0)*/ 9 /*1(0)*/ 10 /*12(0)*/ 3 /*6(0)*/ 11 /*6(0)*/ 12 /*6(0)*/],序列中/*6(0)*/表示为6个“0”,连续6个决策点无测试项。可以看出该序列共包含了9个测试项,仿真执行该测试序列,结果见图10。

可见该测试序列中由于不同的位置的不同类型测试项设置合理,相互间不会产生影响,都可以按照其预期仿真曲线仿真执行,满足其有效性原则。线路区间在下行正向的线路静态速度全线为310 km/h,无其他临时限速,从图中可以看到各测试项的执行均满足ATP限速要求;除去测试序列的仿真起止点外,该子测试序列共有6个停车点,包括K951+738、K956+342、K962+211、K964+174、K987+984以及K994+674,线路区间的分相区信息见表3,对比仿真制动停车点与分相区信息,可以知道各停车点距分相区均满足安全距离,无掉进分相区的危险,因此各测试项满足其安全性原则。其他子序列也可以进一步地推导出相同结果。数字向量的测试序列转换为实际文本测试序列不属于本文研究重点,不作进一步说明。

表3 下行区间分相区(公里标)

5 结束语

作为高速动车组的重要型式试验之一,第三方评估认证的ATP车载设备接口型式试验是我国高速铁路技术体系的一部分。本文研究了专家人工编写接口型式试验测试序列过程中的测试序列生成与优化,为了解决其中的测试项的有效性、执行的安全性、整体的需求覆盖等问题,量化地衡量测试序列的优化程度,提高测试序列编写效率与接口型式试验的执行效率,本文基于深度学习算法与遗传算法设计了测试序列的优化生成策略,包括测试序列更新过程与测试序列优化过程。文章结合哈大高速铁路CTCS3-300S型车载ATP设备与CRH380B型动车组某次接口型式试验数据进行了仿真对比,说明了本文设计的策略的有效性。本文方法可为列控系统其他功能试验的测试序列生成提供参考。

参考文献:

[1] 程剑锋,郑升,赵显琼. ATP车载设备型式管理体系及方法研究[J].中国铁路, 2013(10):43-46.

CHENG Jianfeng, ZHENG Sheng, ZHAO Xianqiong. Research on Type Management System and Means of ATP Onboard Equipment[J]. Chinese Railways, 2013(10):43-46.

[2] 张勇,王超琦.CTCS-3级列控系统车载设备测试序列优化生成方法[J].中国铁道科学,2011,32(3):100-106.

ZHANG Yong, WANG Chaoqi. The Method for the Optimal Generation of Test Sequence for CTCS-3 On-board Equipment[J]. China Railway Science, 2011, 32(3):100-106.

[3] 梁茨,郑伟,李开成,等.基于路径优化算法的测试序列自动生成及验证[J].铁道学报,2013,35(6):53-58.

LIANG Ci, ZHENG Wei, LI Kaicheng, et al. Automated Generation of Test Cases and Sequences Based on Path Optimization Algorithm[J]. Journal of the China Railway Society, 2013,35(6):53-58.

[4] ZHANG Y, WANG S, ZHANG X K, et al. A Computer-aided Tool for Generating Test Sequence for CTCS-3 Train Control System[J]. Advances in Information Sciences & Service Sciences, 2012, 11(4):311-317.

[5] 甘庆鹏. ATP车载设备与动车组接口型式试验测试序列的优化生成研究[D].北京:北京交通大学,2017.

[6] HINTON G E, OSINDERO S, TEH Y W. A Fast Learning Algorithm for Deep Belief Nets[J]. Neural Computation, 2006, 18(7):1527-1554.

[7] SCHMIDHUBER J. Deep Learning in Neural Networks: An Overview[J]. Neural Networks, 2014, 61:85-117.

[8] KAMYSHANSKA H, MEMISEVIC R. The Potential Energy of an Autoencoder[J]. IEEE Transactions on Pattern Analysis & Machine Intelligence, 2015, 37(6):1261-1273.

[9] OTHMAN E, BAZI Y, ALAJLAN N, et al. Using Convolutional Features and A Sparse Autoencoder for Land-use Scene Classification[J]. International Journal of Remote Sensing, 2016, 37(10):1977-1995.

[10] DREISEITL S, OHNO M L. Logistic Regression and Artificial Neural Network Classification Models: a Methodology Review[J]. Journal of Biomedical Informatics, 2002, 35(5/6):352-359.

[11] SCHÖLKOPF B, PLATT J, HOFMANN T. Greedy Layer-wise Training of Deep Networks[C] //Proceedings of the Confenrence on Advances in Neural Information Processing Systems (NIPS2006). New York: MIT Press,2007:153-160.

[12] HECTNIELSEN B R. Theory of the Backpropagation Neural Network[J]. Neural Networks, 2010, 1(1):65-93.

[13] CHANG H. An Overview of Genetic Algorithm[J]. Computer Study, 2010, 55(6):1171-1177.

[14] WONG K K, HO T K. Dynamic Coast Control of Train Movement with Genetic Algorithm[J]. International Journal of Systems Science, 2004, 35(13):835-846.

猜你喜欢

型式适应度编码
改进的自适应复制、交叉和突变遗传算法
杂物电梯门锁常见型式及检验中存在的问题
生活中的编码
幕墙型式对高层建筑室内自然通风影响的模拟
现代中小河流常用有坝壅水建筑物型式探讨
《全元诗》未编码疑难字考辨十五则
子带编码在图像压缩编码中的应用
Genome and healthcare
一种基于改进适应度的多机器人协作策略
不同动力型式的巡飞弹总体参数对比分析