APP下载

基于迭代学习策略的高速机车二系横向主动控制*

2022-10-29任铖铭姚远钟晓波李广

动力学与控制学报 2022年5期
关键词:锥度平稳性轮轨

任铖铭 姚远 钟晓波 李广

(1.西南交通大学 牵引动力国家重点实验室,成都 610031)(2.中车株洲电力机车有限公司转向架研发部,株洲 412001)

引言

随着控制技术的发展,主动或半主动悬挂系统在轨道交通车辆中的应用将越来越普遍.现有的车辆主动或半主动悬挂系统研究大多基于车辆动力学模型仿真计算以优化控制参数,而轮轨车辆作为极其复杂的系统,其轮轨界面、轨道不平顺和外部环境都具有一定的不确定及时变特性,基于车辆动力学模型的控制参数优化存在一定的局限性.迭代自适应控制技术作为控制理论的重要分支,将其应用到车辆系统动力学控制具有一定理论意义和工程应用价值.Arimoto等[1]首次提出一个在有限区间上重复运行的系统,经过有限次迭代后收敛到期望运动轨迹,迭代学习控制利用多次重复运行的信息来产生能够达到期望运动轨迹的控制输入,从而提高控制精度,由此迭代学习控制引起广泛关注和研究.时至今日,控制领域中已有多种迭代学习控制算法[2-4],但目前相关应用主要集中于高速列车的速度跟踪和轨迹跟踪等列车自动驾驶技术,在车辆系统动力学性能控制方面的研究仍然较少.

横向平稳性是高速列车动力学性能评价中的一项重要指标.过去的数十年间,多种先进控制策略被用于高速列车动力学性能控制研究中[5,6],但迭代学习控制鲜少被用于改善列车横向动力学性能.现有研究采用开环式D型、PD型迭代学习策略以改善列车曲线通过性能和动力学指标[7-8].考虑到列车运行时复杂的外界条件,设计改进式的迭代学习控制方式,以提高安全性[9].已有相关研究却少有关于迭代参数的优化及时滞对控制性能的影响.

本文提出一种参数优化的PD型闭环迭代学习控制器,考虑轮轨接触状态演变工况,通过多目标优化匹配最优前沿迭代参数,并结合控制系统时滞分析横向动力学性能指标,探究了机车横向平稳性与控制参数、时滞变化之间存在的规律,对迭代控制技术在铁道车辆上的应用做出尝试.

1 机车动力学模型与虚拟激励法

1.1 机车动力学模型

为研究机车横向动力学性能,建立了简化的某型机车横向动力学模型,如图1所示,其主要结构参数见表1.该模型包含1个车体,2个构架,4个轮对,4个横向弹性悬挂电机,共11个刚体.车体和构架具有横移、摇头及侧滚自由度,轮对具有横移和摇头自由度,电机具有横移自由度.轮对与构架之间一系悬挂由横向、纵向和垂向定位刚度组成,模型同时考虑到一系转臂定位结构.车体与构架之间设有横向、纵向和垂向二系悬挂刚度和阻尼,主动控制作动器采用与弹簧并联的形式设置在车体与构架间二系悬挂处,同侧前后位置各设置一个.考虑到减振器串联节点刚度对车辆动力学性能的影响,抗蛇行减振器及二系横向减振器采用弹簧和阻尼串联的Maxwell等效模型.该机车动力学模型共29自由度.本文针对机车进行基于线性系统随机响应的频域平稳性[10]分析,轮轨接触几何采用等效锥度来表示,轮轨切向力采用线性Kalker线性理论计算.机车动力学模型如下:

(1)

式(1)中,x是系统的自由度矢量,M,C,K,Q和B分别为系统的质量,阻尼,刚度,激励和反馈作用力矩阵,f(t)为激励向量,u(t)为控制力输入.

表1 模型部分参数Table 1 Partial parameters of model

图1 机车横向动力学模型Fig.1 Lateral dynamic model of locomotive

1.2 虚拟激励法[10]

虚拟激励法是我国学者近年来提出的一种针对复杂结构系统的随机振动响应分析的新方法.该方法将复杂结构受到的振动分解为平稳和非平稳随机振动两种形式,并将二者以简谐振动和逐步积分分别代替表示,将复杂的平稳及非平稳随机振动响应问题简单化,方法简便、高效且计算量小.以线性时不变系统为例,简述虚拟激励法原理.

(2)

系统虚拟响应为:

(3)

(4)

当轨道激扰的自功率谱密度为SFF,其对应虚拟激励为:

(5)

针对轨道交通领域中,列车与钢轨间有n个接触点的状况,考虑到各点所受的不平顺是相同的,区别仅在于时间延迟,因此可进一步构造虚拟激励

(6)

将式(6)代入式(1)后,得到虚拟位移响应:

(7)

根据式(4)可得虚拟位移响应的自功率谱

(8)

近年来,虚拟激励法逐渐应用于铁道车辆领域中,但现有研究主要集中于车-线耦合、车-线-桥耦合等系统模型的随机振动响应和动态载荷研究[11],目前车辆系统横向动力学领域对虚拟激励法的应用较少.本文运用虚拟激励法计算机车横向动力学模型车体部分的虚拟位移响应及虚拟加速度响应,从而得到机车在不同等效锥度下前后测点的横向平稳性指标,以此作为高速机车横向动力学性能指标对迭代学习控制及存在时滞的控制效果做分析和研究.

2 主动控制策略设计

2.1 控制算法选择

机车投入使用后,会有很长一段时间在相同线路上往复运营,其间车载检测设备会存储大量机车运行相关信息,如机车横向位移、速度等周期数据,且考虑到机车在运营过程中,由于踏面磨耗会导致轮轨接触等效锥度逐渐变化,因此可以利用这些准周期数据,通过迭代学习方法实现针对不同轮轨接触等效锥度的自适应主动控制,其流程如图2所示.

图2 自适应主动控制系统框图Fig.2 Block diagram of adaptive active control system

通过对机车重复运营中采集到信息的预处理,可以将机车各部分的横向位移、速度等信息传至控制决策系统,轮轨接触信息则传至优化后控制参数库进行匹配,针对运营过程中等效锥度变化,选择最优反馈系数,以达到更好的主动控制效果.

2.2 最优迭代参数库的建立

机车模型转化为状态空间方程的形式表示为:

(9)

其中状态反馈控制器U可表示为如下形式:

U=-K1X

(10)

式中,K1为状态控制反馈系数矩阵,X为系统的状态向量.为使控制器达到稳定,将式(10)代入式(9)中,有

(11)

对式(11)中的线性状态空间模型,应用多目标优化方法[12]筛选最优迭代参数,设置机车前后转向架横向加速度ayt1、ayt2及车体横向平稳性Wy为优化目标,同时针对迭代参数C1、C2进行优化.可将该多目标问题表示如下:

min{Wy,ayt1,ayt2}

(12)

考虑到NSGA-Ⅱ算法在解决多目标优化问题上具有能够保留种群多样性,计算速度快的优势.因此本文选择带有精英策略的快速非支配排序遗传算法优化求解.

以低锥度工况为例,图3为等效锥度λ=0.05时三种优化目标的Pareto前沿,纵轴横轴分别为前、后转向架处横向加速度ayt1、ayt2,散点颜色代表车体横向平稳性指标,颜色越浅表示机车横向平稳性指标Wy值越小,表明系统平稳性越好.根据计算结果,选取ayt1,ayt2分别小于6.22m/s2及3.36m/s2,Wy小于2.36作为符合机车动力学性能的条件,对应于图中红圈部分,根据该范围可提取对应迭代参数,存储于控制参数库.以此类推参数库内其他轮轨接触状态时对应的参数值,进而实现自适应控制.

图3 动力学性能多目标优化Pareto前沿Fig.3 Pareto frontier for multi-objective optimization of dynamic performance

2.3 PD型学习控制器[13]

迭代学习控制是通过对往次运行信息的处理来修正当前次运行的控制数据,进而实现在逐次迭代中实际输出向期望数据的逼近.

合适的控制律能减少迭代次数并加快收敛速度,针对线性时变连续的机车系统,本文选取PD型闭环迭代学习控制律,分别以车体前后司机室位置处作为反馈信号来源,控制律的拉氏变换表达式如下:

Uk+1(s)=Uk(s)+[C1(s)+sC2(s)]Ek+1(s)

(13)

Ek(s)的收敛条件为:

‖1-p(s)q(s)‖∞<1

其中Uk+1(s)、Uk(s)分别为第k+1次和第k次迭代周期中控制力,Ek+1(s)为第k+1次迭代周期中跟踪误差,被视为k+1次迭代中对第k次输入向量Uk(s)的修正项.通过上一节中多目标优化算法的选取,C1=1488,C2=864为定常学习增益.

PD型迭代学习控制的闭环图如图4所示,其中S-Function1模块表示轨道不平顺为德国高干扰下的高速机车模型.将最优反馈参数库中匹配的反馈参数代入PD学习控制的S-Function模块中.控制力向量uk(t)由式(13)计算,并作为S-Function1模块的输入来抑制车体的横向加速度波动,其中uk-1(t)是存储于前一次迭代后的数据.

图4 PD型闭环迭代学习控制图Fig.4 PD type closed-loop iterative learning control diagram

2.4 自适应主动控制结果

为验证利用虚拟激励法处理下高速机车模型的自适应主动控制迭代效果,采用频域平稳性指标表征其迭代过程中的横向动力学性能,在MATLAB中建立机车及控制模型进行仿真.轨道不平顺选用德国高干扰轨道谱,仿真验证中考虑机车运行速度为200 km/h,采用PD型ILC方法在频域内对高速机车横向平稳性进行了十次迭代,图5和图6分别为是否考虑运营过程中轮轨接触等效锥度变化的两种工况.图中横轴分别为迭代次数和运营中等效锥度值变化,纵轴为横向平稳性指标.

由图5和图6可知:在PD型迭代学习控制律下不考虑等效锥度变化的机车横向平稳性指标在迭代过程中得到明显改善并在第6次迭代基本收敛,横向频域平稳性指标由被动控制下的2.35降至2.06.考虑等效锥度变化时,图6中可明显看出,当等效锥度随着运营里程不断增加,其横向平稳性也逐渐恶化,但施加迭代学习控制可以显著改善横向平稳性,且自适应迭代学习策略控制效果要优于非自适应迭代学习.通过三种控制策略对比,本文提出的自适应控制参数选取方案较之于被动控制和迭代学习策略对控制效果的改善具有明显优势.

3 时滞系统动力学性能

本文运用一种PD型迭代学习控制器,该控制器为具有反馈环节的闭环控制系统,因此由执行器的检测和处理所引起的时滞及延迟是不可避免的.时间延迟对系统动态性能的影响显而易见,本节采用一种变式的连续时间近似(CTA)方法分析了时滞对文中所提出的迭代学习控制器的影响.

图5 低锥度工况横向平稳性指标Fig.5 Lateral riding index in low equivalent conicity condition

图6 三种控制策略下随轮轨接触锥度变化的平稳性指标Fig.6 Riding index varied with wheel-rail contact conicity under three control strategies

3.1 连续时间近似方法[14-16]

通过遵循半离散化的思想,离散划分时延τ,将状态变量扩展为涵盖所有时延分量时刻的形式:

X(t)=[x(t),x(t-τ1),…,x(t-τN)]T

(14)

此时可以将系统的状态空间表达式在考虑时滞的情况下可以写成如下形式:

(15)

I为与A维度相同的单位矩阵.

3.2 控制系统时滞影响

根据经验,时滞会恶化系统控制效果.闭环迭代学习控制系统中,机车的控制输入与作动器产生控制力之间必定存在时滞,因而无法准确对运行过程中每一时刻精确施加控制,此时需要控制延迟时间在可接受范围内.

本节以机车模型为研究对象,运用连续时间近似方法,将200 km/h低锥度工况下的横向平稳性指标Wy作为评价指标,以时滞100 ms、300 ms为例,采用自适应迭代学习控制流程进行仿真.仿真结果对比见图7,图中横轴和纵轴分别为等效锥度变化和横向平稳性指标.

图7中,蓝色和红色曲线分别为时滞100 ms和300 ms时自适应迭代控制策略下横向平稳性指标随等效锥度的变化;黑色曲线作为对比,为无控制平稳性指标.由图可知,时滞300 ms时迭代学习控制无法保证轮轨接触锥度增加至0.19后的机车横向平稳性;而时滞100 ms时该方法仍能改善横向平稳性指标至少3.55%.因此文中提出的迭代学习控制方法在一定范围内的时滞仍能起到对平稳性的改善作用.故当系统不可避免的产生时滞时,应当尽可能减少时滞到可接受范围内,以改善控制性能.

图7 时滞对自适应迭代学习控制效果影响Fig.7 Effect of time delay on adaptive iterative learning control

3.3 时滞系统平稳性

为探究迭代学习控制器下,线性时滞系统的时间延迟对系统频域平稳性的影响规律,采用CTA方法进一步分析.在这部分研究中,状态向量的延迟部分被扩展到10等分,对时间延迟分布在1 ms至10 s范围内的两种轮轨接触等效锥度工况进行分析,结果如图8、图9所示.

图8 低锥度工况横向平稳性受控制时滞影响Fig.8 Effect of lateral riding index on time delay in low equivalent conicity condition

图8和图9分别为低锥度和高锥度工况下平稳性指标随时延增大变化的结果,横轴为控制系统时滞,纵轴为经过十次迭代后机车横向平稳性指标.两种工况下的变化规律基本一致.高锥度工况下,当延迟τ小于100 ms,机车横向平稳性略微改善,Wy由2.49降低至2.47;当延迟大于100 ms,Wy突增至3.11,系统横向平稳性迅速恶化.低锥度工况下,Wy在时延100 ms的时间内由2.03降低至2.01,当延迟超过100 ms,Wy突增至3.43.

图9 高锥度工况横向平稳性受控制时滞影响Fig.9 Effect of lateral riding index on time delay in high equivalent conicity condition

由此可知,无论高低锥度工况,一定范围内时滞的增加对系统横向平稳性具有改善作用,但时滞过大会导致横向平稳性急剧恶化,因此避免时滞过大即可保证高速机车运行时的横向平稳性.

4 结论

本文主要针对含有时滞的高速机车二系横向主动闭环自适应迭代学习控制策略问题进行分析,主要结论如下:

(1) 结合虚拟激励法计算频域平稳性指标,基于迭代学习方法的二系横向主动自适应控制能够明显改善机车横向平稳性指标.在轮轨接触等效锥度随运营里程变化的工况下,主动自适应控制策略对横向平稳性指标的改善明显优于定参数的迭代学习策略.

(2) 在考虑控制时滞时,仿真结果表明:在一定控制时滞范围内,自适应迭代学习控制方案仍能够提供较好的控制效果,对于高低锥度工况、时滞工况均具有良好的适应性.

(3) 高低两种锥度工况下,控制系统时滞在100 ms以内,时滞对控制性能影响较小,当时滞超过100 ms时,控制性能将明显恶化.

猜你喜欢

锥度平稳性轮轨
基于非平稳性度量的数字印章信息匹配
中低速磁浮道岔与轮轨道岔的差异
基于递归量化分析的振动信号非平稳性评价
次级线圈绕线锥度对LVDT静态特性的影响
高速钢电火花线切割锥度加工试验研究
等效锥度曲线非线性特性及影响研究
无键锥度液压联接在大功率高转速偶合器中的应用
高重合度齿轮传动的平稳性分析及试验
中低速磁浮与轮轨交通信号系统的差异
信贷资源配置与我国经济发展平稳性