APP下载

基于零控脱靶量的卫星末端追逃控制方法

2016-12-19王强叶东范宁军吴炎烜

北京理工大学学报 2016年11期
关键词:矢量幅值航天器

王强, 叶东, 范宁军, 吴炎烜

(1.北京理工大学 机电学院,北京 100081;2.国防知识产权局,北京 100088;3.哈尔滨工业大学 卫星技术研究所,黑龙江,哈尔滨 150001)



基于零控脱靶量的卫星末端追逃控制方法

王强1,2, 叶东3, 范宁军1, 吴炎烜1

(1.北京理工大学 机电学院,北京 100081;2.国防知识产权局,北京 100088;3.哈尔滨工业大学 卫星技术研究所,黑龙江,哈尔滨 150001)

针对拦截卫星和目标航天器都可以采用幅值受限连续推力进行轨道机动时的卫星末端拦截控制问题,由于对抗双方都会采用对自己有利的控制策略来实现追击和逃逸,因此将该问题可以看作追踪逃逸问题. 由于两卫星距离较近,因此将非线性拦截逃逸相对动力学简化为CW方程. 根据拦截任务终止要求引入零控脱靶矢量将动力学方程降阶,采用拦截脱靶量和燃料消耗作为二次最优目标函数,推导了卫星轨道次优控制策略. 仿真表明该控制方法可以在目标卫星具有机动逃逸能力时仍能成功将其拦截.

卫星追逃;连续推力;零控脱靶量;燃料子优控制

卫星作为航天器的主体为国家安全提供重要的保障,它可以为指挥者制定作战策略提供有效战场信息,为导弹、飞机等传递制导导航指令,为地面其他作战单元提供环境信息和作战命令. 因此采用携带战斗部或软杀伤武器的拦截卫星,在战争时期对于战场上方或者本国领土上方空域的侦查卫星和预警卫星进行拦截可以保证己方在作战中具有优势.

当拦截卫星和目标之间的距离很近时,认为卫星拦截过程进入到终端拦截,此时拦截卫星自身携带的电子侦测设备可以识别并定位目标卫星. 学者们对于目标卫星无法进行机动时拦截卫星的控制策略进行充分的研究. 高晓光等[1]基于改进高斯法(IGM)和遗传算法(GA)的混合优化算法,为解决空间拦截轨道燃料消耗和转移时间的综合最优问题,提出一种空间拦截轨道设计方法. Lu S等[2]针对目标航天器运行轨道为椭圆且星间无通信时卫星交会问题,采用Lawden方程作为动力学模型,提出了一种幅值有限连续推力交会的自适应轨道控制方法. 变推力发动机可进行闭环控制,精度极高. Singla等[3]针对星载设备测量不确定性,根据输出反馈控制提出了结构模型参考自适应控制器,并将其应用在卫星自动交会过程中.

目标轨道静止时卫星交会和拦截的研究技术已经在航天工程领域得到应用. 但对于拦截问题,更严格的场景中目标航天器也可以实施轨道机动对拦截器进行躲避. 此时该问题可以看作卫星非合作交会对接,邬树楠等[4]针对快速接近非合作目标航天器任务,提出了一种基于观测器的相对轨道有限时间控制算法. Gao H等[5]针对卫星交会中存在的参数不确定,未知干扰和控制输入受限等问题,基于Lyapunov稳定理论提出了一种H1状态反馈鲁棒控制器. 作者将多个控制目标,转化为线性矩阵不等式,求解得到有效控制参数.

上述方法在求解控制策略时已经考虑了目标的机动能力,但它们并没有考虑拦截和目标卫星机动的最优性. 更合理的方法将该问题看作零和微分对策问题,Iaacs首先在该领域展开研究,并将对策双方都选择对自己有利的控制策略时的解定义为鞍点解[6]. Menon[7]利用反步法和二次目标函数得到控制输出具有饱和特性时航天器追逃问题的反馈控制策略,然而其仿真中所用推力加速度很大不具有工程意义. Mauro等将拦截问题转化为TPBVP,提出半直接法来求解鞍点解. 该方法被应用在两航天器远距离攻防拦截逃[8]问题中. Stupik[9]采用Kriging方法在CW方程的基础上研究了卫星攻防实时反馈解的求取,文章利用打靶法计算不同初值时的双边最优解,并将这些最优解进行插值获得初态域和干扰有限时的次优反馈控制策略.

上述方法求解得到的是双边最优控制开环解,不能直接为拦截卫星提供有效的实时反馈控制. 本文将研究拦截卫星和目标航天器都采用幅值受限连续推力进行轨道机动时的末端拦截问题,由于拦截卫星和目标会采用对自己有利的控制策略,因此采用微分对策理论进行分析. 两卫星相对距离较近,因此非线性相对动力学模型将被简化为CW方程. 通过引入零控脱靶矢量对系统降维,联合燃料消耗和拦截脱靶量构建对策目标函数,推导了燃料次优反馈控制策略. 通过仿真分析了所提出方法的优缺点.

1 相对动力学模型

如图1所示,在拦截卫星P附近建立虚拟卫星O轨道,以O为原点建立相对轨道坐标系Oxyz,其中Ox轴指向卫星O的位置矢量r1方向,Oz轴沿轨道角动量矢量方向,Oy轴在轨道与Ox,Oz成右手系. 假设:① 卫星P为质点模型;② 虚拟卫星O无机动;③ 忽略地球非球形摄动,大气阻力摄动,太阳光压和其他天体产生的引力摄动项的影响. 最后两项假设可以保证参考卫星轨道的形状不发生变化.

令拦截卫星P在惯性坐标系下的位置矢量为r2,可得到两星在赤道惯性坐标系下的动力学方程为

(1)

(2)

虚拟卫星轨道坐标系为旋转动坐标系,则由矢量求导关系可得

(3)

式中:δr′表示δr的相对导数;Ω为虚拟轨道角速度.

(4)

式中:u=[uxuyuz]为拦截卫星推力加速度矢量;

式(4)称为CW方程,其线性形式给卫星交会和拦截的求解带来了方便. 文献[4-5]中给出的轨道动力学模型假定目标航天器静止或加速度极小,因此其动力学模型与本文有区别.

(5)

其中Φ11,Φ12,Φ21,Φ22可参考文献[9]给出.

假设拦截卫星P和目标E相对距离远小于两星质心到地心的距离,则可在其附近设置虚拟卫星,分别对拦截卫星和目标,在该虚拟卫星轨道坐标系下建立相对轨道运动学方程,可得如下式

(6)

式中xP,E分别为拦截卫星和目标在虚拟轨道坐标系下的状态.uP,E为两星的推力加速度. 它们满足如式(7)所示幅值限制

(7)

为分析简单,将拦截卫星和目标的相对位置和速度作为新状态xPE=xP-xE,对xPE求导可得

(8)

其中C=-B.

z方向运动与轨道面内运动解耦,后面的控制器设计和分析只针对轨道面内运动,此时系统方程与式(4)相似,但参数矩阵发生变化.

2 卫星追踪逃逸的次优控制策略

由于卫星自身携带燃料的约束,卫星拦截时间有限. 而在追踪逃逸过程中,拦截卫星与目标围绕拦截结束时的距离展开争夺,因此只考虑两星的位置矢量,引入零控脱靶矢量(ZEM)来将系统的维度降低[10]

Z(t)=DΦ(tf,t)xPE(t)=

(9)

式中:tf为卫星拦截结束时间;Φ(tf,t)为xy方向动力学系统从时间t运动到tf时的状态转移矩阵;Z表示系统从t时刻无控转移到末端时的脱靶矢量,根据系统理论可得零控脱靶矢量的状态转移矩阵满足

(10)

对零控脱靶矢量关于时间求导可直接得到动力学方程

(11)

式中系数矩阵BP=-CE=Φ12(tf,t).

在卫星追踪逃逸过程中,拦截卫星和目标尽可能使脱靶量对自己有利,因此定义脱靶量为终端目标函数;为延长拦截卫星作用时间,得到反馈控制输出,因此附加燃料消耗项作为过程控制目标函数. 最终的目标函数为

(12)

式中:Q=qI2>0为二次系数矩阵;RP和RE都为正定矩阵. 而γ依赖拦截卫星和目标的推力,定义了前者机动能力优于后者的程度. 系统的哈密顿函数如下式.

(13)

式中λ为系统状态的协态变量.

为得到反馈控制器,先假设两星的控制输出满足式(7)给出的幅值约束. 对系统哈密顿函数使用极大极小值可得拦截卫星和目标航天器的控制输出为

系统的共轭方程和协态变量终端条件如下

(15)

则有λ=λ(tf)=QZ(tf). 将两星控制输出带入到系统动力学方程中可得

对式(16)积分,并带入协态变量整理后可得终端时刻的零控脱靶矢量为

Z(tf)=F-1(tf,t)Z(t).

(17)

其中

令RP=RE=RI2,Q=qI4,定义拦截剩余时间为tgo=tf-t,因此F(tf,t)可以如下给出

(18)

将式(18)带入到(14)中,可得反馈控制的显式形式为

uP=-q/RF-1Z, uE=-q/(Rγ2)F-1Z.

(19)

该控制策略具有最优性[11]. 系统闭环轨迹可将控制输出带入方程中积分得到.

若预期控制指令幅值超过推力上限,则无法得到最优控制. 下面给出一个可以实用的次优控制策略.

对于变量x定义它的饱和函数为[12]

对于哈密顿函数,利用函数取极大极小值的必要条件得到两星最优控制输出,并将其带入到状态方程,可以得到

此时系统共轭方程和横截条件与式(15)相同,对式(21)积分,可以得到终端时刻零控脱靶矢量满足式(22)

(22)

式中Z(tf)为饱和函数的自变量,无法得到解析Z(t),为了给出反馈解,依然假设等式成立. 此时拦截卫星和目标航天器的控制输出可如下给出

综上,考虑目标航天器的机动能力时,两星的反馈控制策略可如式(23)给出,明显只有当拦截卫星和目标的预定控制输出满足式(7)的幅值约束时,该策略为最优控制,否则非最优.

3 仿真和控制性能分析

假设拦截卫星和目标航天器都在地球同步轨道周围运动,则将虚拟卫星选为GEO上轨道与这两星相近的卫星. 轨道角速度为ω=7.272 2×10-5rad/s. 拦截和目标卫星的推力加速度幅值上限分别为ρP=0.686 m/s2和ρE=0.343 m/s2,分别对两组算例进行仿真.

① 拦截卫星和目标初始时刻的状态分别为

[-2,-1,0.005,0.001]T,[0,0,0,0]T,即目标卫星初始时刻与虚拟卫星位置相同,其中位置与速度的单位分别为km和km/s. 其他参数为R=1,Q=1,γ=2. 对拦截结束时间在200~2 000 s变化的拦截逃逸场景进行仿真,统计两星拦截结束时的距离,可得图2,可以看到,脱靶量随拦截结束时间增大而减小,只有当拦截结束时间大于500 s时,脱靶量才能小于50 m. 当拦截时间为200 s时,脱靶量为149.89 m,大于100 m,可认为拦截失败. 当拦截时间为600 s时,脱靶量为32.49 m. 此时两星的相对距离如图3所示. 图4给出两星的拦截逃逸轨迹. 可以看到随着剩余时间减少,两星的相对位移逐渐减少,在拦截时刻,y方向的相对位移收敛到较小值,而x方向仍有较小位置差异.

图5和图6给出了600 s时两星在拦截逃逸过程中的推力加速度的变化曲线. 可以看到,两星在初始时刻都不采用幅值最大的控制策略,直到拦截快要结束时,拦截卫星最先开始使用最大幅值输出控制,而目标卫星的控制输出也逐渐增大到最大幅值.

② 拦截卫星和目标初始状态分别为[-2.000,1.000,0.005,0]T和[2.000,-1.000,-0.005,0]T,即两星关于状态空间零点对称. 拦截结束时间为1 000 s,可得拦截过程中两星相对位置的变化曲线和两星轨迹如图7和图8所示.

此时由于拦截卫星初始时刻具有x正方向的速度,因此会先向右运动,而随后由于目标卫星向左运动,又向右运动追击目标. 图9和图10给出了两星的加速度曲线,明显此时拦截卫星和目标在拦截结束时刻的加速度幅值也迅速变大,直到达到上限.

上面两个仿真工况中,拦截卫星和目标航天器的控制矢量实时同向,这可以由式(23)得到,具体由于式(20)给出的饱和函数只改变自变量的幅值大小,而保留了它的方向性质,因此拦截卫星和目标的控制向量实时共线,同向可以从式(23)中的负号以及BP=-CE得到.

4 结 论

研究了拦截卫星和目标航天器都采用幅值有限连续推力进行变轨时的卫星末端拦截轨道控制问题. 由于两卫星相对距离较近,因此可以在其附近建立虚拟卫星轨道,进而简化相对运动方程得到拦截逃逸动力学模型. 通过引入零控脱靶矢量可以将系统方程降维. 利用微分对策理论推导了系统的鞍点平衡解,最后得到了拦截卫星在考虑目标最优机动下的次优反馈控制律. 仿真表明了该控制策略的有效性,并表明采用该策略时,拦截结束时间增加,拦截脱靶量减小;拦截卫星和目标在追踪逃逸过程中任何时刻的控制推力同向,而推力幅值刚开始时变化较小,拦截结束前迅速增加,最后达到卫星所能提供的最大推力.

[1] 高晓光,汤洪,端军红.基于混合优化算法的空间拦截轨道优化设计[J].北京航空航天大学学报,2015,41(9):1574-1581.

Gao Xiaoguang, Tang Hong, Duan Junhong. Space interception orbit optimization design based on hybrid optimal algorithm[J]. Journal of Beijing University of Aeronautics and Astronautics, 2015,41(9):1574-1581. (in Chinese)

[2] Lu S, Xu S. Adaptive control for autonomous rende-zvous of spacecraft on elliptical orbit[J]. Acta Mecha-nica Sinica, 2009,25(4):539-545.

[3] Singla Puneet, Subbarao Kamesh, Junkins John L. Adaptive output feedback control for spacecraft rendezvous and docking under measurementuncer-tainty[J]. Journal of Guidance, Control, and Dynamics, 2006,29(4):892-902.

[4] 邬树楠,吴国强,孙兆伟.接近非合作目标的航天器相对轨道有限时间控制[J].大连理工大学学报,2013,53(6):885-892.

Wu Shunan, Wu Guoqiang, Sun Zhaowei. Spacecraft relative orbit finite-time control for proximity to non-cooperative strategy[J]. Journal of Dalian University of Technology, 2013,53(6):885-892. (in Chinese)

[5] Gao H, Yang X, Shi P. Multi-objective robust control of spacecraft rendezvous[J]. IEEE Transactions on Control Systems Technology, 2009,17(4):794-802.

[6] Isaacs R. Differential games: a mathematical theory with applications to warfare and pursuit, control and optimization[M]. [S.l.]: Courier Dover Publications, 1999.

[7] Menon P K A, Calise A J, Leung S K M. Guidance laws for spacecraft pursuit-evasion and rendezvous[C]∥AIAA Guidance Navigation and Control. [S.l.]: AIAA, 1988:668-697.

[8] Conway B A, Pontani M. Numerical solution of the three-dimensional orbital pursuit-evasion game[J]. Journal of Guidance, Control, and Dynamics, 2009,32(2):474-487.

[9] Stupik J, Pontani M, Conway B. Optimal pursuit-evasion spacecraft trajectories in the hill reference frame[C]∥Proceedings of AIAA/AAS Astrodynamics Specialist Con-ference. Reston, VA: AIAA, 2012:4882.

[10] Rubinsky S, Gutman S. Vector guidance approach to three-player conflict in exoatmospheric interception[J]. Journal of Guidance, Control, and Dynamics, 2015,38(12):2270-2286.

[11] Bardhan R, Ghose D. Intercepting maneuvering target with specified impact angle by modified SDRE technique[C]∥Proceedings of 292 American Control Conference (ACC). [S.l.]: IEEE, 2012:4613-4618.

[12] Rusnak I, Meir L. Optimal guidance for high-order and acceleration constrained missile[J]. Journal of Guidance Control & Dynamics, 1991,14(3):589-596.

(责任编辑:刘雨)

Terminal Orbital Control of Satellite Pursuit Evasion Game Based on Zero Effort Miss

WANG Qiang1,2, YE Dong3, FAN Ning-jun1, WU Yan-xuan1

(1.School of Electromechanical, Beijing Institute of Technology, Beijing 100081, China;2.National Defense Intellectual Property Office, Beijing 100088, China;3.Institute of Satellite Technology, Harbin Institute of Technology, Harbin, Heilongjiang 150001, China)

In the satellite interception control strategies, both the interceptor and target could perform orbital maneuver with limited magnitude continuous thrust. Basically, this problem was regarded as a pursuit-evasion game since satellites in both sides would try their best to catch or escape. Assumption that the two player were close such that the nonlinear interception dynamics could be reduced to the CW equations. Zero effort miss was introduced to simplify the system. The controller was constructed by adding the interception miss and the fuel consumption to the optimal objective. Simulation was conducted to analyze the advantage and weakness of proposed control strategy.

satellite pursuit-evasion game; continuous thrust; zero effort miss; fuel suboptimal control

2015-11-17

中央高校基本科研业务费专项资金资助项目(HIT.NSRIF.2015033);微小型航天器技术国防重点学科实验室开放基金资助项目(HIT.KLOF.MST.201501)

王强(1977—),男,博士生,E-mail:yeboyansha@163.com.

叶东(1985—),男,博士,讲师,E-mail:yed@hit.edu.cn.

V 27

A

1001-0645(2016)11-1171-06

10.15918/j.tbit1001-0645.2016.11.014

猜你喜欢

矢量幅值航天器
2022 年第二季度航天器发射统计
室温下7050铝合金循环变形研究
一种适用于高轨空间的GNSS矢量跟踪方案设计
矢量三角形法的应用
2019 年第二季度航天器发射统计
2018 年第三季度航天器发射统计
2018年第二季度航天器发射统计
推力矢量对舰载机安全起降的意义
可靠性步进电机细分驱动技术研究
平地机作业负载谱分析