APP下载

基于博弈论的导弹机动突防策略研究①

2014-03-15田海鹏胡伟华

固体火箭技术 2014年3期
关键词:弹头机动指令

雷 刚,田海鹏,鲜 勇,胡伟华

(1.西北工业大学 航天学院,西安 710072;2.第二炮兵工程大学,西安 710025; 3.96271部队,宜阳 471600;4.第二炮兵驻航天四院军代室,西安 710025)

0 引言

博弈论是研究决策主体行为发生直接相互作用时的决策及这种决策的均衡问题,即当一个主体的选择受其他个体选择的影响,而且反过来影响其他个体选择时的决策问题和均衡问题,是研究决策问题的重要理论。

将导弹突防研究中拦截方的拦截策略作为己知,来研究突防的最优控制问题,称之为最优突防。在突防策略研究中,通常构建系统数学模型考虑指令与加速度间的动态特性、机动载荷的限制,定义脱靶量并把它和指标函数联系起来[1]。然而,用最优控制方法和微分对策来研究突防策略时,如系统模型过于复杂,即使问题的最优解存在,但在限定时间内通常求不到解。

矩阵博弈方法是将研究对象的状态变量和控制策略分别在时间和控制性质上离散化后的一种研究方法,其解是次最优的[2]。该方法需要进行大量数据分析,得到的结果即为最优策略集,突防方可根据支付函数采取相应的策略,即突防方自主完成突防任务,从而使导弹突防趋于智能化。

1 基于博弈论的导弹突防问题分析

制定导弹机动策略的过程需要对双方拦截状态进行大量仿真计算。由于弹上计算能力有限,因此弹上实时生成实时突防策略的能力有限。基于此,本文针对导弹和EKV拦截末段的飞行过程,运用博弈理论求解导弹实时机动策略,并形成机动策略序列。通过设定导弹完成试探性机动后,在EKV不同的导引系数条件下,导弹红外探测系统测得的EKV到弹头的视线偏航角不相同,从而使导弹通过试探性机动计算得到EKV比例导引系数和EKV到导弹的视线偏航角信息与机动策略序列具有的对应关系。

假设EKV采用扩展比例导引律,对不同的导引系数条件下分别进行仿真,得到6组EKV机动策略序列,构成策略库。

在导弹发射前将机动策略库装订到弹上,导弹在实际飞行中通过试探性机动,识别出EKV扩展比例导引律后,将导引系数和EKV到弹头视线偏航角作为输入信息,弹机从机动策略库中读取相应的机动策略序列,从而实现导弹机动突防。

1.1 博弈论方法建模

设导弹为局中人1,EKV为局中人2,导弹支付为脱靶量M,EKV支付即为脱靶量的负值(-M),双方博弈的目的都是想实现各自的支付尽量大。可将博弈的过程根据时间划分为不同阶段,在每个突防阶段,导弹和EKV进行博弈。从而将该本问题视为二人零和有限重复的博弈数学问题。

当拦截器与目标机动比μ≥2时,就能产生较小的脱靶距离[3]。由于EKV最大加速度为4g,可设定导弹侧喷发动机的加速度为2g。在突防-拦截博弈中,定义局中人1的策略集为

S1={以2g的加速度垂直射面负向机动,不做机动,以2g的加速度垂直射面正向机动}

局中人2的策略集为

S2={根据导引律进行机动,不做机动}

规范化策略集即得

S1={1,0,-1},S2={1,0}

在导弹飞行中,记博弈的第一阶段为I1,每个博弈阶段持续时间为T,则(t2+T)时刻为I1的结束时刻,同时可记为I2的开始时刻。在攻防结束时,博弈过程即结束。

1.2 博弈问题的求解

1 0

式中A为局中人1的赢矩阵。

在各阶段博弈中取脱靶量15 m作为导弹突防成功阀值,脱靶量4.5 m为EKV拦截成功阀值(脱靶量小于4.5 m时EKV处于零控拦截状态[4])。当EKV与导弹博弈预期值小于导弹突防成功阀值时,导弹采用反向机动方式规避EKV的拦截。在每一个制导周期,根据当前导弹和EKV运动状态,对下一个制导周期分别采用不同策略时的脱靶量值进行预测计算,依据脱靶量确定下一个制导周期机动策略,过程如下:

(1)若导弹采用1机动策略,预测脱靶量大于当前预测脱靶量时,则采用正向机动策略;

(2)若导弹采用0机动策略,预测脱靶量大于当前预测脱靶量时,则采用不机动策略;

(3)若导弹采用-1机动策略,预测脱靶量大于当前预测脱靶量时,则采用负向机动策略。

2 机动策略库制备

假设导弹垂直射面负向机动的时间为8 s,令t1为EKV捕获导弹的时刻,t2为博弈的起始时刻,则有t2=t1+8 s。

假设导弹和EKV的相向运动,且导弹和EKV的速度在oxm轴和oym轴方向的分量较大,导弹和EKV沿oxm轴和oym轴方向的速度分量在博弈时变化不大,故可预估博弈的终止时刻。经计算EKV实施末段拦截的有效时间约为16.39 s。因此,博弈终止时刻约为t3=t1+16.39 s。

设每个博弈阶段持续时间T=0.2 s,可分别制备EKV的导引系数K=i(i=1,…,6)时的机动策略:

(1)输入博弈阶段起始时刻导弹、EKV的位置和速度信息;

(3)根据预测脱靶量,按照上节所确定的机动准则,确定t=(j+1)*T时刻机动策略;

(4)循环1~3步直至博弈终止时刻,导弹不再机动。

每个周期机动策略计算流程如图1所示。

每隔0.2 s记录导弹的机动指令,形成一组导弹机动控制指令序列{u(k)}。

由于基于博弈理论求解的导弹机动控制指令序列{u(k)}中控制指令数量较大,不利于弹上数据存储。因此,可将控制指令序列进行压缩。

图1 博弈值的计算流程

压缩编码时,每2个数字为1组。其中,第1个数表示机动指令的重复个数;第2个数为对应的机动指令。如控制指令序列为{0 0 0 0 1 1 1 0 -1 0 0 0},压缩后得到新的序列可列写为{(4,0),(3,1),(1,0),(1,-1),(3,0)}。

根据EKV扩展比例导引律可能采取的不同比例导引系数,设计获得6组机动策略序列,组成机动策略库。机动策略库装订到弹上后,弹上将根据EKV比例导引参数读取机动策略库中对应的机动策略序列。

按上文所述方法最终得到装订到弹上机动策略库:

其中,第i行的数据记为Ci={(Ni1,Oi1),(Ni2,Oi2),(Ni3,Oi3),…},即为EKV采用导的引系数K=i(i=1,…,6)所对应的导弹要采用的机动策略序列。

3 弹上机动策略确定

导弹发射前,将机动策略库装订在弹上,根据辨识出的EKV导引参数,从策略库中读取对应机动策略。例如,辨识出EKV导引参数等于i时,弹头选择机动策略Ci,机动指令计算方法如下:

(1)当t

(3)当t>t3时,弹头不再机动。

4 仿真结果及分析

当K=3时,弹机从策略库中选取策略序列C3,导弹按照指令序列进行机动。通过仿真计算,最终得出EKV脱靶量为8.5 m,即EKV拦截失败。仿真得到的弹头机动策略如图2所示,对应EKV机动方向如图3所示,EKV测得的弹头视线角变化情况如图4所示,各博弈阶段脱靶量如图5所示。

从图2~图5可看出:

(1)EKV机动指令滞后于导弹机动指令,说明EKV是在探测到导弹机动状态变化到一定程度后才开始机动,符合实际情况;

(2)每个博弈周期EKV的机动指令宽度小于导弹机动指令宽度,符合EKV机动加速度大于导弹机动加速度的实际情况;

(3)尽管导弹机动加速度小于EKV的机动加速度,但最终脱靶量大于4.5 m,说明导弹采用博弈机动策略可实现有效突防。

图2 K=3时导弹机动指令

图3 K=3时EKV机动情况

图4 K=3时EKV测得弹头视线角变化

图5 K=3时各博弈阶段脱靶量

当EKV扩展比例导引律的导引系数K=i(i=1,2,3,4,5,6)时,采用机动指令、EKV机动方向随时间变化情况和各博弈阶段脱靶量仿真结果均大于4.5 m(见表1)。

表1 EKV采用不同比例导引律脱靶量和导弹正负向机动指令数

由于本文假设在理想状态下EKV发动机能够瞬间产生需要的加速度,因此K取值越大,则EKV的加速度越大,即EKV机动能力越强[5]。所以,出现了K值越大,则脱靶量越小的规律。

从表1可见,随着EKV比例导引系数增大,导弹机动指令数也增大。说明在导引系数变大时,弹头需要消耗更多能量来摆脱EKV拦截。由于EKV在实际飞行中选取较大比例导引系数会引起系统整个大回路抑制噪声能力下降,所以EKV在选取比例导引系数时,需考虑系统降噪能力[6]。

5 结束语

导弹机动突防策略中的博弈理论的运用,可有效提高导弹的智能化水平。本文通过仿真实现了一种在导弹机动加速度小于EKV机动加速度时仍能利用博弈式机动策略实现有效突防的方法,为导弹机动突防策略研究提供一种思路。该方法尚未考虑导弹和EKV的测量误差、推力偏差以及其动态响应过程,还有待进一步深入研究。

参考文献:

[1] 汪民乐.弹道导弹突防效能研究综述[J].战术导弹技术,2012(1):1-6.

[2] Austin F,Carbone G,Hinz H,et al. Game theory for automated maneuvering during air-to-air combat [J]. Journal of Guidance,Control,and Dynamics,1990,13(6):1143-1149.

[3] 马俊声.博弈论——机动弹头攻防的核心[J].航天电子对抗,2005,22(1):4-6.

[4] 冯杰,鲜勇,刘顺成,等.基于零控拦截的EKV末段拦截弹道仿真 [J].飞行力学,2010,28(2):75-77.

[5] 张义广,杨军,朱学平,等.非制冷红外成像导引头[M].西安:西北工业大学,2009.

[6] 程风舟,陈士橹.拦截弹头的修正比例导引律[J].空军工程大学学报,2003,4(4):15-18.

猜你喜欢

弹头机动指令
热身管下小口径枪弹弹头壳材料对其膛内运动的影响规律
《单一形状固定循环指令G90车外圆仿真》教案设计
简析80C51单片机的数据传送类指令
12万亩机动地不再“流浪”
机动三轮车的昨天、今天和明天
导弹突防概率解析与仿真计算结果差异分析
滚转机动载荷减缓风洞试验
中断与跳转操作对指令串的影响
MAC指令推动制冷剂行业发展