基于离散力学追逃问题的半直接数值解法

2020-05-11肖遥冮铁强

科技资讯 2020年6期

肖遥　冮铁强

摘要：該文结合了变分法和离散力学，提出一种新的半直接追逃问题的数值求解方法。首先利用变分法将微分对策问题转化为含约束的最优控制问题，再结合离散力学理论将最优控制问题转化为非线性规划问题，最后使用序列二次规划（SQP）方法进行数值求解。以小车追逃模型作为算例验证了该方法的正确性。

关键词：追逃问题变分法离散力学

中图分类号：O3 文献标识码：A 文章编号：1672-3791（2020）02（c）-0213-02

20世纪50年代，Isaacs 等人首先提出了用微分对策求解追逃问题。但是微分对策问题的求解一直是一个难题，很多学者对于追逃问题的数值求解方法进行了大量的研究。徐光延等人[1]使用变分法将微分对策问题转化为最优控制问题，再用伪谱法和SNOPT求解器计算最优解;针对三维无人机追逃问题，Conway等人使用间接法和遗传算法求解[2]，而对于导弹拦截问题，他们则提出了一种半直接非线性规划算法（semi-DCNLP）进行了数值求解[3]。该文提出一种半直接的数值求解方法，先把问题转化为最优控制问题，再结合离散力学理论将最优控制问题转化为非线性规划问题，最后使用序列二次规划（Sequential Quadratic Programming，SQP）方法进行数值求解。

1 微分对策问题的转化

使用文献[1]中的转化形式，将微分对策问题转化为最优控制问题。

（1）

s.t.

（2）

（3）

（4）

（5）

其中：下标P和E分别表示追方和逃方;ΦE和DE分别为目标函数的末值项和代价函数，为连续可微的标量函数; qE，qP∈Rn和uE，uP∈Rm分别为追逃双方的状态变量和控制变量;式（3）和式（4）为追逃双方的状态方程;t0和tf分别为给定的初始时刻终端时刻。

2 离散力学和最优控制

离散力学最优控制方法（DMOC）[4]是求解最优控制问题的一种数值方法。

在离散的情况下，我们将固定时间间隔[t0，tf]以时间间隔h划分为N个小区间[t0，t0+h]，[t0+h，t0+2h]，…，[t0+（N-1）h，t0+Nh]，系统运动状态q也每隔时间步长h进行采样从而得到一系列的采样点qk（t0+kh），k=0，1，2，…，N，使用中点法代替广义坐标q，使用采样点的差商代替广义坐标。使用文献[4]中的方法，将式（1）和（2）构成的最优控制问题转化为：

（6）

（7）

（8）

（9）

其中f-k=f+k为统中含有摩擦力、耗散力或额外控制力等非有势力的离散形式k=1，2，…，N-1。此时，式（6）～（9）就构成一个非线性规划问题，利用计算机软件很容易数值求解。

3 基于离散力学的追逃问题的半直接数值解法

将追方极值条件式（4）～（5）离散：

（10）

（11）

其中HP，k为离散的哈密顿函数，FP，d为离散的状态方程，k=1，2，…，N-1。此时，式（8）～（11）构成一个与微分对策问题（1）～（5）等价的非线性规划问题。

4 算例

考虑如图1中的小车追逃模型。其中，下标P和E分别表示追方和逃方;F为小车的最大推力，θ为小车推力方向与X轴的夹角，（x，y）为小车位置坐标。

取qP=[xp，yp]T和qE=[xE，yE]T作为追逃两只小车的状态变量，取up=θp和uE=θE作为控制量;给定初始参数xp=0，yp=0，xe=500，ye=1000，θp=0，;为保证追方一定能追上逃方，则必有追方推重比大于逃方推重比，即，取=8，=3.5;采样周期h=1，采样次数N=100。使用第3节的方法建立模型，使用MATLAB软件进行数值仿真（使用Control Toolbox中的fmincon函数，算法选择SQP），数值仿真结果如图2所示。可以看出，逃方采用转向机动躲避追击，而拥有速度优势的追方做出相同的转向机动并最终追上逃方，双方的策略都是非常合理的。

5 结语

该文创新提出使用基于离散力学的半直接数值解法求解了追逃问题。首先使用间接法将微分对策问题转化为最优控制问题，再结合离散力学理论将问题转化为非线性规划问题进行直接优化求解。为了验证方法的有效性，在第4节给出一个小车追逃的算例，在MATLAB中应用SQP方法进行数值求解和仿真。对仿真结果的分析表明，双方都采用了合理的策略进行博弈。仿真结果表明了该文提出的方法是正确的、有效的。

参考文献

[1] 徐光延，史光普.无人机三维追逃问题的半直接法求解[J].电光与控制，2017，24（10）：27-31.

[2] CONWAY B A， PONTANI M. Numerical solution of the three-dimensional orbital pursuit-evasion game[J].Journal of Guidance， Control， and Dynamics，2009，32（2）：474-487.

[3] CONWAY B A， PONTANI M. Optimal interception of evasive missile warheads： Numerical solution of the differential game[J].Journal of Guidance， Control， and Dynamics，2008，31（4）：1111-1122.

[4] OBER-BLOBAUM S. Discrete Mechanics and Optimal Control[J].IAFC Proceedings Volumes，2005，38（1）：538-543.

科技资讯

2020年6期

基于离散力学追逃问题的半直接数值解法

杂志排行

科技资讯的其它文章