基于D-S证据理论的反辐射无人机群协同搜索

2018-03-12盛怀洁陈明建

探测与控制学报 2018年1期

韩旭，盛怀洁，陈明建

(国防科技大学电子对抗学院，安徽合肥 230037)

0 引言

反辐射无人机是装有战斗部并能利用敌方辐射源发射的电磁波进行自引导，压制、摧毁该辐射源的无人机[1]，是为己方作战提供安全保障的一种重要武器系统。但是在广域、复杂、多变的信息化战场环境下，单架反辐射无人机的任务能力有限，在执行侦察搜索任务时面临搜索范围、传感器精度等诸多方面的限制，作战效能的发挥受到了制约。

面对复杂的战场环境，通过将反辐射无人机组网，形成无人机集群协同作战，可以提高整个机群的作战能力。当反辐射无人机群在执行侦察搜索任务时，通过协同各自的搜索航路，避免了对同一区域的重复探测，提高了搜索效率；通过共享各自的探测结果，实现了对传感器探测信息的融合，提高了搜索结果的准确性。因此，反辐射无人机群协同作战将对作战效能的发挥有较大的提升。

目前，国内外在多无人机协同搜索问题上进行了比较广泛的研究，提出的主要方法大多基于搜索图，比如：目标概率图(Target Probability Map, TPM)[2-3]、数字信息素图(Digital Pheromone Map, DPM)[4-5]、回报率图 (Rate of Return Map, RORM)[6]等，其中TPM方法较为有效，对其的研究和应用比较广泛。TPM方法通过对作战区域建立概率地图，从概率的角度描述环境中不同位置目标存在的可能性，使得多无人机根据作战区域中的目标概率分布情况进行搜索航路规划。TPM方法使无人机集群具备了一定程度的协同搜索能力的同时还存在一些不足，比如对先验数据有较强依赖，并且没有直接区分目标“不确定”和“不知道”的能力。针对TPM法的不足，提出的改进方法[4-6]大多为在TPM法的基础上建立复合搜索图，进一步添加描述信息，增加了搜索环境的复杂度，这些改进没有改变TPM法从概率角度对搜索环境进行描述的本质，仍然存在一定的不合理性。针对此问题本文提出了基于D-S证据理论的反辐射无人机群协同搜索方法。

1 协同搜索问题建模

反辐射无人机群在协同搜索固定目标雷达站时，其作战任务可描述如下：在任务区域中分布着未知数量的雷达站，通过前期侦察，已获得部分雷达站的情报信息，现利用N架反辐射无人机对任务区域E进行侦察，无人机之间具有理想的通信条件和充分的信息交换能力，要求在充分利用前期情报的基础上，使无人机集群对目标雷达站协同搜索的效率最高。

1.1 反辐射无人机模型

对反辐射无人机进行建模主要是建立无人机运动模型和传感器探测模型。假设所有无人机具有相同的飞行性能和任务载荷。

1)反辐射无人机运动模型

假设反辐射无人机均以定常速度v飞行，使用以下简化的运动方程[7]

(1)

其中，φ为无人机的偏航角，h为无人机飞行高度，为常数，ω为无人机偏航角变化率，ηmax为无人机物理操纵性能限制下的最大偏航角。

2)反辐射无人机探测模型

反辐射无人机主要的侦察搜索传感器为被动雷达导引头，其对目标的搜索属于雷达对抗侦察范畴，根据雷达对抗侦察方程[8]可知，反辐射无人机的水平最大侦察距离Rmax为：

(2)

其中，R为无人机与目标雷达之间的直线距离，Pt为雷达辐射功率，Gtr为雷达发射天线增益，Grt为无人机接收天线增益，λ为雷达工作波长，Prmin为机载被动雷达导引头灵敏度，γ为传播及设备损耗，H为目标雷达高度。反辐射无人机一般使用宽波束侦察天线，假设其水平面侦察角度为θ，则反辐射无人机的侦察范围如图1所示，其在地面上的有效侦察面为一扇形。

1.2 搜索环境模型

对搜索环境进行建模主要是对环境的特征进行识别和提取，目的是为反辐射无人机群对环境信息的获取、存储以及利用提供统一的表示形式和规范的度量方法，而无人机获取、存储以及利用环境信息的过程需要对信息进行融合。利用无人机之间的信息共享能力，可以采用D-S证据理论对各无人机的探测结果进行数据融合，提高搜索结果的准确性和搜索效率。

1.2.1D-S理论

D-S理论也称为Dempster-Shafer证据理论，属于人工智能范畴，是一种不精确推理的理论，最早应用于专家系统中[9]。作为一种不确定推理方法，D-S证据理论具有直接表达“不确定”和“不知道”的能力。其基本概念如下：

假设存在某一问题或事件，其所有可能的答案或状态是由互不相容的基本命题(或者假定)组成的完备集合，在D-S证据理论中这个完备集合称为识别框架Θ，或称假设空间。定义基本置信度分配函数：m函数，在识别框架Θ上的函数m是一个2Θ→[0,1]的函数，也称作质量函数或mass函数。m函数可结合专家经验给出，或者根据传感器所得到的数据构造而来[10]，就被动雷达导引头而言，其对侦察到的目标产生的基本置信度分配可通过比较目标信号与导引头中信号数据库之间的信号特征相似度进行构造和赋值，由于本文重点对搜索方法进行研究，因此本文采用专家经验对目标的基本置信度进行直接赋值。

m函数满足不可能事件的基本置信度为零，且2Θ中全部元素的基本置信度之和为1，即：

(3)

将识别框架上基于函数m的信度函数Bel定义为：

(4)

其含义为A中全部子集对应的基本置信度之和，表示对A成立的不确定性度量，也称为下限函数。

将识别框架上基于函数m的似然函数Pl定义为：

(5)

表示对A非假的信任程度，即表示对A似乎可能成立的不确定性度量，也称为上限函数。(Bel(A),Pl(A))称为置信区间。当事件A完全未知时，A的置信区间为(Bel(A),Pl(A))=(0,1)，实现了对“不知道”进行描述；当事件A不完全未知时，其置信区间为(Bel(A),Pl(A))=(a,b)，a,b∈(0,1)，实现了对“不清楚”进行描述。

A的不确定性由式(6)表示：

μ(A)=Pl(A)-Bel(A)

(6)

假设在识别框架上有两个独立的证据，其基本置信度分配函数分别为m1、m2，则m1、m2可通过Dempster合成规则进行融合，即：

(7)

将二元体(A,m(A))称为证据体,对所有A⊆2Θ的新的基本置信度分配函数，由上述融合规则可产生新的证据体，实现的数据的融合和更新。

1.2.2基于D-S理论的搜索图

假设待搜索任务区域为一矩形区域，将其划分为LX×LY个栅格，每一栅格中至多有一部雷达，每个栅格的大小为传感器扇形有效侦察面的内接正方形，如图2所示。

若无人机对栅格(x,y)探测后发现目标，则探测结果的基本置信度分配为：m(R)=0.6,m(E)=0.3,m(U)=0.1；若未发现目标，则m(R)=0.3,m(E)=0.6,m(U)=0.1。将最新的探测结果与栅格原有的基本置信度按照式(7)进行融合后计算新的信度函数Bel(R)和似然函数Pl(R)，实现对目标置信区间的更新。

当某一栅格的信度函数Bel(R)>ρ并且不确定度μ(A)<λ时，可确认该栅格中存在目标雷达，其中，ρ、λ分别为信度门限和不确定度门限。根据D-S证据理论，Pxy(t)更新规则如下：

1)若t时刻，存在无人机对栅格(x，y)进行探测，则应将t时刻的探测结果同栅格中的原有信息进行数据融合。Pxy(t)的更新如下式

(8)

2)若t时刻，不存在无人机对栅格(x，y)进行搜索探测，则Pxy(t)的更新如下式

(9)

其中，τ为信度函数更新因子。

2 协同搜索策略

反辐射无人机群在执行协同搜索任务时应依据一定的策略，选择搜索收益最大的路径进行搜索。

2.1 协同搜索收益函数

为了充分发挥无人机集群自主协同、信息共享的搜索优势，可以从以下三个方面综合考虑和制定协同搜索收益函数J(t)：

1)尽可能多的发现目标，定义目标发现收益JiR(t)如下

(10)

目标发现收益是无人机i从当前栅格进入下一栅格后，信度函数的增加量，表示无人机沿信度增大的航路对目标雷达进行搜索。

2)尽可能减少环境的不确定度，定义环境搜索收益JiS(t)如下

(11)

环境搜索收益表示无人机沿使环境不确定度减少的航路对目标雷达进行搜索。

3)提高无人机群协同性，减小重复探索次数，定义探测访问收益JiV(t)如下：

(12)

其中，Cv为探测访问收益的归一化系数。探测访问收益表示无人机i沿被访问次数少的栅格方向对目标雷达进行搜索。

综合考虑以上三种因素，无人机i的协同搜索收益函数Ji(t)应为一多目标函数，不妨假设为三种收益的线性组合：

Ji(t)=w1JiR(t)+w2JiS(t)+w3JiV(t)

(13)

其中，w1、w2、w3分别为目标发现收益、环境搜索收益、探测访问收益的权重，并且w1+w2+w3=1。具体权重分配可结合战场实际情况、作战需求、无人机自身性能等因素设置。

反辐射无人机群在执行搜索任务时，不同无人机的控制和搜索均是相互独立的，可以将整个系统的协同搜索收益定义为所有无人机的协同搜索收益之和：

(14)

当同时有Mr条航路满足使收益J(t)最大时，可结合作战任务需要和实际战场环境，通过适当调整三种收益的权重实现对J(t)的微调，然后从Mr条航路中筛选出一条航路使得调整后的J(t)达到最大。为简化计算，本文假设当出现多条航路满足J(t)最大要求时，依次通过J(t)|w3=0和J(t)|w2，w3=0实现对多条航路的筛选。

2.2 滚动时间窗搜索策略

反辐射无人机群对目标雷达的协同搜索问题是一个在线的动态优化问题，其面临的任务环境是复杂的、不确定的，这要求无人机集群能够根据环境的变化在线自主的动态规划和调整其搜索航路[11]。基于滚动时间窗方法，可以建立如图3所示的反辐射无人机群搜索策略。

假设无人机i在t时刻的位置为ui(t)，则无人机集群t时刻的位置可表示为：

u(t)=[u1(t),u2(t),…,uN-1(t),uN(t)]

(15)

将包含N架无人机的集群视作一个系统，设t时刻系统的控制输入为：

F(t)=[f1(t),f2(t),…,fN-1(t),fN(t)]

(16)

其中fi(t)(i∈[1,N])代表无人机i在t时刻的控制输入。当系统的控制输入被各无人机响应后，t+1时刻，无人机i将位于位置ui(t+1)即

(17)

规定ui(t)和ui(t+1)必须为相邻栅格。为减少运算量，可将无人机的运动方程式(1)离散化，考虑其物理操纵限制下的最大偏航角，当ηmax分别为45°和135°时，无人机的可飞路径如图4所示

基于滚动时间窗的搜索策略可分为以下几个步骤：

步骤1：在时刻t，无人机集群获取当前所在栅格u(t)的环境信息。

步骤2：对t至t+W时刻无人机的航路进行预测，并计算相应航路的收益J。其中W称为滚动时间窗。

步骤3：搜索所有预测航路中收益最大的航路，该最优航路的控制输入序列记为F*(t)，则

F*(t)=[F(t+1),F(t+2),…,F(t+W)]

(18)

步骤4：无人机集群执行F*(t)中的第一步控制输入F(t)后到达新的栅格u(t+1)，而后对新的栅格进行搜索。

步骤5：利用Dempster合成规则对环境栅格的探测结果进行信息融合和更新。令t+1，转入步骤1。

基于滚动时间窗方法的搜索策略，其本质是多步预测，一步控制的搜索策略。在每个决策时刻，无人机集群根据当前环境信息，对系统滚动时间窗内的航路进行预测，通过使系统收益达到最优来确定各时刻的控制序列，然后仅将控制序列的第一项作为无人机集群的控制输入，从而引导无人机对任务区域进行搜索。随着时间不断推移，环境信息不断更新，时间窗口不断向前推进，从而实现对任务区域搜索的滚动优化。

3 协同搜索仿真

为验证本文提出搜索方法，设置了相应的仿真实验，并与传统“Z”字形扫描方法[12-13](如图5所示)、随机搜索型方法(搜索路径随机)进行对比，验证了本文协同搜索方法的有效性和优越性。

3.1 初始条件设置

假设有3架反辐射无人机对任务区域中的固定雷达站进行协同搜索，任务区域面积为300 km×300 km，将其划分为30×30个栅格单元，每个栅格宽度为10 km。无人机均从南侧进入任务区域，初始进入点随机。在任务区域内，已知部分目标雷达RY的前期情报，通过分析情报信息产生了RY的置信区间，任务区域中还存在部分未知雷达RN。具体搜索仿真参数如表1所示。

表1 仿真参数表

3.2 仿真结果分析

为了减少随机性对仿真的影响，进行了100次仿真实验，图6为某次仿真中，不同搜索时间下的运行结果。

从图6可得，随着仿真时间的推进，无人机能够利用先期情报和信息通信共享优势，实现了对任务区域目标雷达的协同有效搜索。为进一步验证本文所提搜索方法的有效性，可从不同方面对其进行检验。

实验一：对搜索目标雷达的能力进行检验。图7为进行100次仿真实验，当分别采用本文搜索方法、传统“Z”字形扫描方法、随机搜索方法时的平均发现雷达数目随仿真运行步数的变化情况。

从图7(a)可以看出，基于D-S理论的协同搜索方法相较于其他两种搜索方法而言，具有较高的搜索效率，在搜索初期能够实现对雷达的快速搜索，并且在搜索后期，基于D-S理论的协同搜索方法在发现雷达的数目上均多余其他两种搜索方法。在对具有前期情报的雷达的搜索方面，如图7(b)，本文方法在搜索初期就能够完成对全部的具有前期情报雷达的搜索和发现，搜索效率明显高于其他两种方法，说明基于D-S理论的协同搜索方法对前期侦察情报的利用较为充分，实现了对具有前期情报雷达的快速侦察和确认。在对无前期情报的雷达的搜索方面，如图7(c)，基于D-S理论的协同搜索方法同传统“Z”字形扫描方法搜索效率相近，且均高于随机搜索方法。在搜索无前期情报的雷达时，由于对雷达情况完全未知，无人机集群只能通过扩大搜索范围、减小重复搜索区域的方法提高对雷达的发现效率，本文搜索方法与传统“Z”字形扫描方法均能做到避免对区域的重复搜索，两种方法搜索能力相近，而随机搜索方法由于其路径的随机性，对同一区域的重复搜索无法完全避免，因此搜索效率较低。

实验二：对探索未知环境能力进行检验。如图8所示为进行100次仿真实验，采用不同搜索方法时，平均环境不确定度随仿真运行步数的变化情况。定义环境不确定度Ud为仿真运行t步时平均环境不确定度μt(R)与初始平均环境不确定度μ0(R)的百分比。

(19)

从图8可以看出，基于D-S理论的协同搜索方法同传统“Z”字形扫描方法的探索未知环境的能力相近，且均高于随机搜索方法，随着仿真时间的增加，无人机能够实现对未知区域的有效搜索。

实验三：对搜索环境覆盖能力进行检验。如图9所示为进行100次仿真实验，采用不同搜索方法时，平均搜索覆盖率随仿真运行步数的变化情况。定义环境搜索覆盖率Ed为仿真运行t步时已经搜索过的栅格数目Num(t)与总栅格数目NumΣ的百分比。

(20)

从图9可以看出，基于D-S理论的协同搜索方法同传统“Z”字形扫描方法对环境的搜索覆盖能力相近，且均高于随机搜索方法，随着仿真时间的增加，无人机能够避免对已探索区域的重复搜索，具有较高的搜索效率。

综合分析以上从不同方面所进行的实验，基于D-S理论的协同搜索方法对雷达的搜索效率较高，能够实现对环境的快速探索和覆盖。实验二和实验三中，“Z”字形扫描方法虽然在探索未知区域和环境覆盖能力上略优于本文所提方法，但是由于搜索航线固定，其搜索效果受到任务区域中雷达分布情况影响较大，并且没有充分利用前期侦察情报，对目标雷达的搜索效率不高。

4 结论

本文提出了基于D-S证据理论的反辐射无人机群协同搜索方法。该方法建立了基于置信区间和访问次数的搜索图，具有直接区分目标“不确定”和“不知道”的能力，并且对前期侦察情报的利用较为充分，能够发挥无人机集群信息共享优势，避免了重复搜索造成的资源浪费。仿真结果验证了该搜索方法的高效性。本文提出的搜索方法对无人机集群协同搜索的理论研究和应用实践具有一定的指导意义，下一阶段应对战场威胁环境下的无人机群协同搜索问题展开研究。

[1]全军军事术语管理委员会,军事科学院.中国人民解放军军语(2011年版)[M].北京:军事科学出版社, 2011.

[2]吴青坡,周绍磊,刘伟,等.基于集散式模型预测控制的多无人机协同分区搜索[J].控制理论与应用,2015,(10):1414-1421.

[3]彭辉,沈林成,朱华勇.基于分布式模型预测控制的多UAV协同区域搜索[J].航空学报,2010,(03):593-601.

[4]沈东,魏瑞轩,茹常剑.基于数字信息素的无人机集群搜索控制方法[J].系统工程与电子技术,2013, 35(3):591-596.

[5]彭辉,苏菲,沈林成.用于多无人机广域目标搜索的扩展搜索图方法[J].系统工程与电子技术,2010,(04):795-798.

[6]Baum M L, PASSINO K M. A search-theoretic approach to cooperative control for uninhabited air vehicles[C]//Proceedings of the AIAA Guidance, Navigation and Control Conference and Exhibit. Monterey, California: AIAA, 2002:AIAA-2002-4589.

[7]黄长强,翁兴伟,王勇,等.多无人机协同作战技术[M].北京:国防工业出版社, 2012.

[8]邵国培.电子对抗作战效能分析原理[M].北京:军事科学出版社,2013.

[9]杨风暴,王肖霞.D-S证据理论的冲突证据合成方法[M].北京: 国防工业出版社,2010.

[10]缪燕子,方健,马小平,等.D-S证据理论融合技术及其应用[M].北京: 电子工业出版社,2013.

[11]席裕庚,李德伟,林姝.模型预测控制——现状与挑战[J].自动化学报,2013,(03):222-236.

[12]VINCENT P, RUBIIN I. A framework and analysis for cooperative search using UAV swarms [C]//Proceedings of the ACM Symposium on Applied Computing.Nicosia,Cyprus: SAC, 2004: 79-86.

[13]徐文涛,晁爱农,叶广强.搜索打击任务的多无人机编队的研究与优化[J].电光与控制,2014,(4): 43-47.