APP下载

基于相对方位信息和单间距测量的多智能体编队协同控制

2021-08-03叶结松龚柏春李爽都延丽郝明瑞

航空学报 2021年7期
关键词:队形方位间距

叶结松,龚柏春,李爽,*,都延丽,郝明瑞

1.南京航空航天大学 航天学院,南京 211106 2.复杂系统控制与智能协同技术重点实验室,北京 100074

近些年来,以无人机集群、多机器人系统为代表的多智能体系统凭借其强大性能、对复杂环境的高度适应性、不会造成人员伤亡等优势获得了广泛关注。作为多智能体系统研究的重点内容之一,集群或编队的协同控制吸引了许多学者的研究。现有的多数编队控制算法都假定系统中的每个智能体均能获得其邻居或领导者的位置信息或距离信息。但在室内,水下或深空等GPS拒止的环境中,控制算法所依赖的位置信息可能无法获得[1]。因此,许多学者开始研究基于邻居之间相对方位或角度约束的新型控制律。对二维空间运动的编队,Moshtagh等[2]仅基于相对方位角信息成功地为一组恒速机器人设计协同控制律。Basiri和Bishop等仅依靠相对方位或者角度信息,分别以四边形和三角形为目标队形提出了分布式控制律[3-5]。Guo等[6]以两个智能体和一个固定信标组成的三角形为目标队形,研究了基于角度信息的控制律。Zhao等[7]仅通过相对角度测量实现了循环编队控制,并且考虑了单个智能体失效和噪声干扰等工况。在上述工作中,智能体的位置或角度、相对方位相互依存,虽然最终可以成功形成目标队形,但每个智能体的最终位置无法预测,因为系统中没有状态已知的领导者作为参考基准。Eren[8]为“领导者——第一跟随者”结构的多体系统提出了分布式控制法则,该系统的交互拓扑从两个领导者(即领导者与第一跟随者)及代表距离和相对方位约束的两条边开始,由一系列顶点增加操作构成。在文献[8]中,具备方位刚性的编队队形具有统一的可伸缩性,因此,为了使编队中各智能体间距扩展或收缩而不影响整体队形,只需要调整一个距离约束即可。Trinh等[9]针对“领导者——第一跟随者”编队,提出了适用于任意维度的仅基于相对方位信息的分布式控制算法。

为实现编队在有限的时间内收敛至指定队形,Trinh等分别提出了仅依靠相对方位信息的编队控制律[10-11]。van Tran等[12]设计了两个分布式位置估计算法和一个基于位置信息的编队控制律,通过相对方位信息估计相对位置,进而基于位置信息实现队形控制。Li等[13]设计了一种新的仅基于相对方位信息的控制律,旨在指定的有限时间内实现编队收敛,并建立了硬件平台来验证其有效性。Zhao和Zelazo[14]针对是否存在全局参考系的两种情况,分别提出了相应的相对方位控制律。通过本体系下对相对方位信息的测量,Li等[15]设计了连续和离散时间情况下可全局收敛的分布式控制算法。Tron[16]研究了距离和静止特征点对基于相对方位的编队队形控制效果的影响,仿真表明在没有距离约束的情况下编队中各智能体间距会发散。考虑同时利用其它约束,Bishop等[17]设计了基于方向和距离约束的分布式控制算法,适用于任意数量智能体构成的编队。针对由平面内相对方位和智能体间距定义的队形,Fathian等[18]提出了一种分布式控制方法。在位置、速度和加速度信息可以测量的情况下,Zhao和Zelazo等[19]提出了编队控制律,使领导者智能体以恒定速度或时变速度运动时,剩余智能体可以保持编队的形状并维持相互之间的距离。Trinh等[20]为领导者智能体设计了额外的控制律以控制与第一跟随智能体的间距,而其他智能体的运动仅依赖相对方位信息。

在实际的协同控制任务中,编队必须具备以一定速度移动的能力,并在飞行的同时维持编队的队形。目前,有文献针对非静止的目标队形设计了基于相对方位信息的控制律[21-25]。Schiano等[25]成功控制无人飞行器编队形成由相对方位信息描述的期望队形,并且实现了无人机在“零空间”中的运动。之后针对机载相机的三项感应约束即最小/最大距离,有限的视野和重叠遮挡,开发了基于梯度的控制动作,并通过四旋翼无人机进行了实验验证[24]。通过对位置和速度测量,van Tran和Anh实现了系统各智能体速度的一致并维持了编队队形[23]。Liu等[22]利用位置、速度和加速度信息,针对第二领导者智能体和其他智能体分别提出了控制算法。Zhao等[21]仅使用相对方位信息设计了编队跟踪控制律,并研究了不同的智能体模型,其中编队的队形规模由两个领导者之间的距离确定。

本文在“领导者——第一跟随者”架构的多智能体系统基础上,通过Henneberg Construction方法构建拉曼图,即多智能体系统的交互拓扑图,使目标队形具备方位刚性[26]。在借鉴文献[20]中分布式控制律的基础上,仅依据智能体间的相对方位信息和一条距离信息,提出新的控制律以使多智能体系统实现编队集结、飞行,并且通过对领导者智能体与第一跟随智能体间距的控制实现所有智能体间距的缩放。尤其针对领导智能体移动速度未知的情况,第一跟随智能体仍能通过已有信息对领导者的速度进行估计,进而实现跟随飞行。

1 问题描述与相关模型

1.1 问题描述

本文研究的对象是“领导者——第一跟随者”结构的多智能体系统编队,通过智能体间的相对方位信息与第一跟随智能体和最高领导者智能体的距离信息,对第一跟随智能体与剩余智能体分别提出分布式控制算法,在满足相应初始条件限制下,实现编队集结、队形缩放与编队飞行的目标。编队的目标队形几何形状由智能体间的期望相对方位信息唯一确定,而目标队形中各智能体的间距则通过第一跟随智能体与最高领导者智能体的间距进行控制。

1.2 运动学模型

(1)

式中:ui为智能体i的速度,即控制算法的输出量。

1.3 测量模型

(2)

编队的期望队形由智能体间的期望相对方位集合定义:

(3)

对于相对方位信息的运算涉及正交投影矩阵。对于向量x=[x1,x2,…,xd]T,其正交投影矩阵的定义为

(4)

式中:Id为该维度下的单位矩阵。易得Px的一些特性,矩阵Px为对称、半正定的且幂等的矩阵。其零空间为N(Px)=span{x},有特征向量{0,1,…,1}。

各智能体的测量对象即领导者智能体根据系统的交互拓扑图确定。如领导者智能体作为编队的最高领导者,只需根据任务要求调整及保持自身运动状态,无需测量相对其他智能体的方位信息与距离信息。第一跟随智能体作为领导者智能体的第一跟随者,测量领导者智能体相对自身的方位信息的同时,也需测量同领导者智能体的距离信息作为控制器的输入。其他所有智能体仅需依据交互拓扑图,确定邻居智能体,即领导者智能体,测量其两个领导者智能体的相对方位信息进而实施分布式控制。本文研究的多智能体系统是由14个智能体形成的编队,对应的交互拓扑图中应有14个对应的节点。通过Henneberg Construction方法,本文构建的多智能体系统的交互拓扑图如图1所示。

图1 系统中14个智能体的交互拓扑图

可以看出,图中的根节点1和节点2分别对应编队系统中的领导者智能体和第一跟随智能体。第一跟随智能体仅有领导者智能体作为领导者,同时领导者智能体和第一跟随智能体又作为剩余智能体的共同领导者。除领导者智能体与第一跟随智能体外,每个智能体有且仅有2个领导者。

2 控制律设计及稳定性分析

现有的多数文献研究了形成指定队形的控制律设计,未考虑队形规模的缩放变化控制。然而在实际任务中,队形缩放在特定环境(如复杂障碍物环境)下有极大的优势与应用需求。本文将在文献[20]控制律的基础上进行拓展,在完成编队集结任务的基础上,改进队形规模的控制方法,通过对领导者智能体与第一跟随智能体的间距控制,实现对编队整体队形间距的控制,以适应环境变化需求。并且拓展到编队飞行。针对第一跟随智能体是否可以获取领导者智能体飞行速度的2种情况,为第一跟随智能体设计相应的控制器。

首先,依然沿用以下假设条件:

1)系统的交互拓扑图由Henneberg Construction方法构建,每个智能体都能够获取领导者智能体的相对方位信息,不考虑视觉重叠阻碍、光学相机视野等问题。

3)初始时刻,各智能体的位置不能重合,即pi(0)≠pj(0),1≤i≠j≤n。

考虑到原控制律下第一跟随智能体位于非期望平衡点的情况,并且由于新的控制器当中包含距离控制,故增加一条假设条件。

系统中各智能体的交互拓扑图由Henneberg Construction方法构建,是确保目标队形具备方位刚性的充分条件[26]。由于相对方位信息的特殊性,为确保期望相对方位要求下的位置唯一性,智能体与其2个领导者智能体的期望相对方位不能够共线。

2.1 领导者智能体

在编队飞行阶段,领导者智能体负责领导整个编队飞向目标地点或按预定的航迹飞行,无需测量方位等信息。所有跟随者智能体的速度将收敛到与领导者智能体的速度一致,同时以领导者智能体为队形起始点,围绕其形成由相对方位期望值与期望间距指定的编队队形。假定某一时间段内,编队以恒定速度运动,领导者智能体的速度为定常矢量c(c∈Rd),当领导者智能体速度c为零矢量,即保持静止时,其他智能体围绕其集结,形成由期望相对方位描述的目标队形,称为编队集结。当领导者智能体运动时,其他智能体追随其运动并保持相对方位,称为编队飞行或队形保持。领导者智能体的数学模型为

(5)

2.2 第一跟随者智能体

对于第一跟随智能体,首先考虑文献[20]中的控制律:

(6)

在该控制律下,领导者智能体与第一跟随智能体的间距d21不会发生变化,证明如下:

(7)

首先,该控制律的特性在于只使用一条相对方位信息对第一跟随智能体实施控制作用,但是,该控制律的缺点在于不能够改变领导者智能体与第一跟随智能体的间距,并且由于方位刚性的限制,编队各智能体的间距不能人为扩大或缩小。为了解决该问题,可以为领导者智能体额外设计一个关于距离的控制律[20],但是一旦领导者智能体为了维持或改变智能体间距而发生运动,编队整体的位置便会不可预测或偏离指定位置。并且在任务中,领导者智能体可能是一个假想的虚拟目标或者固定的地理标志,其设置为系统“领导者”的目的是使其他智能体移动到相关的指定位置以执行特定任务,所以本文对第一跟随智能体的控制律进行改进,使第一跟随智能体不但能够收敛到满足期望相对方位的位置,并且可以自主控制与领导者智能体的间距。由于目标队形具备方位刚性,所以可以通过改变第一跟随智能体与领导者智能体的间距,在维持编队队形的基础上调整各智能体的间距,即实现编队队形的缩放控制。

其次,在“领导者——第一跟随者”结构的编队系统中,第一跟随智能体不仅作为跟随者,也是编队的第二领导者。当编队进行集结或者编队飞行时,最高领导者智能体的速度为c。以下分2种情况进行讨论:第1种情况,第一跟随智能体知晓编队的期望速度,即最高领导者智能体的速度c,此种情况较为常见,第一跟随智能体与领导者智能体协同领导编队运动,多用于智能体间信息交互不受干扰的环境。而第2种情况则是在拒止环境下,信息沟通收到影响,第一跟随智能体仅能通过相对方位信息与距离信息跟踪领导者智能体,即期望速度c对于第一跟随智能体是未知量。

第1种情况下,编队飞行的速度c对第一跟随智能体是已知的,但仍需为了保持、改变飞行队形或队形间距对第一跟随智能体实施控制。对第一跟随智能体改进后的控制律为

(8)

式中:k为距离控制项增益且k>0;c为领导者智能体的速度。E为领导者智能体和第一跟随智能体的距离控制项,设计如下:

(9)

(10)

需要注意的是,当编队以某速度飞行时,第一跟随智能体在空间中的期望位置会随时间变化,根据相对方位的定义式(2),有

(11)

将式(11)代入到式(10)中,有

(12)

(13)

为书写方便,记V=V1+V2,其中

(14)

(15)

V1对时间求导,有

(16)

(17)

下面求解V2对时间的导数,代入式(5)和式(8),有

(18)

(19)

则V2对时间求导,有

(20)

则V对时间求导的过程为

(21)

(22)

将式(22)替换式(8)中的c,得到期望速度未知情况下第一跟随智能体的控制为

(23)

(24)

式中:V1,V2的定义同式(14)、式(15),其对时间求导的过程稍有改变,将式(5)和新控制律(23)代入V1,具体过程为

(25)

领导者与第一跟随者间距变化为

(26)

(27)

V3对时间求导,有

(28)

由式(25)、式(27)和式(28),可得

(29)

2.3 其他跟随者智能体

多数现存的编队飞行控制律[19,22-23],除了相对方位信息外还要求测量每个智能体的位置、速度甚至加速度等信息,对系统的测量成本和机载计算机的运算载荷要求显然较高。针对此问题,对于除领导者智能体和第一跟随智能体外的所有智能体提出改进的控制律,使得仅基于2个领导者智能体的相对方位信息即可实施控制。对智能体,其领导者智能体分别为智能体j和智能体k(1≤j≠k≤i-1),在本文的测量模型当中有Ni=(j,k)。首先考虑文献[9,20]中的分布式控制律:

(30)

也可表示为

(31)

上述控制律在形成静止目标队形时被证明有效,但不能用于跟随编队飞行,累计误差会逐渐增大。本节基于式(31)的分布式控制律,使用传统“比例积分”(Proportional Integral, PI)控制器的思想,消除智能体跟随编队飞行时的偏差,改进后的控制律为

(32)

式中:K1>0,K2≥0为常数,作为比例、积分项的控制增益,适当选取K1,K2的值可以增大控制量从而加快队形的收敛速度。

本节所提出的控制方法都仅依赖智能体间的相对方位信息与一条距离信息,相比传统的控制方法,有需要的信息种类更少、信息的获取更加简便等优势。除领导者智能体与第一跟随智能体以外,剩余智能体的控制输入信息仅包含各自领导者智能体的相对方位信息,在实际任务中可以显著减轻机载传感设备载荷。

3 仿真结果

为验证所提控制方法的有效性,本文利用MATLAB R2019a对多智能体系统的编队集结、队形缩放与编队飞行任务进行了仿真验证。

3.1 编队集结初始条件

本章针对由14个智能体组成的多智能体系统,采用1.3节建立的交互拓扑图,形成“领导者——第一跟随者”编队。目标期望队形为边长为2 m的立方体,其中8个智能体位于立方体的8个顶点位置,领导者智能体位于其中一个顶点处,剩余6个智能体对应立方体六个面的中心点位置。各智能体在初始时刻的位置如表1所示。

3.2 编队集结仿真验证

图2 集结过程中智能体的轨迹

表1 智能体的初始位置

智能体根据相对方位信息运动的过程中,可以通过方位差判断智能体是否收敛到队形指定的位置。方位差定义的是智能体相对其领导者的实际方位与期望方位的矢量模值:

(33)

方位差可以展示各智能体相对领导者智能体的方位收敛过程。由图3可以看出,除领导者智能体外,大约在15 s左右,各智能体的领导者相对其自身的方位都收敛到了期望值,即真实相对方位与期望方位的矢量差的模随时间收敛,意味着编队已经成功集结并形成了满足期望方位的队形。

编队集结过程中各智能体的实际位置与期望位置的距离随时间变化过程展示在图4,与图3表达的情况一致,编队在大约15 s时完成编队集结,各智能体运动到由期望队形与领导者智能体指定的目标位置。

图3 集结过程中的相对方位差

图4 智能体实际位置与期望位置的距离

图5 间距扩大队形再次收敛

可以看出,随着领导者智能体与第一跟随智能体的期望间距变为4 m,领导者智能体的位置保持不变,第一跟随智能体在保持相对期望方位的同时,在控制律的作用下运动到新的期望位置,虽有短时间的超调量,但从图6可知收敛速度仍较快。而系统中的其他智能体相互间距同时得以变化,但系统总体的队形仍然维持不变。

图6 改变期望间距时,实际位置与期望位置的距离

由图6可知,改进后的控制律可以实现编队队形的缩放。相比参考文献中通过领导者智能体的移动改变和第一跟随智能体间距的方法,改进后的控制律更加适用于多智能体系统执行任务的实际情况。

3.3 编队飞行仿真验证

当系统中的领导者智能体运动时,跟随者智能体通过提出的编队飞行控制律跟随各自领导者飞行并且维持队形。仿真过程中,领导者智能体的速度设定为c=[0.5, 0.5, 0.5]Tm·s-1,其他智能体的初始速度为零。K2=10,其他参数不变。图7~图9展示了在上述编队集结的基础上,领导者的速度对第一跟随智能体是未知的情况下,系统编队进行60 s编队飞行的轨迹及过程,可以看出,在编队飞行时,多智能体编队仍然保持期望队形。

图7 领导者智能体速度已知时,多智能体协同编队飞行轨迹

图8展示了编队飞行过程中,各智能体与领导者智能体的实际相对方位与期望相对方位的偏差随时间变化情况,可以看到在约15 s后,几乎所有智能体的方位差都在0.05以内。飞行30 s后,所有智能体的方位差在飞行过程中达到收敛状态。

图8 领导者智能体速度已知时编队飞行过程中各智能体的方位差

图9展示了飞行过程中各智能体三个维度的速度变化情况。从速度随时间变化的图像可以看出,编队飞行早期,各智能体速度变化较大,并在期望速度值上下震荡。大约26 s时,各智能体3个方向的速度值均收敛至期望速度值。之后,多智能体编队以相同速度飞行,说明编队队形得以维持。

图9 领导者智能体速度已知时,编队飞行过程中各智能体三轴方向的速度

当第一跟随智能体能够获取领导者智能体的飞行速度c时,图10和图11分别展示了编队飞行的轨迹、飞行过程中各智能体相对方位差和速度的收敛情况。

图10 领导者智能体速度未知时,多智能体协同编队飞行轨迹

图11 领导者智能体速度未知时,编队飞行过程中各智能体的方位差

由图10~图12可知,在编队飞行期望速度已知的情况下,第一跟随智能体能够追踪领导者智能体,保持相对方位与期望间距,实现队形保持。

图12 领导者智能体速度未知时,编队飞行过程中各智能体三轴方向的速度

本节通过仿真验证了在基于智能体间的相对方位与单间距信息的控制律作用下,系统中的领导者智能体静止或恒速运动时,跟随者智能体均可以跟随各自领导者收敛至期望位置或协同飞行,证实了控制算法的有效性。

4 结 论

1)本文针对“领导者——第一跟随者”结构的多智能体编队,提出了基于智能体间的相对方位信息与单间距信息的分布式编队协同控制律。

2)对第一跟随智能体,当知晓领导者智能体飞行速度时,提出了控制律以实现第一跟随智能体的跟随飞行与队形保持,并且可以通过控制与领导者智能体的间距实现队形的缩放控制。

3)当第一跟随智能体无法获取领导者智能体飞行速度时,通过提出自适应估计参数改进控制律,仍可实现第一跟随智能体跟随领导智能体飞行与间距控制。

4)对普通跟随者智能体,提出了运用比例积分控制思想改进的控制器,仿真验证表明基于该控制律多智能体系统能够实现编队飞行。

猜你喜欢

队形方位间距
开始和结束
调整图标间距让桌面布局更个性
非均匀间距的低副瓣宽带微带阵列天线设计
队列队形体育教案
诗歌的奇怪队形(一)
队形
算距离
Word Fun
练思维:看图学方位
方位介词