多智能体系统初始状态一致性应用研究

2014-02-28刘孝琪康怀祺曾超

计算机工程与应用 2014年13期

刘孝琪，康怀祺，曾超

电子科技大学电子科学技术研究院，成都611731

1 引言

近年来，随着控制理论的发展，越来越多的研究者开始转向多智能体系统一致性理论的研究，目前在无人机编队、蜂拥控制、分布式控制中都有着广泛的应用。对于复杂系统，利用传统的控制方法来分析和控制是十分困难的，在这种背景下多智能体系统协调控制的发展是必然的。

在多智能体系统的一致性问题研究中，关键问题在于设计一致性控制律使得各智能体的状态达到相同。随着控制理论的发展，多智能体一致性的研究取得了一系列的成果。Vicsek等人[1]利用局部信息提出了一个自驱动模型描述平面粒子的运动；Jadbabaie等人[2]对Vicsek模型进行了线性化，分析了拓扑结构变化情况下的一致性问题；Ren等人[3]将Jadbabaie等人所得结果推广到了有向图；与Ren等人工作并行，M oreau[4]研究了有向图非线性多智能体系统一致问题；Hong等人[5]研究了二阶多智能体系统，基于局部信息提出了一个二阶协议，将Jadbabaie等人的结果推广到二阶多智能体系统；文献[6-9]研究了多智能体系统基于有向信息交换的分组一致问题。

目前，多智能体系统的平均一致性研究的比较早，成果也比较多，文献[10]在考虑通信时滞和拓扑结构变化对系统状态影响的基础上，研究了平均一致性问题。但是，目前的研究针对多智能体初始状态的一致性问题的还比较少。而现实中，多智能体系统能否收敛到初始状态非常重要，不管是系统中每个智能体的初始状态校准还是智能体状态需要同步达到初始状态，这些都需要一种新的系统控制方法。最后，针对无人机编队中需要初始状态一致这一场合，分析了本文研究成果的有效性。

2 预备知识及问题描述

2.1 预备知识

2.1.1 代数图论知识

令G=(v，ξ，A)为一个n阶(n≥2)赋权有向图，其中v={v1，v2，…，vn}为非空节点集合，ξ⊆v×v为边的集合，权值邻接矩阵A=[aij]的邻接元素aij为非负值。节点指标属于一个有限指标集Γ={1，2，…，n}。G的边用eij=(vi，vj)表示。与图的边对应的邻接元素为正，例如，eij∈ξ⇔aij＞0。另外，假定对所有的i∈Γ，aii=0。节点vi的邻集由Ni={vj∈v:(vi，vj)∈ξ}表示。集合Ni中元素的数目称为节点vi的出度，，用矩阵D表示出度矩阵。类似地，集合N～i={vj∈v:(vi，vj)∈ξ}中元素的数目称为节点vi的入度，由degin表示。令xi∈R表示节点vi的值，将拓扑（或信息流）为G，状态值为x∈Rn的网络（或代数图）表示为Gx=(G，x)。

2.1.2 一致性协议

假定所考虑的动态智能体网络包含n个智能体。每个智能体被视为有向图G中的一个节点。每条边(vj，vi)∈ξ(G(t))对应在时刻t，智能体i到智能体j之间的可靠信息传递。另外，每个智能体只根据自身和它邻居智能体的信息改变目前的状态值。考虑单积分器智能体动力学特性，令

其中xi(t)∈R为智能体的信息状态值，ui(t)为时刻t时的控制输入（或协议）。

2.2 问题描述

多个相互通信的智能体系统，每个智能体只能获得其邻居智能体的状态值，可以用有向图G=(v，ξ，A)来描述，多智能体的状态方程可由式（1）表示：

例如，无人机编队飞行过程中，机群整体协调才能完成它们所承担的共同任务，必须具有相同的初始姿态，由于某些偶然因素干扰，致使无人机编队中的各个智能体偏离初始姿态，无法继续执行既定任务。所以，每个无人机（都是一个智能体）都需要调正自己的姿态至初始设定的姿态值，如果每个智能体都只是孤立地调整自己的姿态，而没有顾及机群整体的状态值，一旦自己的姿态调整好之后就去执行整体的任务，而邻居智能体还没调整好，任务显然会失败。那如何设计一种协议，使得每个无人机都能服从机群整体的状态改变，即当无人机群中每个无人机（智能体）都调整到初始姿态时才一起执行任务，而某一无人机提前回归到初始姿态，其他无人机还未准备好时，会继续使自身处于姿态调整的过程中，不会去执行任务。为解决类似的初始状态一致问题考虑，针对多智能体系统（1），本文分别从不含时滞和含有时滞两种情况展开了此类问题的研究。

2.2.1 多智能体系统不含时滞

在多智能体系统不含时滞的情况下，为使多智能体系统收敛到初始状态量，采用以下一致性控制协议：

将式（2）代入式（1）可得：

x˙(t)=-(D+A)x(t)（3）其中，x=[x1，x1，…，xn]T，D为出度矩阵，A为临界矩阵。

2.2.2 多智能体系统含有时滞

在多智能体系统含有时滞的情况下，在式（2）所表示的协议基础上增加时滞部分，则

其中，0＜τ＜d为正在通信的两个多智能体之间的通信时滞。

将式（4）代入式（1）可得：

其中x=[x1，x1，…，xn]T，D为智能体间拓扑结构所对应的出度矩阵，A为对应的邻接矩阵。

3 主要结论

本章针对多智能体系统（1）在存在时滞和不存在时滞两种情况下收敛到初始状态进行分析。为了便于定理推导，先给出一个引理。

引理1[11]给定任意实可微向量函数x(t)∈Rn，任意可微标量函数τ(t)∈(0，h]和任意常矩阵0＜Q=QT∈Rn×n，如下不等式成立：

其中，h∈R为正实数，t≥0。

3.1 无时滞情况

定理1如果存在一个对称矩阵P∈Rn×n，使得

那么由式（3）所确定的一致性协议能使多智能体一致收敛到初始状态。

证明针对式（1）确定的多智能体系统，构造如下Lyapunov-K rasovskii泛函：

其中，0＜P=PT∈Rn×n。

那么V(t)对时间t求导可得：

根据式（7）中，(D+A)TP+P(D+A)＞0，所以(t)＜0。由此可得，在满足式（7）的充分性条件下，由式（3）确定的多智能体系统可达到初始状态一致。

3.2 时滞情况

定理2假设一阶固定时滞多智能体系统满足以下条件：

其中，0＜τ＜d，L=D+A，P=PT＞0，W=WT＞0都是适维的矩阵，那么由式（5）决定的多智能体系统收敛到初始状态0。

证明对于由式（5）确定的多智能体系统，构造如下Lyapunov泛函：

将式（5）代入可得：

由引理1可推导出：

V˙(t)≤[-(D+A)x(t-τ)]TPx(t)+

xT(t)P[-(D+A)x(t-τ)]+

d[-(D+A)x(t-τ)]TW[-(D+A)x(t-τ)]-

d-1[x(t)-x(t-τ)]TW[x(t)-x(t-τ)]（16）

令yT(t)=[xT(t)xT(t-τ)]，则上式可化简为：

4 仿真及验证

这里给出计算机仿真实例来验证上述定理的正确性。

例1考虑如下多智能体系统：

其中xi∈R是第i个智能体的状态，ui∈R是第i个智能体的控制规则，x(0)i是第i个智能体偏离初始状态后的当前状态值，i=1，2，…，5。系统所对应的拓扑结构如图1所示。

设智能体之间信号传输没有时滞，选取如下各智能体当前状态值：

x1(0)=6，x2(0)=3，x3(0)=1，x4(0)=-4，x5(0)=-5

由拓扑结构可以得到邻接矩阵A为：

出度矩阵D=diag(1，1，1，1，1)。

根据是否含有时滞分两种情况进行讨论。

4.1 不含时滞即τ=0的情况

首先根据定理1的公式验证此种拓扑结构的矩阵表达式是否满足条件，利用M atlab的LM I工具箱很容易得出一个满足条件的对称矩阵P为：

相应的各智能体状态仿真结果如图2所示。

图1 五个智能体构成的拓扑结构

图2 τ=0时多智能体状态曲线

通过上述仿真可以得到，使用由式（2）确定的一致性协议，在满足定理1的情况下，某一个智能体在提前收敛到初始状态而其他智能体尚未调整到初始状态值时会继续使自己处于调整状态的过程中，最后每个智能体一起达到初始状态，解决了本文第2章提出的问题。

4.2 含有时滞即0＜τ＜d的情况

在仿真过上述多智能体系统不含时滞的基础上，本文继而讨论含有时滞τ的情形，此时的d需要满足一定的条件，不能很大，因为延时量τ的取值范围不是本文的研究范畴，所以在此为方便仿真取τ为一个比较小的量0.25，在上述拓扑结构和一致性协议下，引入延时量，针对上述假设，进行仿真。仿真结果如图3所示。

图3 τ=0.25时多智能体状态曲线

通过上述仿真可得到，经过一定量的时延之后，收敛速度会变慢，在满足定理2的条件下，多智能体系统仿真结果与不含时滞的情形相同，一同达到了初始状态量，验证了一致性协议及充分性定理的有效性。

5 结束语

研究了多智能体系统收敛到初始状态的一致性问题，在给出一致性控制协议和定理推导的同时，进行了计算机仿真。解决了无人机编队飞行中很常见的一个初始状态一致问题，使得无人机系统在这一局部控制协议下，只通过获知邻居无人机的状态值就可以同步达到初始状态一致。

本文的研究成果还处于初步阶段，今后还将在考虑不同通信时滞，切换拓扑结构的基础上研究多智能体系统的初始状态一致性。

[1]Vicsek T，Czirok A，Jacob E B，et al.Novel type of phase transitions in a system of self-driven particles[J].Physics Review Letters，1995，75（6）：1226-1229.

[2]Jadbabaie A，Lin J，Morse A S.Coordination of group of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control，2003，48（6）：988-1001.

[3]Ren W，Beard R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies[J].IEEE Transactions on Automatic Control，2005，50（5）：655-660.

[4]M oreau L.Stability of multi-agent system s with time dependent communication links[J].IEEE Transactions on Automatic Control，2005，50（2）：169-182.

[5]Hong Y，Gao L，Cheng D，et al.Lyapunov-based approach to multiagent systems with swithing jointly connected interconnection[J].IEEE Trans on Autom Control，2007，52（5）：943-948.

[6]Yu J Y，Wang L.Group consensus of multi-agent systems with directed information exchange[J].International Journal of Systems Science，2012，43（2）：334-348.

[7]Wang Y Z，Zhang C H，Liu Z B.A matrix apprach to graph maximum stable set and coloring problems with application to multi-agent systems[J].Automatica，2012，48（7）：1227-1236.

[8]Xia W G，Cao M.Clustering in diffusively coupled networks[J].Automatica，2011，47（11）：2395-2405.

[9]Yu J Y，Wang L.Group consensus of multi-agent systems with undirected communication graphs[C]//Proceedings of Asian Control Conference，Beijing，2009：105-110.

[10]Olfati-Sabet R，Murray R M.Consensus problem in networks of agents with switching topology and time-delays[J].IEEE Transactions on Automatic Control，2004，49（9）：1520-1533.

[11]Sun Y，Wang L，Xie G.Average consensus in networks of dynamic agents with switching topologies and multiple time-varying delays[J].System and Control Letters，2008，57（2）：175-183.