APP下载

考虑时延的多Euler-Lagrange系统自适应神经网络协调跟踪控制

2016-11-02孙延超陈亮名李传江马广富

系统工程与电子技术 2016年5期
关键词:领航者有向图跟随者

孙延超,陈亮名,李传江,马广富

(哈尔滨工业大学航天学院,黑龙江 哈尔滨 150001)

考虑时延的多Euler-Lagrange系统自适应神经网络协调跟踪控制

孙延超,陈亮名,李传江,马广富

(哈尔滨工业大学航天学院,黑龙江哈尔滨 150001)

考虑存在通讯时延,在有向通讯拓扑结构下研究多Euler-Lagrange系统的协调跟踪控制问题。仅有部分跟随者可以获得静态领航者信息。对每一个跟随者设计了一种分布式观测器,以获得领航者的状态量。针对系统模型具有非线性不确定性和外部扰动情况,基于神经网络方法提出了两种分布式自适应协调控制律,分别使每一个跟随者对领航者的跟踪误差最终有界和渐近收敛到零。运用Lyapunov稳定性理论对两种控制律的稳定性进行了证明。数值仿真验证了本文提出的控制律的有效性。

分布式控制;Euler-Lagrange系统;协调跟踪;通讯时延;神经网络

网址:www.sys-ele.com

0 引 言

近年来,多智能体系统协调控制问题引起了广泛的关注,在许多领域呈现出广阔的应用前景。例如,文献[1]针对航天器编队飞行问题,基于多智能体协调控制方法使系统的状态最终趋于一致。文献[2]研究了传感器网络的协调控制问题,并设计了完全分布式控制器。文献[3]研究了移动机器人的协调控制问题。在多智能体系统中,通过智能体间的相互协作能够完成单个运动体无法完成的复杂任务,并提高系统的效率、灵活性和可靠性[4]。

多智能体协调控制可以分为两大类问题:无领航者的一致性问题和有领航者的跟踪控制问题。对于无领航者的一致性,每个智能体通过和邻居进行信息交互来更新自己的状态,从而使所有智能体的状态趋于一个共同值。文献[5]研究了一类机械系统的一致性问题,提出了一种有效的分布式控制律。文献[6]考虑了系统的有限时间特性,对多智能体系统的一致性问题进行了研究。文献[7]针对多机械臂系统,考虑了非线性动态特性,提出一种自适应一致控制律使所有系统状态趋于共同值。然而,一致性问题最终的共同值往往是假定的一个常数或者是初始状态的加权和,这给应用带来较大的限制。作为一种更有效的协调控制方案,有领航者的协调跟踪控制是指对跟随者设计分布式控制律,使所有跟随者的状态都趋于领航者的状态。其中领航者的运动独立于跟随者,但会影响跟随者,因此通过设定领航者的目标轨迹就可以达到整个智能体系统的控制目标,因此降低了设计和控制成本。文献[8]针对一类机械物理系统,考虑领航者具有时变轨迹情况,研究了协调跟踪控制问题。文献[9]在只有部分跟随者可以获得领航者信息的前提下,研究了机械系统的协调跟踪控制问题,但没有考虑通讯时延的影响。文献[10]分别在固定和切换通讯拓扑下,研究了一类非线性系统的协调跟踪控制问题,同样没有考虑时延的影响。实际上大多系统都存在模型非线性情况,因此按一阶或二阶积分系统进行建模存在一定问题[11-12]。Euler-Lagrange(EL)方程可以用来对大多实际系统进行建模,如航天器、自动车辆、操作机器人、多机械臂等[6,13]。因此,多EL系统分布式协调控制问题具有更强的实际应用价值。文献[14]对多EL系统的分布式跟踪控制问题进行了研究,考虑系统存在参数不确定性,假设EL系统满足参数线性化条件,通过分布式滑模估计器补偿系统不确定性,并设计分布式控制律使系统状态达到一致。文献[15]通过参数线性化的方法处理系统的不确定性,研究了多EL系统的蜂拥控制问题。

对于多智能体协调控制的研究,考虑系统模型存在非线性不确定性和外部扰动具有一定的挑战性。文献[16]针对多EL系统,设计了两种分布式自适应神经网络控制律,实现了跟踪误差的渐近收敛。文献[17]采用神经网络的方法逼近与补偿系统的非线性不确定性,针对多EL系统提出了一种不利用邻居信息的分布式跟踪控制律,并保证了跟踪误差的有界性。针对输入干扰问题,文献[18]针对多EL系统,基于终端滑模技术提出了分布式鲁棒控制律,使系统状态趋于一致。在实际情况下,由于多智能体系统必须通过通讯才能交互信息,因此不可避免地存在通讯时延现象。通讯时延是多智能体协调控制研究必须考虑的一个问题。基于EL模型方法,文献[19]针对多星编队系统的姿态跟踪控制问题,考虑通讯时延,设计分布式控制律使所有跟随星的姿态趋于领航星的姿态;文献[20]研究无人机的编队飞行问题,在考虑通讯时延的情况下,同样实现了编队控制任务。考虑切换通讯拓扑和通讯时延影响,文献[21]针对异构多EL系统,提出了一种分布式控制算法,使所有系统的运动状态趋于一致;文献[22]研究了多EL系统协调控制问题,并同时考虑了系统存在参数不确定性和通讯时延的情况,但假设期望轨迹全局已知。目前对存在通讯时延的多EL系统的协调控制的研究还比较少,从工程实际的角度有必要进行深入的研究。

基于上述文献综述,本文针对多EL系统,在有向通讯拓扑下,同时考虑存在通讯时延以及模型非线性不确定性、外部扰动的情况,通过设计两种分布式协调控制律使所有跟随者实现对静态领航者的跟踪控制,并分别使跟踪误差最终有界和渐近收敛到零。和已有文献相比,本文的研究特色在于:①本文考虑的通讯拓扑含有通讯时延,模型具有非线性不确定性及外部扰动,更符合实际情况;②对每一个跟随者设计分布式观测器,在存在通讯时延情况下有效观测出领航者的状态量;③基于神经网络方法分别设计了两种自适应协调控制律,通过Lyapunov稳定性理论对两种控制律的稳定性进行了证明,并利用数值仿真验证了两种控制律的有效性。

1 数学基础和问题描述

1.1EL动力学方程

本文假设系统由n+1个智能体组成,其中有n个跟随者(记为Ι={1,2,…,n})和1个静态领航者(记为n+1)。跟随者i的动力学模型由EL方程表示为

在本文分析中,假设如式(1)所示的EL方程满足以下假设和性质:

假设1外部扰动ωi是有界的,并存在正常数ωMi,使‖ωi‖≤ωMi。

式中,v∈Rm为辅助状态量;S∈Rm×m和F∈Rp×m为常值实数矩阵。

注1通过合理选取v的初值以及矩阵S和F的维数和元素,可以保证qn+1保持为常值向量。

1.2代数图论

用有向图来描述智能体间的通讯拓扑结构。有向图G=(υ,ε,A由顶点集υ={1,…,n,n+1},边集ε⊆υ×υ和邻接矩阵组成。有向图的边(υi,υj)∈ε 表示智能体j能够获取智能体i的信息,υi为υj的父节点,υj为υi的子节点,并记υi为υj的邻居,υi所有父节点组成的集合Ni为智能体i的邻居集。若有向图中除了一个节点(称为根节点)外,其余每个节点均有且仅有一个父节点,且存在根节点到其余任何节点的路径,则称该有向图为有向树。有向图的有向生成树为包含该有向图所有节点的有向树。如果有向图存在一个为有向生成树的子图,则称该有向图具有有向生成树。

假设2有向图G具有一个有向生成树。

1.3问题描述

本文研究在有向图G下由n个跟随者和1个领航者组成的多EL系统,在存在模型非线性不确定性、外部扰动和恒定通讯时延的情况下,通过设计合适的分布式观测器和分布式自适应神经网络控制律,实现跟随者对领航者的跟踪控制。

2 分布式协调跟踪控制律设计

2.1分布式观测器设计与神经网络基础

由于领航者的状态不是全局已知,为了实现所有跟随者对领航者的跟踪控制,对于每一个跟随者,首先设计分布式观测器为

式中,ηi∈Rm、τ分别为跟随者i对领航者辅助状态v的估计、智能体间通讯的固定时延。其中

并且假设ηn+1=v。

引理1对于分布式观测器(3),在满足假设2的条件下,如果存在正定对称矩阵P,T∈Rnm×nm,使得Q矩阵为负定

证明由于领航者为静态,所以根据式(2b)可得v为常值,所以有v(t-τ)=v(t),因此将式(2)代入式(3)可以得到

由于矩阵Q的形式与文献[25]中的式(9.1.2)形式类似,因此根据文献[25]中定理9.1.1可以得到当存在正定对称矩阵P和T,使Q负定时,有证毕

注2对于矩阵P和T的求解过程,采用的是比较成熟的线性矩阵不等式(linear matrix inequality,LMI)求解技术。具体的求解方法和程序可以参考文献[25]“附录A.4”内容。并且值得说明的是,由于矩阵Q的形式和维数不是非常复杂,所以一般可以找到满足要求的矩阵解。

提出辅助变量

式中,α为正常数。将式(6)带入式(1),可以得到

基于本节提出的分布式观测器(3)、辅助变量(5)以及估计方程(9),以下分别设计两种分布式自适应控制律,以实现跟随者对领航者的跟踪控制。

2.2跟踪误差最终有界的分布式控制律设计

对跟随者系统(1),提出分布式控制律

式中,Wi为最优权值矩阵;φi为激活函数;εi表示有界逼近误差。那么跟随者i对fi的估计变量可以设计为

定理1在假设1、假设2成立的条件下,考虑存在模型非线性不确定性和外部扰动的多EL系统(1),通过有向图G进行通讯,且存在恒定通讯时延τ的情况下,在分布式观测器(3)和自适应控制律(10)的作用下,当满足δλmin(K)>1/2时,可以使跟随者和静态领航者间的跟踪误差趋于最终有界。

证明构造Lyapunov函数

对V求导可得

将式(7)、式(9)和式(10)带入式(12),并根据性质1可以得

式中,δ为正常数。

根据矩阵相关的放缩运算,式(16)关系式成立。

根据式(13)~式(16)可以得到

记λmin(·)表示矩阵的最小特征值,则式(17)可以写为

式(18)可以表示为

式中

由式(19)可得

因此,可以通过选取K和δ使得δλmin(K)>1/2,则β>0。又因为C>0,因此可得

由si的定义,可以得到

根据引理1和式(21)~式(22)可以得到

进一步求解计算可得

又因为

根据引理1和式(24)可得

因此得出在分布式观测器(3)和自适应控制律(10)作用下各跟随者对领航者的跟踪误差最终有界的结论。证毕

2.3跟踪误差渐近收敛的分布式控制律设计

本节在第2.2节基础上提出一种改进的分布式自适应控制律,保证所有跟随者对领航者的跟踪误差渐近收敛到零。

对跟随者系统(1),提出分布式控制律

式中,γ为正常数;Ki为正定对称矩阵;ki为正常数且满足ki≥‖ωi+εi‖1。

定理2在假设1、假设2成立的条件下,考虑存在模型非线性不确定性和外部扰动的多EL系统(1),通过有向图G进行通讯,且存在恒定通讯时延τ的情况下,在分布式观测器(3)和自适应控制律(26)的作用下,可以使跟随者和静态领航者间的跟踪误差渐近收敛到零。

证明构造以下Lyapunov函数

将控制器(26)代入式(7)有

仿照定理1的证明过程式(11)~式(13)可以得到

由式(14)和式(15)可得

根据式(27)与式(30)可以得到si∈L∞,并且存在V∞∈[0,V(0)]使得lim V(t)=V∞。对式(30)两边积分可得

由si的定义,给出稳态一阶微分方程

由式(32)和引理1(即¯ηi→0m),可以得到

因此得出在分布式观测器(3)和自适应控制律(26)作用下各跟随者对领航者的跟踪误差渐近收敛到零的结论。证毕

根据式(24)和式(34)可以得到

3 仿真实验

通过仿真实验验证两种控制律的有效性。考虑由5个两自由度机械臂构成的有向通讯网络,其中编号1~4为跟随者,编号5为领航者,如图1所示。

图1 智能体间通讯拓扑图

每个跟随者的EL动力学方程为

静态领航者的位置选取为

相对应的式(2)中的模型参数分别取为

跟随者状态的初始参数取为

考虑系统通讯时延为τ=0.05 s。对跟随者i(i=1,2,3,4),神经网络激活函数向量取为

式中,φij(z)是Guassian函数,即

控制律(10)的控制参数选取为Ki=36I2,γ=1,μ= 10,α=10。控制律(26)的控制参数选取为Ki=36I2,ki= 300,γ=1,α=10。

图2和图3分别表示在自适应控制律(10)的作用下,各跟随者跟踪领航者的运动轨迹。

图2 各跟随者关节1跟踪领航者关节1的运动轨迹

图3 各跟随者关节2跟踪领航者关节2的运动轨迹

图4和图5分别表示在自适应控制律(26)的作用下,各跟随者跟踪领航者的运动轨迹。

图4 各跟随者关节1跟踪领航者关节1的运动轨迹

由图2~图5可知,在分布式观测器(3)和自适应控制律式(10)与式(26)作用下,所有跟随者与领航者间的跟踪误差均可趋于收敛。对比图2与图4以及图3与图5可以发现,相比于控制律式(10),在控制律式(26)作用下跟随者对领航者的跟踪过程具有更小的超调和更好的动态特性,证明了控制律式(26)是相对于控制律式(10)的改进。

图5各跟随者关节2跟踪领航者关节2的运动轨迹

4 结 论

在有向通讯拓扑下,针对时延网络中存在模型非线性不确定性和外部扰动的多EL系统的分布式协调跟踪控制问题,提出了两种分布式自适应神经网络控制律,分别使跟随者和领航者间的跟踪误差最终有界和渐近收敛到零。考虑通讯时延,本文首先设计了一种分布式观测器,实现了对领航者状态量的观测。然后,提出了第一种分布式控制律,利用神经网络的方法逼近模型的非线性不确定性,理论上证明了跟踪误差可以最终有界;在此基础上,提出了改进的控制律,通过引入符号函数项,设置符号函数的增益值,得到了跟踪误差渐近收敛到零的结论。仿真实验验证了所提出的控制律的有效性。在本文研究结果基础上,下一步将考虑动态领航者,且存在通讯时变时延情况下的分布式协调控制问题。

[1]Xue D,Yao J,Chen G,et al.Formation control of networked multi-agent systems[J].IET Control Theory and Applications,2010,4(10):2168-2176.

[2]Yu W,Chen G R,Dong Z,et al.Distributed consensus filtering in sensor networks[J].IEEE Trans.on Systems Man and Cybernetics Part B-Cybernetics,2009,39(6):1568-1577.

[3]Jadbabaie A,Lin J,Morse A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules[J].IEEE Trans.on Automatic Control,2003,48(6):988-1001.

[4]Tang S Y,Zhu Y F,Li Q,et al.Survey of task allocation in multi Agent systems[J].Systems Engineering and Electronics,2010,32(10):2155-2161.(唐苏妍,朱一凡,李群,等.多Agent系统任务分配方法综述[J].系统工程与电子技术,2010,32(10):2155-2161.)

[5]Ren W,Beard R W,Atkins E M.Information consensus in multivehicle cooperative control[J].IEEE Control Systems Magazine,2007,27(2):71-82.

[6]Cortés J.Finite-time convergent gradient flows with applications to network consensus[J].Automatica,2006,42(11):1993-2000.

[7]Cheng L,Hou Z,TanM.Decentralized adaptive consensus control for multi-manipulator system with uncertain dynamics[C]//Proc.of the IEEE International Conference on Systems,Man,and Cybernetics,2008:2712-2717.

[8]Chopra N,Spong M W.On exponential synchronization of Kuramoto oscillators[J].IEEE Trans.on Automatic Control,2009,54(2):353-357.

[9]Dong W.On consensus algorithms of multiple uncertain mechanical systems with a reference trajectory[J].Automatica,2011,47(9):2023-2028.

[10]Ni W,Cheng D.Leader-following consensus of multi-agent systems under fixed and switching topologies[J].Systems and Control Letters,2010,59(3/4):209-217.

[11]Olfati-Saber R,Murray RM.Consensus and cooperation in networked multi-agent systems[J].Proceedings of the IEEE,2007,95(1):215-233.

[12]Lin P,Jia Y.Consensus of a class of second-order multi-agent systems with time-delay and jointly-connected topologies[J]. IEEE Trans.on Automatic Control,2010,55(3):778-784.

[13]Chung S,Slotine J J E.Cooperative robot control and concurrent synchronization of Lagrangian systems[J].IEEE Trans.on Robotics,2009,25(3):686-700.

[14]Mei J,Ren W,Ma G.Distributed coordinated tracking with a dynamic leader for multiple Euler-Lagrange systems[J].IEEE Trans.on Automatic Control,2011,56(6):1415-1421.

[15]Meng Z,Lin Z,Ren W.Leader-follower swarm tracking for networked Lagrange systems[J].Systems and Control Letters,2012,61(1):117-126.

[16]Chen G,Lewis F L.Distributed adaptive tracking control for synchronization of unknown networked Lagrangian systems[J].IEEE Trans.on Systems Man and Cybernetics Part B-Cybernetics,2011,41(3):805-816.

[17]Sun Y,Li C,Ma G,et al.Tracking control for multiple Lagrangian systems using neural networks without relative velocity information[C]//Proc.of the 11th World Congress on Intelligent Control and Automation,2014:4730-4735.

[18]Khoo S,Xie L,Man Z.Robust finite-time consensus tracking algorithm for multirobot systems[J].IEEE/ACME Trans.on Mechatronics,2009,14(2):219-228.

[19]Abdessameud A,Tayebi A,Polushin I G.Attitude synchronization of multiple rigid bodies with communication delays[J].IEEE Trans.on Automatic Control,2012,57(9):2405-2411.

[20]Abdessameud A,Tayebi A.Formation control of VTOL unmanned aerial vehicles with communication delays[J].Automatica,2011,47(11):2383-2394.

[21]Liu Y,Min H,Wang S,et al.Consensus for multiple heterogeneous Euler-Lagrange systems with time-delay and jointly connected topologies[J].Journal of the Franklin Institute,2014,351(6):3351-3363.

[22]Nuno E,Ortega R,Basanez L,et al.Synchronization of networks of nonidentical Euler-Lagrange systems with uncertain parameters and communication delays[J].IEEE Trans.on Automatic Control,2011,56(4):935-941.

[23]Cai H,Huang J.Leader-following consensus of multiple uncertain Euler-Lagrange systems under switching network topology[J].International Journal of General Systems,2014,43(3/4):294-304.

[24]Liu Y,Min HB,Wang S C,et al.Distributed adaptive syn-chronization of networked Euler-Lagrange systems with communication delays[J].Acta Automatica Sinica,2012,38(8):1270-1279.(刘源,闵海波,王仕成,等.时延网络中Euler-Lagrange系统的分布式自适应协调控制[J].自动化学报,2012,38(8):1270-1279.)

[25]Yu L.Robust control-the approach of LMI[M].Beijing:Tsinghua University Press,2002:158-160.(俞立.鲁棒控制线性矩阵不等式处理方法[M].北京:清华大学出版社,2002:158-160.)

制、导航制导与控制。

E-mail:sunyanchao@hit.edu.cn

陈亮名(1993-),男,博士研究生,主要研究方向为多智能体协同控制、导航制导与控制。

E-mail:chenlm_hit@163.com

李传江(1978-),男,教授,博士,主要研究方向为最优控制、导航制导与控制。

E-mail:lichuan@hit.edu.cn

马广富(1963-),通讯作者,男,教授,博士,主要研究方向为最优控制、导航制导与控制。

E-mail:magf@hit.edu.cn

Adaptive neural-network coordinated tracking control of multiple Euler-Lagrange systems with communication delays

SUN Yan-chao,CHEN Liang-ming,LI Chuan-jiang,MA Guang-fu
(School of Astronautics,Harbin Institute of Technology,Harbin 150001,China)

Considering communication delays,the coordinated tracking control problems of multiple Euler-Lagrange systems under a directed graph are investigated.The information of the static leader is available to only a subset of the followers.First,the distributed observer is designed so that the state information of the leader can be estimated by every follower.Then,considering model nonlinear uncertainties and external disturbances,two distributed adaptive control algorithms based on neural networks are proposed to make sure that the tracking errors for every follower can be bounded and asymptotically convergent,respectively.The closed-loop systems are investigated by using the Lyapunov theory and the graph theory.Numerical simulations are provided to verify the effectiveness of the proposed methods.

distributed control;Euler-Lagrange system;coordinated tracking;communication delays;neural networks

TP 273

A

10.3969/j.issn.1001-506X.2016.05.25

1001-506X(2016)05-1132-07

2015-02-10;

2015-10-19;网络优先出版日期:2015-01-12。

网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160112.1743.018.html

国家自然科学基金(61174200,61304005);高等学校博士学科点专项科研基金(20102302110031)资助课题

孙延超(1987-),男,博士研究生,主要研究方向为多智能体协同控

猜你喜欢

领航者有向图跟随者
极大限制弧连通有向图的度条件
有向图的Roman k-控制
“益源庆”打造中国高品质食醋领航者
基于改进的跟随领航者与人工势场的CGF队形控制及避障∗
IC访谈:“智慧政府”领航者——新华三集团
由城市台的“跟随者”到县域“三农”媒体的 “领导者”
从“跟随者”到“引领者”
—— 瓮福集团PPA项目成为搅动市场的“鲶鱼”
跟随者
孔裔国际公学 中国国际精英教育领航者
本原有向图的scrambling指数和m-competition指数