APP下载

改进的扰动LPV系统输出反馈预测控制

2023-01-03平,赵

电子科技 2023年1期
关键词:鲁棒最优控制观测器

王 平,赵 敏

(上海理工大学 光电信息与计算机工程学院,上海 200093)

模型预测控制因其适用于处理约束和多变量问题而备受工业界青睐,是一种重要的控制技术[1-2]。文献[3]针对多面体描述的线性时变系统和线性时不变系统,提出了基于显式模型的鲁棒约束预测控制算法。文献[4]将这种思想应用于线性变参数系统,在假设系统状态精确可测的前提下,采用了一种基于拟最小最大算法的状态反馈预测控制方案。然而预测控制是基于模型的控制策略,精确的系统模型起着重要的作用,模型的不确定性在实际系统中是不可避免的,因此基于不确定模型鲁棒控制器的设计已成为一个重要的研究方向[5]。

为解决这一问题,文献[6~8]针对带有输入约束的LPV(Linear Parameter Variable)系统,采用了一种基于输出反馈的MPC(Model Predictive Control)方法。该MPC方法在线设计鲁棒状态观测器,基于状态观测器在线获得系统每一时刻状态的估计值,通过设计鲁棒输出反馈控制器得到最优控制律,保证了受输入约束系统的鲁棒稳定性。文献[9~12]采用一种基于拟最小最大算法的输出反馈鲁棒预测控制策略,基于线性矩阵不等式设计离线鲁棒状态观测器,利用鲁棒状态观测器观测系统状态,进而在线通过鲁棒输出反馈预测控制算法,得到最优控制律。虽然该算法考虑了LPV系统的不确定因素,但是难以保证受扰动系统的渐近稳定性。因此,本文将给出一种新的输出反馈预测控制方法来解决这一问题。

针对一类带有有界状态干扰的多胞描述LPV系统,本文以保证系统的渐近稳定性为目标,提出一种鲁棒预测控制改进方法,并设计了输出反馈控制器。该控制器考虑了无扰动LPV模型,基于线性矩阵不等式求解最小最大鲁棒输出反馈控制律;随后,获得保证扰动LPV系统鲁棒渐近稳定的最优偏移量,与无扰动系统反馈控制律组合得到最优控制律,并施加于实际系统;最后,证明了扰动LPV系统的渐近稳定性。

1 问题描述

考虑以下不确定LPV系统

xc(k+1)=A(ρ(k))xc(k)+B(ρ(k))uc(k)+w(k)

yc(k)=C(ρ(k))xc(k)

(1)

式中,uc(k)∈Rnu、xc(k)∈Rnx、yc(k)∈Rny分别为系统的控制输入、不可测状态以及可测输出;w(k)⊂W为有界干扰,且W⊂Rnx;A(ρ(k))、B(ρ(k))、C(ρ(k))属于多面体矩阵集合

[A(ρ(k))|B(ρ(k))|C(ρ(k))]∈Ω

(2)

其中

Ω=Co{[A1|B1|C1],[A2|B2|C2],…,[Al|Bl|Cl]}

(3)

式中,Co为凸包;{[A1|B1|C1],[A2|B2|C2],…,[Al|Bl|Cl]},j∈{1,2,…,l}为多面体Ω的顶点;l为多面体顶点的个数。

假设1ρ(k)在k时刻可测量,即[A(ρ(k)),B(ρ(k)),C(ρ(k))]在k时刻已知。

假设2(A(ρk)),B(ρ(k)))以及(C(ρ(k)),A(ρ(k))),对于所有k≥0为完全可控可观。

本文针对如式(1)所示的带有有界状态干扰的不确定LPV系统,设计输出反馈鲁棒预测控制器,得到最优控制律,并施加于该系统,保证了扰动LPV系统的鲁棒渐近稳定性。

2 无扰动LPV系统控制器设计

考虑无扰动LPV系统模型如式(4)所示。

(4)

为求取控制律使如式(4)所示的系统渐近稳定,首先提出一种鲁棒状态观测器的离线设计方法;进而构造具有LMI(Linear Matrix Inequality)约束的在线优化MPC问题;最后通过求解该优化问题得到最小最大鲁棒输出反馈控制律。

2.1 离线状态观测器设计

由于如式(4)所示的系统状态不可测,故采取如下所示的状态观测器[13]

x0(k+1)=A(ρ(k))x0(k)+B(ρ(k))u(k)+

Lpy(k)-C(ρ(k))x0(k))

(5)

式中,x0(k)、u(k)、y(k)分别为估计状态、控制输入以及可测输出。为确定观测器增益Lp,定义该系统的估计误差e(k)=x(k)-x0(k),则下一时刻

e(k+1)=(A(ρ(k))-LpC(ρ(k)))e(k)

(6)

定义一个二次函数

(7)

且满足二次稳定性条件

E(e(k+1))-μE(e(k))≤0

(8)

式中,μ(0<μ<1)是预先指定的衰减率,可保证当k→∞时,e(k)→0。将式(6)和(7)代入(8)中,且左右分别乘以对角矩阵{I,Pe},令Ye=LpPe,可得

(9)

通过求解以下优化问题可得Lp。

(10)

2.2 在线输出反馈预测控制

为保证式(4)的渐近稳定性,引入以下预测模型[14]

g(k+1+i|k)=A(ρ(k+i))g(k+i|k)+

B(ρ(k+i))u(k+i|k)

(11)

g(k+1|k)=x0(k+1)

式中,i≥1;g(k+i|k),u(k+i|k)分别为式(4)在k时刻预测k+i时刻的系统状态以及控制输入。令g(k|k)=x0(k),u(k)=u(k|k),未来控制律描述为

u(k+i|k)=F(k)g(k+i|k)

(12)

式中,F(k)为k时刻确定的反馈增益。

针对式(4)在每个时刻求解如下最小最大优化问题

(13)

式中

(14)

同时二次函数V(g(k+i|k))满足以下约束条件[15]

(15)

由鲁棒稳定性可得g(∞|k)=0,即V(g(∞|k))=0,将式(15)左右两端从i=1到∞分别相加可得

(16)

式中

V(g(k+1|k))=g(k+1|k)TP(k)g(k+1|k)

(17)

对系统性能附加约束

(18)

其中γ(k)是待最小化的非负变量。

基于式(15)、式(18),可将所提出的最小最大优化问题修改为

(19)

为保证式(19)的鲁棒稳定性,附加如下所示的稳定性条件。

γ(k)<γ(k-1)

(20)

在满足式(15)、(20),式(18)的条件下,解决式(19)可得控制律u(k)及反馈增益F(k),因此,设计上述鲁棒控制器的问题可转化为一个带有LMI约束的优化问题,如下定理所示。

(21)

s.t.式(4)、式(5)、式(13)

(22)

(23)

γ(k)-γ(k-1)<0

(24)

式中

(25)

若对于给定的x0(k)和y(k)存在u(k|k)、Y(k)、Q(k),则反馈增益F(k)可由F(k)=Y(k)Q(k)-1计算得到。

证明将式(18)中P(k)替换为γ(k)Q(k)-1可得

1-Ψ(k)-T(k)TQ(k)-1T(k)>0

(26)

式中

(27)

通过应用Schur补定理,可得

(28)

式中

(29)

同理对式(28)应用Schur补定理,由此可得式(22),因此式(18)可由式(22)保证。

令u(k+i|k)=F(k)g(k+i|k) (i≥1),将式(12)代入式(15),可得

ζ(k)-ξ(k+i)TP(k)ξ(k+i)>0

(30)

其中

(31)

式(30)两边分别乘以γ(k)P(k)-1,令P(k)=γ(k)Q(k)-1且应用Schur补定理可得到

(32)

式中

(33)

令Y(k)=F(k)Q(k)后应用Schur补定理可得

(34)

式中

R(k)=A(ρ(k+i))Q(k)+B(ρ(k+i))Y(k)

(35)

将不等式(34)映射于式(36)中

[A(ρ(k+i))|B(ρ(k+i))|C(ρ(k+i))]∈Ω

(36)

若存在Q(k)和Y(k)使式(34)成立,则可证得式(23)成立,因此式(15)可由式(23)保证,此时证毕。

定理2(递归可行性) 对于式(21),若k时刻能确定一个递归可行解,则在所有t>k时刻,式(21)都是有解的。

证明若证明k时刻得到的优化问题的解是k+1时刻的可行解。设

(37)

基于式(5)、式(11)、式(24)及式(37),则式(22)和式(24)可被改写为

(38)

式中

(39)

由于式(23)在k时刻被满足,所以式(38)成立,因此若能在k时刻确定一个可行解,则式(21)在k+1时刻可行;证毕。

定理3(渐近稳定性) 式(21)的可行解保证系统的渐近稳定性,即当k→∞时,x(k)→0。

证明若式(21)对于所有步骤可行,基于式(15)的式(24)保证g(k+1|k)收敛到0,此外从状态观测器的设计中可保证当k→∞时,e(k)→0,即估计状态x0(k)收敛于式(4)真实状态x(k),因此式(21)的可行解保证系统的渐近稳定性,即k→∞时,x(k)→0,此时证毕。

综上所述,本文针对无扰动系统模型提出的在线优化MPC问题描述如下

(40)

通过求解式(40)可获得基于输出反馈的鲁棒预测控制律u(k+i|k),保证无扰动LPV系统的渐近稳定性,下面则考虑在有界状态干扰的情况下,如何求取最优控制律。

3 扰动LPV系统最优控制律

考虑扰动LPV系统,由于式(1)状态xc(k)不可测,采取如下所示的状态观测器

xc0k+1)=Aρk))xc0k)+Bρk))uk)+

Lpyk)-Cρk))xc0k))

(41)

uck)=uk)+Kxc0k)-x0k))

(42)

由式(42)可得,xc0(k)与x0(k)的差值可分别基于式(41)、式(5)得到,u(k)可通过求解式(40)得到,而反馈增益K未确定,故下面通过状态反馈确定反馈增益K,根据式(5)、式(41)定义z(k)=xc0(k)-x0(k)为控制误差,则下一时刻控制误差

(43)

式中,ec(k)、e(k)分别为式(1)、式(4)的估计误差,基于上述离线状态观测器的设计可得,当k→∞时,ec(k) →0,e(k) →0。因此为使式(43)稳定,(A(ρ(k))+B(ρ(k))K)一定趋于0,根据式(43)可得[16]

(44)

定义二次函数

(45)

并满足以下二次稳定性条件

(46)

其中,α(0<α<1)是预先指定的衰减率,将式(44)、式(45)代入式(46)中可得

(47)

将式(47)左右分别乘以{I,Pz},并令Yz=LpPz,有

(48)

故求取下列优化问题即可确定反馈增益K。

(49)

最后根据式(42)可得最优控制律uc(k)。

定理4最优控制律uc(k)施加于扰动LPV式(1)中,保证了扰动LPV系统的鲁棒渐近稳定性。

证明状态反馈增益K可保证当k→∞时,(A(ρ(k))+B(ρ(k))K)→0,且当k→∞时,ec(k)→0,e(k)→0,因此由式(43)可得,当k→∞时,控制误差z(k)趋于0,所以xc0(k)最终会收敛到x0(k)。无扰动控制律的设计保证式(4)的渐近稳定性,即当k→∞时,x0(k) →0,因此当k→∞时,xc0(k) →0;又因为当k→∞时,ec(k) →0,所以式(1)的估计状态xc0(k)将会收敛到式(1)的实际状态xc(k),即当k→∞时,xc(k)→0;由此可得将最优控制律uc(k)施加于式(1)中,保证式(1)的鲁棒渐近稳定性;证毕。

当系统的初始状态在某一输入的驱动下,系统从这一初始状态运动到末态,若存在扰动使系统的初始状态在某一范围内发生偏移,但系统的终态仍能回到给定的末态范围内,则称该系统是稳定的,这就是普通意义上的稳定性。而渐近稳定性是稳定性的一种,它要求当时间趋于无穷时,当系统的初始状态在某一范围内,系统的终态会回到零点。可见渐近稳定比稳定对系统的要求严格,前者只需系统末态所在的范围是零点周围的一个区域,而后者要求系统末态趋近的这一点必须是零点,这就是渐近稳定性与稳定性的区别。通过上述定理4的证明,说明本文所提出的方法控制性能较好,能够保证扰动LPV系统的渐近稳定性。算法具体步骤如下文所述。

离线阶段步骤:

步骤1计算Lp、K;选择合适的L和R;

步骤2选择合适的衰减律μ(0<μ<1)、α(0<α<1)使得式(10)、式(49)可行。

在线阶段(k≥0)步骤:

步骤1在k= 0时刻,分别选定式(4)、式(5)的初始状态x(0)、x0(0);

步骤2在k≥0时刻,根据式(5)得到x0(k),根据式(41)得到xc0(k),并计算xc0(k)-x0(k);

步骤3基于式(5)在线求解式(40)获得控制输入u(k)以及反馈增益F(k);

步骤4计算uc(k)=u(k)+K(xc0(k)-x0(k)),并将uc(k)施加于实际系统中;

步骤5重复在线阶段的步骤2,直至xc0(k)=0,结束。

4 数值例子

通过下面的数值算例证明该方法的有效性,首先给出如下所示的LPV系统

(50)

引用模型系数[17]

(51)

给式(50)加入有界扰动w(k)∈W

W={w∈R2||w|∞≤0.01}

根据反馈增益K、式(5)以及式(41)每一时刻所估计的状态值可得到每一时刻的扰动LPV系统控制输入的偏移量,随后在线求解式(40)得到无扰动系统控制输入u(k),最后将无扰动控制律组合最优偏移量得到式(50)的最优控制律u*(k)。下面将对文献[10]中的方法与本文中的方法做对比分析。

由图1可以看出,文献[10]所提出的方法能够保证扰动LPV系统的末态进入零点周围的一个区域,但是难以保证扰动LPV系统的渐近稳定性;而本文所提出的方法可使得扰动LPV系统状态更快地进入稳态,并且能够保证扰动LPV系统的渐近稳定性,因此本文所提出的方法要优于文献[10]。本文中,在MPC的设计中考虑到了有界状态干扰所造成的偏移量,因此相比于未考虑扰动的MPC方法[18],本文所提出的方法在实际生活中更加具有通用性。存在干扰的式(50)估计状态与实际状态的横、纵坐标分别绘制在图2、图3中,估计状态轨迹的坐标设定从[-0.8,-0.2]开始,实际状态轨迹坐标设定从[-1,1.2]开始,图2以估计状态与实际状态的横坐标为y轴,以时间为x轴。

图1 系统状态轨迹对比图Figure 1. Comparison diagram of system state trajectories

图2 估计状态与实际状态横坐标轨迹Figure 2. Estimated and actual state abscissa trajectories

图3以估计状态与实际状态的纵坐标为y轴,以时间为x轴。

图3 估计状态与实际状态的纵坐标轨迹Figure 3. Estimated and actual state longitudinal trajectories

由图2、图3可以看出,式(50)估计状态与实际状态的坐标轨迹最终汇合并且收敛于0,所以表明本文所提出的状态观测器效果良好。系统的最优控制律如图4所示。

图4 扰动LPV系统的最优控制律Figure 4. Optimal control law for a perturbed LPV system

由图4可以看出,本文所提出的方法具有递归可行性,每一时刻都可求得最优控制律。该仿真针对二维系统,只有两个变量,当变量个数增加后,系统维数增加,若采用本文方法,计算量会增大,因为相对应的矩阵维数会随之增加,因此基于线性矩阵不等式的在线优化问题的求解,离线状态观测器增益以及反馈增益K的确定都更加繁琐。对于高维数系统的渐近稳定性而言,定理4同样适用于高维数系统,因此当系统维数增高,本文所提出的方法同样可保证系统的渐近稳定性。

5 结束语

本文针对一类带有有界状态干扰的多胞描述LPV系统,提出了一种改进鲁棒预测控制方法,设计了可保证系统渐近稳定的输出反馈控制器。该控制器考虑无扰动LPV系统模型,基于LMI约束求解输出反馈控制律。为抵消有界状态干扰,本文设计并求取扰动LPV系统控制输入的最优偏移量,基于无扰动系统模型求取的控制律组合最优偏移量即可得到扰动LPV系统的最优控制律,最后将最优控制律施加到实际系统中,并通过仿真实验验证了算法的有效性。

猜你喜欢

鲁棒最优控制观测器
基于增益调度与光滑切换的倾转旋翼机最优控制
基于滑模观测器的PMSM无位置传感器控制策略
基于非线性干扰观测器的航天器相对姿轨耦合控制
二阶微分方程最优反馈控制
基于高阶LADRC的V/STOL飞机悬停/平移模式鲁棒协调解耦控制
基于学习的鲁棒自适应评判控制研究进展
基于随机最优控制的缴费确定型养老基金资产配置策略
基于滑模观测器的机翼颤振主动抑制设计
目标鲁棒识别的抗旋转HDO 局部特征描述
基于干扰观测器的船舶系统航向Backstepping 控制