非对称代数Riccati方程的一种快速Newton型算法

2021-06-29王小利钟瑞华

闽南师范大学学报(自然科学版) 2021年2期

宋岩,王小利,钟瑞华

（闽南师范大学数学与统计学院,福建漳州363000）

本文考虑如下来源于中子运输理论的非对称代数Riccati方程：

其中X∈ℝn×n是未知矩阵,O是零矩阵,已知矩阵Α=Δ-eqT∈ℝn×n,B=eeT∈ℝn×n,C=qqT∈ℝn×n,D =Γ -qeT∈ℝn×n,且分别是定义在区间[0,1]上的Gauss-Legendre权重和节点.

式(1)可能存在多个解,但只有最小正解(即元素均为正数的矩阵)才具有物理意义[1].本文关注于求解式(1)最小正解的数值算法.Lu[2]在2005年首次将该矩阵方程转化为一种非线性向量方程,并指出只要通过计算向量方程的最小正解,即可得到矩阵方程的最小正解.具体来说,若X∈ℝn×n是式(1)的最小正解,则满足:

于是通过计算式(3)的最小正解,可以得到式(1)的最小正解.

关于式(3)的数值算法,目前主要有基于不动点迭代的研究,如文献[2-4],及基于Newton 型迭代的研究,如文献[5-11].由于Newton型迭代具有快速收敛性,故得到了广泛的关注.例如,Lu[7]在2005年提出了基于Newton法的一种迭代算法.进一步,Lin等[8]在2008年提出了基于一种三阶收敛的两步Newton法.

本文基于文献[12]所提出的一种具有三阶收敛的两步Newton法,提出了新的计算式(3)的数值迭代算法, 并证明了由该算法迭代产生的向量序列的单调收敛性. 最后, 通过一些数值实验来比较该算法和Newton法以及文献[8]中具有三阶收敛的两步Newton法的计算效能.

1 一种三阶收敛的两步Newton型方法

对于u,v∈ℝn,记x=[uT,vT]T,则式(3)等价于f(x)= 0.给定初始点x0=[uT0,vT0]T∈ℝ2n,考虑如下形式的两步Newton迭代：

其中xk=[uTk,vTk]T,yk=[uˉTk,vˉTk]T.式(4)的标量形式由Frontini和Sormani[12]在2003年将Newton法和文献[13]结合而得到.此外,由式(3)可得f的Jacobi矩阵:

基于迭代格式(4),得到如下用于计算式(3)的两步Newton 型算法.

算法1 一种计算式(3)的两步Newton 型算法选择初始向量u0,v0 ∈ℝn.对于k = 1,2,…,重复以下迭代过程,直至收敛:Step 1.求解关于uˉk,vˉk ∈ℝn的线性方程组:(In - G2(uk)- ZkH1(uk))vˉk = Zkgk - G2(uk)vk - H2(vk)uk +1 2 (vk + vk ∘P͂uk + e),(In - G1(vk))uˉk = H1(uk)vˉk + gk,其中Ζk = H2(vk)(In - G1(vk))-1,gk=1 2 (uk + uk ∘Pvk + e)- G1(vk)uk - H1(uk)vk.Step 2.求解关于uk + 1,vk + 1 ∈ℝn的线性方程组:(In - G2(uˉk)- Ζˉk(H1(uˉk))vk + 1 = Ζˉkgˉk - G2(uˉk)vk - H2(vˉk)uk + vk ∘P͂uk + e,(In - G1(vˉk))uk + 1 = H1(uˉk)vk + 1 + gˉk,其中Zˉk = H2(vˉk)(In - G1(vˉk))-1,gˉk = uk ∘Pvk + e - G1(vˉk)uk - H1(uˉk)vk.

在初始向量u0,v0∈ℝn满足一定条件时,可得到由上述算法迭代产生的向量序列单调收敛于式(3)的最小正解.该收敛性分析将在下一节给出.

2 算法的单调收敛性分析

对于任意的矩阵A,B∈ℝm×n,A∘B=(aijbij)m×n表示A和B的Hadamard 内积. 若对i= 1,2,…,m,j=1,2,…,n,有aij≥bij(aij＞bij),则记A≥B(A＞B);若aij＞0(aij≥0),则称A是正矩阵(非负矩阵).如果一个向量的所有分量都是正(负),我们称它为正(负)向量.如果矩阵A的所有非对角元素都是非正的,则称实方阵A是Z-矩阵.Z-矩阵A可以表示成A=sI-B,其中s∈ℝ,B≥O,I是n阶单位矩阵.若s＞ρ(B),则称Z-矩阵A是非奇异矩阵,其中ρ(B)是B的谱半径.

引理1[8]A∈ℝn×n是一个Z-矩阵,则以下条件等价:

1)A是非奇异的M-矩阵;

2)A-1≥O;

3)若Av＞0 ∈ℝn,则v＞0.

引理2[8]对∀x,h1,h2∈ℝ2n,有f″(x)(h1,h2)=[hT1LT1h2,hT1LT2h2,…,hT1LTnh2]∈ℝ2n,其中

pi和是矩阵P和͂第i列向量.特别地f‴(x)=O,故由Taylor公式有

引理3[7]对任意h,h1,h2∈ℝn{0},且h1＜h2,则

引理4[7]若ρ(G(x∗))≤1,则f′(x∗)=I2n-G(x∗)是M-矩阵,其中G(x)由式(5)定义.此外对任意x满足0 ≤x＜x∗,f′(x)是非奇异的M-矩阵.

引理5对∀v1,v2,u1,u2∈ℝn,记x=[u1T,v1T]T,y=[u2T,v2T]T,若v1≤v2,u1≤u2,则f′(y)≤f′(x).

证明

故

定理记x∗是向量方程f(x)= 0的最小正解,若初始向量x0∈ℝ2n,满足0≤x0＜x∗,且f(x0)＜0,则由算法1迭代产生的向量序列{xk}k≥0和{yk}k≥0有定义,且有以下结论:

a)f(xk)＜0,k≥0;

b)0≤xk＜yk＜xk+1＜x∗,k≥0;

证明利用数学归纳法证明a)和b).当k= 0 时,利用式(4)及引理1-4 易得a)和b)成立.假设k=l时,a)和b)成立,下面考虑k=l+ 1的情形.由式(4)和引理5有

即xl+1-yl＞yl-xl.进而,由引理3得

故由式(6)得

故当k=l+ 1时,f(xl+1)＜0,即a)成立.

对于b),由式(4)和式(6)得

则

得yl+1＜x*,故由引理4知f′(yl+1)是非奇异的M-矩阵,从而由引理1得f′(yl+1)-1＞O.当k=l+ 1时,由式(4)得xl+1＜yl+1,xl+1＜xl+2.由式(6)得及引理5得

进而由式(4)和式(6)得

注意到f′(yl+1)是非奇异的M-矩阵,故由引理1知xl+2＞yl+1.于是由式(4)和式(6)得

即x*-yl+1＞yl+1-xl+1,则由引理3知

由式(4)和式(6)得

则

故xl+2＜x*.由此可知,当k=l+ 1时,b)成立.因此,对任意k≥0时,a)和b)都成立.

3 数值实验

本节通过一些数值实验来比较算法1(记为TSNM)和文献[7]中的基于Newton 法(记为NM)以及文献[8]中的三阶收敛的两步Newton 法(记为MNI)的计算效能.分别选取(α,c)=(10-7,1 - 5×10-7)和(α,c)=(0.3,0.7)进行测试,在每个测试中,给出迭代次数(记为IT)和相对残差(记为ERR).

维数n分别取512,1 024,2 048,4 096,节点ci和权重ωi,i= 1,2,…,n,从区间[0,1]作数值积分得出.具体步骤,将区间[0,1]分为n4个长度相等的区间,并对每个区间应用Gauss-Legendre 四点求积公式.

我们选取初始点u0=v0=0∈ℝn,算法终止的条件是