APP下载

广义伪连续下的多主从博弈弱Pareto-Nash 均衡的稳定性研究

2023-12-26殷伟东

中阿科技论坛(中英文) 2023年11期
关键词:局中人跟随者均衡点

殷伟东

(重庆工商大学数学与统计学院,重庆 400067)

1 综述

广义Nash问题提供了一个非合作博弈的数学模型,在这种博弈中,每个参与者都没有比对手更大的领导地位。当一个或多个参与者在游戏中扮演领导者的角色时,就会形成一个多主从博弈,其中最简单的是由一个领导者和多个跟随者组成的Stackelberg博弈。由于多主从博弈可以表述为Nash问题和Stackelberg博弈的推广,它已经被许多学者深入研究[1-4],并将其应用于电力市场、经济学、工程等方面。例如Pang等[5]首先对多主从博弈进行了研究,研究了一类可退化为准变分不等式的多主从博弈。俞建[6-7]的研究已经确立了存在多主从博弈平衡点,并且也验证了一主和二主多从博弈中存在Nash均衡点。另外,杨哲等[8]也对多主从博弈的均衡点是否存在进行了探讨。邓喜才等[9]证明了一类多主从博弈存在均衡点。Yu等[10]研究了具有单值目标函数的两主多从博弈,并得到了局部凸拓扑空间中的一个均衡存在定理。Basar等[11]提供了两人与多人主从博弈描述,并且展示了主从博弈均衡点的相关成果。Leyffer等[12]通过求解非线性优化问题得到了多主多从博弈的均衡点。Outrata[13]通过将多主从博弈转化为均衡问题,讨论了一个策略向量成为均衡问题的非合作解的必要条件。Sherali[14]给出了具有特式结构的多主从博弈弱Pareto-Nash均衡存在性和唯一性的结果。Hu等[15]研究了一类可表述为变分不等式的多主从博弈,并得到了一些存在性的结果。Ding[16]引入并研究了一类更一般的多主从博弈模型,并在非紧FC-空间中建立了一些均衡存在定理。Morgan等[17]在他们的论文中,引入了伪连续性概念,并确证了在具体环境中,给定玩家的支付函数是伪连续性时,至少会存在一个Nash均衡点。蔡江华等[18]率先公开在伪连续性状况下的主从博弈Nash均衡点存在性的定理,同时他们也运用非线性问题的本质连通区存在性来研究主从博弈的Nash均衡点的本质连通区。Jia等[19]的研究中,当玩家支付函数是连续的时候,对广义多目标主从博弈的弱Pareto-Nash均衡存在性进行了阐述,并且深入研究了其稳定性。

受到之前研究的启发,在广义多目标多主体多从体博弈问题存在一个弱Pareto-Nash均衡点的基础上,本文降低了对于参与者支付函数的连续性需求,借鉴了Zeng[20]研究中关于广义上伪连续的解释,基于局中人的支付函数在广义上呈现伪连续性和上伪连续性这一先决条件,构建了广义多目标多主从博弈的弱Pareto-Nash均衡解映射的上半连续性,再根据本质解的定义,对广义多主体-多从体博弈下弱Pareto-Nash均衡解的稳定性进行分析。

2 广义多目标多主体-多从体博弈

2.1 广义多目标多主体-多从体博弈弱Pareto-Nash均衡的模型

多个领导者与跟随者之间的主从博弈可以按照以下方法进行说明:

领导者和跟随者先后采取策略,其决定过程为领导者制定决策并通告跟随者。在跟随者掌握领导者的决定x∈X后,跟随者会再度执行一轮参数广义限制多目标博弈,通过含有领导者策略参数的广义约束多目标博弈模型来构建追随者的均衡解,设K:Xi×X-i→2Y代表追随者的参数广义约束多目标博弈的弱Pareto-Nash均衡解集,它表示对于任意的x=(xi,x-i)∈X,K(xi,x-i)代表跟随者的参数广义约束多目标博弈的弱Pareto-Nash均衡解集。对任意的y∗∈K(xi,x-i),都有,使得对于任意的j∈J,都存在,对于所有的,都满足如下的性质:

2.2 广义多目标多主体-多从体博弈弱Pareto-Nash均衡点的存在性和预备知识

定义2.1[20]设是定义了序关系的拓扑向量空间,其中int≠∅,Ε是一个拓扑向量空间X的一个非空凸子集,f:E→Rl是一个向量值映射。

(2)如果(-f)在z0处上伪连续,则称f在z0∈Rl处下伪连续。如果f在每一处z0∈Rl都是下伪连续,则称f在Rl上下伪连续。

(3)如果f既是上伪连续又是下伪连续,则称f是伪连续。

引理2.1[20]设f是定义在Rl上的一个扩展实值函数。那么,下面这些陈述是等价的。

(1)f在Rl上是上伪连续。

(2)L={(z,λ) ∈ Rl×f(Rl∣)f(z) ≥λ}在Rl×f(Rl)是闭的。

(3)对所有的λ∈f(Rl),Uλ={z∈R∣lf(z) ≥λ}是闭的。

此外,上伪连续性保证了在紧集上存在最大点。

引理2.2[20]设X为一个Hausdorff空间,且X是局部凸的。E是X中的一个紧子集,且E是非空的和具有凸性。设 : 2E F E→ 具有上半连续性,且对任意的x∈E,F(x) 是非空的,同时F(x) 具有闭性和凸性。那么F在Ε中有一个不动点。

引理2.3[20]假设X和Y是两个局部凸的Hausdorff空间和Y是紧的,则集值映射 : 2Y F X→ 有紧值且上半连续当且仅当它是一个闭映射。

3 广义多目标多主从博弈的通有稳定性

下面分情况讨论:

第一种情况:

同理可以得到集值映射Γ上半连续。

注3.1:蔡江华等[18]的研究中得到了单主多从博弈解映射的上半连续性,定理3.1得到了多主多从博弈解映射的上半连续性,所以本文与蔡江华等[18]所考虑的模型不同。蔡江华等[18]考虑的是单目标单主多从博弈,本文广义多目标多主从博弈考虑的是具有多个目标的博弈问题,这种广义形式允许玩家追求多个不同的目标,而不仅限于单一的优化目标。

注3.2:Jia等[19]的研究中的定理3.6的条件(1)中,局中人支付函数是连续的。本文定理3.2的条件(1)中,局中人支付函数是广义上伪连续的,所以本文考虑的局中人支付函数连续的条件更弱。Jia等[19]的研究中的定理3.6的条件(2)中,考虑的是映射Φi似-拟凹,本文定理3.2的条件(2)中,考虑的是映射iΦ-广义拟凸,所以本文考虑的映射iΦ的凸性条件更弱。所以本文推广了Jia等[19]的研究中的相应结果。

定义3.1 设ζ∈Ω。(1)如果对任意ε>0,都存在δ>0,使得对任意ζ′∈,ρ(ζ,ζ′)<δ,存在‖x-x′‖<ε,使得x′∈W(ζ′),那么x∈W(ζ)是本质的。(2)如果每一个x∈W(ζ)都是本质的,那么ζ是本质的。

引理3.2[19]假设Ζ是一个度量空间,X是一个具有完备性的度量空间和 : 2Z W X→ 是一个上半连续映射。那么在X中可以找到一个稠密且剩余的子集Q,确保W在Q上保持下半连续性。

注3.3:从上述定义可以知道,ζ∈Ω是本质的集值映射W在ζ∈Ω处是下半连续的。

定理3.3Ω中有一个稠密且剩余的子集Q,使得对于每一个ζ∈Ω都是本质的。

证明 通过引理3.1,引理3.2和注3.3,可以直接得到定理3.3。

4 结论

因为广义多目标多主从博弈允许参与者不局限于单一的优化目标,所以这种博弈被广泛应用于经济学、管理学等领域。在局中人支付函数伪连续的条件下,蔡江华等[18]已经得到了单主多从博弈解映射的上半连续性。因为在广义多目标多主从博弈中,允许玩家追求多个不同的目标,所以本文利用局中人支付函数广义伪连续的条件,将仅限于单一的优化目标的单主多从博弈推广至广义多目标多主从博弈中,并得到了广义多目标多主从博弈解映射的上半连续性。然后,在映射Φi似-拟凹和参与者支付函数具有连续性的条件下,Jia等[19]已经证实了广义多目标多主从博弈弱Pareto-Nash均衡解映射的上半连续性,本文的创新点在于,不仅优化了参与者支付函数连续的条件,还降低了映射iΦ的凹性的约束条件,利用参与者支付函数更弱的广义上伪连续性和映射iΦ-广义拟凸的条件,得到了广义多目标多主从博弈弱Pareto-Nash均衡解映射的上半连续性,在一定程度上拓展了Jia等[19]的研究成果。最后,基于广义多目标多主从博弈弱Pareto-Nash均衡解映射的上半连续性以及本质解的定义,得到了广义多目标多主从博弈弱Pareto-Nash均衡的稳定性。

猜你喜欢

局中人跟随者均衡点
交易成本理论在油田企业小修业务自营和外包决策中的应用分析
2×2型博弈决策均衡的归一化解法
三级供应链投资模型的评价管理
由城市台的“跟随者”到县域“三农”媒体的 “领导者”
从“跟随者”到“引领者”
—— 瓮福集团PPA项目成为搅动市场的“鲶鱼”
跟随者
超对策模型中多形式结局偏好认知信息融合的0—1规划方法
均衡点移动的直观图示及其例析
具有失真认知信息的两层冲突环境建模与分析
出口跟随者会受益于开拓者吗?——来自中国工业企业的证据