噪声强度对空间公共物品博弈的影响

2015-12-19牛亚兰

复杂系统与复杂性科学 2015年3期

牛亚兰，赵明

（1.广西师范大学物理科学与技术学院，桂林541004；2.柳州师范高等专科学校图书馆，广西来宾546100）

自然或社会系统中广泛存在着合作与竞争行为，博弈理论能够很好地描述与解释这些现象。在之前的研究中，为了方便人们通常假设个体以均匀混合的方式进行联系，即所有个体全部相互接触或者个体之间随机接触，但在现实中，个体之间的联系并非如此，个体往往是只与其有限的特定邻居相联系。最早研究这个问题的是Nowak和May，1992年他们将博弈个体放置在具有空间结构的网络上并让所有个体只与其邻居进行囚徒困境博弈［1］，在这样的系统中合作者与背叛者能够很好地共存，在特殊的初始条件下甚至可以产生类似于混沌的时空斑图，由此开始了空间演化博弈的研究。在随后的二十几年内这一研究方向吸引了许多生物学家、物理学家、经济学家、社会科学者，各种空间博弈理论逐步被提出，空间演化博弈的研究取得了丰硕的成果［2－16］。在早期的博弈研究中个体往往被假设是完全理性的，这显然与现实不相符，因为在经济系统中非理性因素是普遍存在的，它的作用类似于噪声对系统的影响。为了描述这一现象，1998年物理学家Szabó和Töke将二维平面格子中的伊辛模型和费米动力学引入到囚徒困境博弈［4］，作者在学习概率公式中巧妙加入了噪声项，允许个体非理性的选择是否改变原策略，这给博弈的研究带来了一次质的飞跃。到目前为止，研究最多的博弈模型是囚徒困境博弈和铲雪堆博弈，但近年来多人参与的公共物品博弈模型也被广泛关注，它能够模拟真实的经济系统中个体或团队的投资、合作与收益分配等现象，存在噪声的情况下空间公共物品博弈合作行为的演化势必会受到影响。过去人们只是定性讨论了噪声对系统的影响［4，8－12］，本文对噪声强度对空间公共物品博弈的影响加以细致研究。模拟结果表明，噪声对合作行为的出现起到了抑制作用，并且抑制作用的大小跟系统增益系数有关。另外，在噪声强度较小时合作频率随增益系数的增大呈现阶梯式上升，并且噪声越小阶梯越明显；在噪声强度很小（如κ＝0.001）即个体是非常理性的情况下，合作频率随增益系数的变化不再是连续增大而是出现分段现象，在临界增益系数处合作频率发生了突变。我们对合作频率分段现象的原因进行解释。

1 模型介绍

我们采用的网络模型是具有周期边界条件的二维正方晶格网络，每个节点均有4个邻居节点，节点代表博弈个体，边表示个体与其邻居的博弈关系。类似经典公共物品博弈实验［17］，假设有一个公共的基金，每个个体独立并且同时决定选择投资（合作）或者不投资（背叛）到这个基金中，合作者每次均投资c单位的货币，背叛者投资为零，所投进的总资金将以r的倍数增值（r为增益系数，r＞1），然后平分给所有个体。公共物品博弈模型的定义有多种形式，例如，个体只参与自身及其邻居组成的群体博弈，即单群体博弈［18］；另外，个体同时参与多个群体的博弈，每个个体持有固定的资金c，合作者的资金c平分到所参与的群体中，即多群体博弈［19－20］；还有一种形式是个体虽然参与多个群体，但每参与一个群体就投入c单位的资本，这是介于以上两种形式之间的另一种公共物品博弈模型。现在我们研究的是最后一种形式，在我们的模型中，个体和其最近邻进行公共物品博弈，每个个体同时参加以自己为中心和以其邻居为中心的群体博弈，为研究方便假设合作者每参与一个群体投入1单位的资本，每个群体增值后的总资金将平分给参与这个群体的所有个体，平分到的资金减去自身投资的金额为个体的净利润，称为收益。初始状态是合作者与背叛者均匀混合分布在这个网络中，每个个体以相等的概率选择合作或背叛策略。个体x参与一个群体博弈所得收益为

其中，nc与nd分别为这个群体中选择合作和背叛的个体数，s（x）为个体x的投资金额。每一时步个体x所得收益为参与5个群体所得收益和，用P（x）表示。

采取同步更新策略的方法，个体根据费米更新规则调整自己的策略，个体x随机等概率地选择一个邻居个体y并以一定概率学习其策略，学习概率为

其中，P（x）和P（y）分别为x和y两参与者在上一时步所得的收益，κ为噪声强度。在噪声强度很小（κ→0）的情况下，当P（y）＞P（x）时学习概率为1，当P（y）≤P（x）时学习概率为0，意味着个体一定向比自己收益高的个体学习；当噪声强度取大于零的某一值时，即使所选邻居收益比自身收益小仍有一定的概率学习其策略，这表示了个体的非理性行为，并且κ越大个体越不理性。

2 数值模拟结果与理论分析

本文采用蒙特卡洛方法进行数值模拟，考察在不同的增益系数下噪声强度对合作行为的影响，另外还计算了不同噪声强度值下合作频率随增益系数的变化情况。在模拟中，我们的结果都是通过让系统演化2 000时步后取1 000步的数据，并且对50个不同初始合作者与背叛者分布状态做了平均获得的，经验证演化2 000时步系统已达到动态平衡。

图1a给出了在不同的增益系数r下合作频率ρc随噪声强度κ的变化关系，从图可以看出：除了增益系数r过小（r＝3.5）或过大（r＝6.0）的情况，随着噪声强度κ的增加合作频率ρc都存在一个降低的过程，这表明噪声的存在会抑制合作，并且噪声越大合作现象越稀少，此外这个抑制作用对不同的增益系数所产生的影响强度是不一样的，增益系数越小，抑制作用越明显。图1b给出了在不同的噪声强度κ下，合作频率ρc随增益系数r的变化关系，由图可见：随着增益系数的增加，合作频率都会存在一个从零变大的突变过程，并且噪声强度越大，合作涌现所需的临界增益系数rc越大，即噪声对合作的涌现起到抑制作用；当噪声强度比较大时，随着增益系数的增加合作频率曲线光滑上升，但当噪声强度比较小时曲线的上升出现了阶梯形式，并且噪声强度越小阶梯形式越明显，当噪声强度很小（如κ＝0.001）时，合作频率曲线出现了分段现象，在每段中系统的合作频率值近似相等，且分段个数等于节点的度。这个分段现象与王文旭等［7］提出的基于记忆的铲雪堆博弈结果类似，即在某些增益系数r值附近合作频率会从一个值突变到另一个值，作者通过局域稳定性方法解释了分段现象，我们在此基础之上从合作团簇存亡的角度分析了合作频率的分段现象并提出自己的见解。

图1 空间公共物品博弈中，在不同的增益系数和噪声强度下合作频率的变化情况Fig.1 Changes of the frequency of cooperation with different multiplication factor and noise intensity in spatial public goods game

为了研究方便我们把噪声强度很小（如κ＝0.001）的合作频率随增益系数变化的曲线单独画出来，如图2所示。通过数值模拟，得出的3个临界增益系数值分别为rc1≈3.58，rc2≈4.17，rc3≈5.0，被这3个临界增益系数所分割的4段合作频率曲线所对应的合作合作率分别为ρc＝0.0，ρc1≈0.52，ρc2≈0.88，ρc3＝1.0。在每一段对应的增益系数范围内，系统演化稳定后合作者和背叛者分布的斑图类似，图3就给出了对应于4段稳定的合作率在演化稳定后某一时步的斑图快照。明显地，这4个斑图的面貌截然不同：在对应于Ⅰ段的图3a中所有的个体都采取背叛策略，而在对应于Ⅳ段的图3d中所有的个体都采用了合作策略，在对应于Ⅱ段的图3b中合作者形成团簇并且被背叛者包围，而在对应于Ⅲ段的图3c中合作团簇连成片，在成片的合作者团簇中只有被挤压成狭窄空间中的背叛者存在。

图2 当噪声强度很小（如κ＝0.001）时，合作频率随增益系数的变化情况Fig.2 Changes of the frequency of cooperation with multiplication factor when the noise intensity is very small（e.g.κ＝0.001）

图3 当噪声强度很小（如κ＝0.001）时，在不同增益系数下系统演化到2 000时步时的斑图快照Fig.3 The spot pattern snapshots with different multiplication factor after 2000time step evolution when the noise intensity is very small（e.g.κ＝0.001）

我们所研究的空间公共物品博弈模型是以每个个体为中心与其邻居构成一个群体进行一次博弈，所以个体会参与以它及其邻居为中心的多次博弈，从而使得个体的收益受其邻居及邻居的邻居的投资行为的共同影响，呈现群体交互的形式，为了更直观地描述该博弈我们画出了示意图，如图4所示。从图4a中可以看出中心个体同时参与了5个群体博弈（分别是以自身为中心的群体和以它的4个邻居为中心的群体），另外中心个体的邻居以及其邻居的邻居的投资行为都会对中心个体的收益产生影响，但影响大小不同，在图4b中，正方形框上的个体对中心个体收益贡献两次，因此被称为中心个体的内层邻居，圆形框上的个体对中心个体收益贡献一次因此被称为中心个体的外层邻居。

图3以及之前的研究［1］都表明系统中的合作者是以团簇的形式存在的，要想使得合作团簇得以生存就要求合作团簇周围的背叛者转变为合作者的概率不小于团簇边沿合作者转变为背叛者的概率，从微观上看，一个合作团簇能否生存并向外扩张跟这个团簇边沿上合作者的分布情况及增益系数大小息息相关，因为周围背叛者要想成功学习其邻居的合作行为的前提是其邻居收益比自身收益大，而从式（1）中可以看出群体合作者数量及增益系数决定个体收益大小。想使背叛者转变为合作者，那么背叛者至少要有一个邻居是合作者并且该合作者的收益要大于该背叛者的收益。注意到，对于噪声强度为零的情况，只要所选邻居的收益比自身收益大，就一定会学习邻居的策略。下面我们仔细考察了一个背叛者x周围只有一个合作者y的情况，考察合作者y的邻居的策略对y的收益的影响，从而保证y的收益大于x的收益，进而使得背叛者x转变为合作者的各种可能情况。我们将临界情况下背叛者x及合作者y的周围的所有可能情况绘制在图5，在该图中圆圈区域为个体y参与的其中一个群体，该群体中合作者数量用nc表示，其取值分别为1，2，3，4。（因为我们讨论的是临界情况，此时对应于x的内层和外层邻居中有且只有一个合作者邻居，所以不能取0和5。）具体情况有图5a～f共6种。

图4 公共物品博弈微观图Fig.4 Microgram of the public goods game

图5a中很明显在x，y所参与的群体中只有一个合作者y，下一时步必将全部为背叛者；图5b中有两个合作者并都是对方的内层邻居，所以对彼此收益贡献两次，当增益系数足够大时合作者收益有可能比它的背叛者邻居收益高，因此该合作团簇可能会生存下来并扩张；图5c中也有两个合作者，但两者都是对方的外层邻居，所以对彼此收益只贡献一次，所以该合作团簇生存下来需要的临界增益系数要比图5b的大；图5d中有3个合作者，对合作者y而言其余两个均是其内层邻居，都对y的收益贡献两次，当增益系数达到一定值时背叛者x会学习y的合作策略，从而使原合作团簇生存下来并扩张；图5e中也有3个合作者，对合作者y来说一个合作者是其内层邻居，另一个是其外层邻居，当增益系数达到一定值时背叛者x也会学习y的合作策略，该合作团簇能够生存下来并扩张，但临界增益系数要比图5d的大；图5f中有4个合作者，使x变为合作者对应的临界增益系数应该是最小的。综上所述，下一时步个体x变为合作者的可能情况有图5b、图5c、图5d、图5e、图5f5种，并且改变的可能性从小到大的排序是图5c、图5b、图5e、图5d、图5f。

图5 背叛者x与合作者y以及他们所参与的群体中其他个体的示意图Fig.5 Cooperators x，defectors yand the other individuals in the group they participate in

按前面博弈规则，合作者每参与一个群体投资1单位货币，背叛者不投资。对于图5b～图5f5种情况，要想使得背叛者x成功学习合作者y的策略，须保证个体x的收益小于y的收益，所以有不等式：

不等式左边表示x的收益右边表示y的收益。由这5个不等式分别得出增益系数r的取值范围为r＞5.0，r＞25／4＝6.25，r＞25／7≈3.58，r＞25／6≈4.17，r＞25／8＝3.125，其值按大小排序与上述预测一致。下面我们分析对应于图5b～图5f的这些临界增益系数值是否为图2的分段点：图5b中两个合作者都是对方的内层邻居，只要增益系数r达到5.0该合作团簇就会生存下来并向外扩张，实际上这种结构是普遍存在于合作团簇中的，随时间的演化最终所有的合作团簇会聚集在一起，使得系统中个体全部都变为合作者，合作率为1，因此临界增益系数5.0是图2其中一个分段点；图5c中计算得增益系数为6.25，而当增益系数r达到5.0就全部为合作者了，r再继续增大合作率仍为1，故6.25不是分段点；对于图5d中这样的合作团簇结构当增益系数大于3.58时，合作团簇才能向外扩张；对于图5e中当增益系数大于4.17时，合作团簇才能向外扩张；而图5f中理论上只要增益系数达到3.125个体x就会变为合作者，但图5f中4个合作者分布在圆圈上，圆的中心是一个背叛者，即4个合作者包围一个背叛者，该背叛者将获得很高的收益，其周围的合作者有很大的概率学习其策略，这终将导致原合作团簇分裂，原合作团簇不能生存。综上所述，下一时步个体x可能变为合作者的情况就只有图5b、图5d、图5e3种情况，在这3种情况中，图5d的结构是最容易使背叛者x变为合作者的，即需要的增益系数最小，约为3.58。当r＜3.58时，对于图5d的结构都不能使背叛者x成功学习合作者y的策略，随时间的演化导致整体没有合作者幸存，合作率为0，故临界增益系数25／7对应于图2其中一个分段点；r再继续增大当达到25／6时对于图5e的合作团簇结构也能生存，从而使得合作率突然增大，故25／6也是图2其中一个分段点。综上，理论分析得到图2的3个增益系数的临界点分别为25／7，25／6和5.0。

仿真结果rc1≈3.58，rc2≈4.17，rc3≈5.0与理论值吻合得很好。遗憾的是我们未能从理论上解释图2中Ⅱ，Ⅲ段合作频率为什么分别为0.52和0.88。

3 结论

本文通过数值模拟发现噪声强度对空间公共物品博弈合作行为的出现起到了抑制作用，而且在增益系数较小时抑制作用比较明显。另外我们还发现当噪声强度很小（如κ＝0.001）时，合作频率随增益系数的变化出现分段现象，我们通过理论分析并计算得到临界增益系数，仿真结果与理论值吻合得很好。

［1］ Nowak M A，May R M.Evolutionary games and spatial chaos［J］.Nature，1992，359（6398）：826－829.

［2］ Nowak M A，May R M.The spatial dilemmas of evolution［J］.International Journal of Bifurcation and Chaos，1993，3（1）：35－78.

［3］ Doebeli M，Knowlton N.The evolution of interspecific mutualisms［J］.Proc Natl Acad Sci USA，1998，95（15）：8676－8680.

［4］ SzabóG，Töke C.Evolutionary prisoner′s dilemma game on a square lattice［J］.Physical Review E，1998，58（1）：69－73.

［5］SzabóG，Hauert C.Phase transitions and volunteering in spatial public goods games［J］.Physical Review Letters，2002，89（11）：118101.

［6］ SzabóG，Vukov J，Szolnoki A.Phase diagrams for an evolutionary prisoner′s dilemma game on two－dimensional lattices［J］.Physical Review E，2005，72（4）：047107.

［7］ Wang W X，Ren J，Chen G R，et al.Memory－based snowdrift game on networks［J］.Physical Review E，2006，74（5）：056113.

［8］ Sysi－Aho M，Saraméki J，Kertész J，et al.Spatial snowdrift game with myopic agents［J］.European Physical Journal B，2005，44（1）：129－135.

［9］ Vukov J，SzabóG，Szolnoki A.Cooperation in the noisy case：Prisoner′s dilemma game on two types of regular random graphs［J］.Physical Review E，2006，73（6）：067103.

［10］Guan J Y，Wu Z X，Wang Y H.Effects of inhomogeneous activity of players and noise on cooperation in spatial public goods games［J］.Physical Review E，2007，76（5）：056101.

［11］Perc M，Szolnoki A.Social diversity and promotion of cooperation in the spatial prisoner′s dilemma game［J］.Physical Review E，2008，77（1）：011904.

［12］Qin S M，Chen Y，Zhao X Y，et al.Effect of memory on the prisoner′s dilemma game in a square lattice［J］.Physical Review E，2008，78（4）：041129.

［13］Helbing D，Yu W J.The outbreak of cooperation among success－driven individuals under noisy conditions［J］.Proc Natl Acad Sci USA，2009，106（10）：3680－3685.

［14］Liu Y K，Li Z，Chen X J，et al.Memory－based prisoner′s dilemma on square lattices［J］.Physica A，2010，389（12）：2390－2396.

［15］Zhang C Y，Zhang J L，Xie G M，et al.Evolution of interactions and cooperation in the spatial prisoner′s dilemma game［J］.PLoS ONE，2011（7）：e26724.

［16］Gracia－Lázaro C，Ferrer A，Ruiz G，et al.Heterogeneous networks do not promote cooperation when humans play aprisoner′s dilemma［J］.Proc Natl Acad Sci USA，2012，109（32）：12922－12926.

［17］Hauert C，Monte S D，Hofbauer J，et al.Volunteering as red queen mechanism for cooperation in public goods games［J］.Science，2002，296（5570）：1129－1132.

［18］Zhang H F，Yang H X，Du W B，et al.Evolutionary public goods games on scale－free networks with unequal payoff allocation mechanism［J］.Physica A，2010，389（5）：1099－1104.

［19］Santos F C，Santos M D，Pacheco J M.Social diversity promotes the emergence of cooperation in public goods games［J］.Nature，2008，454（7201）：213－216.

［20］Zhang H F，Liu R R，Wang Z，et al.Aspiration－induced reconnection in spatial public－goods game［J］.Europhys Lett，2011，94（1）：18006.