博弈论视角下公地悲剧模型研究

2015-06-11纪恭婷苏抗男

中国市场 2015年29期

纪恭婷苏抗男

[摘要]通过构建一个草原放牧的博弈模型，以博弈论的视角对牧民的一次行为和连续行为进行研究分析，在参与者行为之间存在相互约束和牵制的情况下，得出以下结论：在重复博弈的环境下，“公地悲剧”问题能够得到解决，这需要依靠内生的约束机制。

[关键词]公地悲剧；博弈论；内生规则

[DOI]1013939/jcnkizgsc201529111

1968年英国哈丁教授（Garrett Hardin）在《The tragedy of the commons》一文中首先提出“公地悲剧”这一概念，它意味着“环境的退化会发生在任何时候，只要许多人共同使用一种稀缺资源”。本文把博弈论的概念和思想引入到“公地悲剧”这一现象中，致力于找出化解“公地悲剧”的方法。

1“公地悲剧”的博弈论模型

假设在由n个牧民共同拥有的草原上，每个牧民都养羊，根据世代多年放牧的传统，他们都知道这片草原上羊的最优的饲养数量，我们把这一数量设为Q1，那么每个牧民的最优饲养量为Q1/n。由于草原是公共的，只要有利可图，牧民養羊的饲养数量越多越好。假定每个牧民能获得收益的饲养量不低于Q1/n，这样，每个牧民羊的饲养数量有两个可能，一是超额饲养，二是根据统一的指标限额饲养。

为了使我们的分析更具有一般的普遍性，把草原上的n个牧民简化为两个典型性的代表A和B，A和B共同在这片草原上放牧，把羊的饲养量的确定过程看作是A和B相互之间的博弈，那么A和B就有两个可选择的策略，即超额或限额。在A、B选择不同的策略的情况下，A、B会出现收益变化：①A超额、B限额，在市场均衡的情况下，A的饲养里比B的饲养量多，收益也多，A的收益为a，B的收益为b，则a>b；②B超额、A限额，A的收益为b，B的收益为a，同理，有a>b；③A、B都限额，总收益为T，达到社会最优，A、B共享收益π，每人π/2，由公地放牧会导致非帕累托最优，有π>a+b，④A、B都超额，那么A、B的收益均为τ/2，有τ<π。同时，为了让超额饲养显得有利可图，我们还假定，无论是A或B超额，超额方的收益都大于π/2。A、B中只要有一方超额，另一方限额，则超额方的多获得的收益为限额方损失的收益。

2博弈模型分析

首先，假定以上“公地悲剧”博弈模型是在完全信息的情况下进行的，即A、B都知道对方的策略和收益；之后，将A和B的博弈分为同时博弈和序贯博弈两种情形。下面将对以上两种情形进行叙述分析。

当A和B同时博弈，对A来说，当B采取限制饲养数量的策略时，A的收益a>π/2，A的最优选择是超额；当B采取超额饲养策略时，A的收益b>τ/2；由以上分析可知对A不存在占优策略，A所采取的策略需要根据B的策略进行选择。对B来说，当A采取限额策略时，B的收益为a>π/2；当A采取超额策略时，B的收益b>τ/2，B的最优选择是限额；同样，B也不存在占优策略，B所采取的策略需要根据A的策略进行选择。

由以上分析可知，在同时博弈的情形下，A、B之间有着两个纳什均衡，即（限额；超额）与（超额；限额）。因为同时博弈存在的阶段性，纳什均衡不具有唯一解，这说明在实际情况下A和B会面临策略选择上的困境，在这样的情形下，为了实现自身利益的最大化，A和B均有可能以一定的概率选择超额策略或限额策略。那么，我们假定A选择限额策略的概率是r1，选择超额策略的概率是1-r1；B选择限额策略的概率是r2，选择超额策略的概率是1-r2，那么，A的最优化模型为：

VA=r1[[SX（]π[]2[SX）]r2+（1-r2）b]+（1-r1）[ar2+（1-r2）[SX（]τ[]2[SX）]]

求A在概率r1下的收益最大值Max[DD（X]r1[DD）]VA，有：[SX（]π[]2[SX）]r2+b（1-r2）-ar2-[SX（]τ[]2[SX）]（1-r2）=0，则，r2=[SX（]b-[SX（]τ[]2[SX）][]（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]>0

根据支付矩阵的对称性，可推出：r1=r2=[SX（]b-[SX（]τ[]2[SX）][]（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]

综上可知：r*1=r*2=[SX（]b-[SX（]τ[]2[SX）][]（1+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）[SX）]为混合策略的纳什均衡，这一均衡说明了当A以概率r*1选择限额策略时，A进行策略选择时没有必要参考B的策略选择来进行，同样的，B以概率r*2选择限额策略时的策略选择也不需要考虑A的策略选择。

根据以上描述可得到以下结果：A、B选择限额策略的联合概率分布为：P（A=不超额；B=不超额）=r*1×r*2=[SX（]（b-[SX（]τ[]2[SX）]）2[][（a+b）-（[SX（]π[]2[SX）]+[SX（]τ[]2[SX）]）]2[SX）]；A、B选择超额饲养策略的概率分布为：P（A=超额；B=超额）=（1-r*1）（1-r*2）；A、B选择相异策略的概率为：r*1（1-r*2）+r*2（1-r*1）=2η*（1-r*2）=2r*2（1-r*1）。A和B中只要有一人选择了超额饲养策略，草原的饲养量将偏离帕累托最优，出现“公地悲剧”现象，出现的概率为：P（A=超额；B=超额）+P（A=超额；B=不超额）+P（A=不超额；B=超额）=（1-r*1）（1-r*2）+2η*（1-r*2）；根据概率的相关知识，“公地悲剧”出现的概率也可表示为1-P（A=不超额；B=不超额）=1-r*1×r*2∈[0，1]。

把A和B两个牧民决定羊的饲养数量的决策过程看作是一个博弈，根据以上计算可知，“公地悲剧”这一现象会以一定的概率出现在博弈的收益中，这样，从博弈论的视角分析“公地悲剧”就有了可行性。

其次，A、B连续博弈。当A和B两个牧民中有一个人在某些方面优于另一个人即具备先行者的优势时，那么先行者就有观望和利用先行者优势两种选择，这时A、B之间的博弈不再是同时博弈而是连续博弈。这里假设在完全信息的情况下，A是先行者，A先行动、B后行动，收益矩阵和同时博弈的时候相同。

对A来说，A知道假如他选择超额策略，由于b>[SX（]π[]2[SX）]，B的最优策略为限额策略，那么，A将获得a的收益，B获得b；假如A选择限额策略，那么B一定超额，那么A獲得收益b，B获得a。当A具有先行者优势时，A能够先行动，并获得a的收益（a>b），所以无论如何A也会选择超额策略，这时，博弈的均衡解释（超额；限额）。这就表示在连续一次性的博弈过程中，A、B两个牧民的羊的总的饲养数量将超过草原上的帕累托最优数量，出现“公地悲剧”。

从上文中的分析可知，理论上，在一次博弈的情形下，不管是同时博弈还是连续博弈，“公地悲剧”都可能发生，但在实际情况下，因为养羊这个活动是不间断连续进行下去的，那么草原上牧民之间养羊数量的决策过程就是重复博弈的过程。一旦存在重复博弈，牧民之间由于人际关系、文化等原因会形成一种相互牵制的情况，最终使草原上羊群的饲养数量限制在符合集体利益最大化的帕累托最优数量上面。

3对策研究

由以上分析可知，A、B因为存在a-[SX（]π[]2[SX）]的超额收益而产生了超额饲养羊的投机心理。A和B都是理性人，都是自私的，都不愿意因为自己限额而损失了额外的收益，更不愿意看到因为双方都超额而带来的共同损失。当不存在一个实际有效的机制来约束双方行为时，为了能减少自身的损失，在博弈的过程中，博弈双方会透露这样的信息：如果在社会交换的过程中出现了违约者，则拒绝与他合作，而拒绝合作给违约者造成的损失大于他不违约的损失，这样就形成了一种可信的、有效的威胁。A和B在牧羊博弈的过程当中自主地限制羊的数量，使其形成一个内生的规则。当限额策略合理地解决了“公地悲剧”问题时，在接下来的重复博弈中，人们会将这一行为坚持下去，就成为了一种制度，一种内生的制度，“公地悲剧”便得到了解决，不再出现。

4结论

通过以上分析，当牧民们在选择羊的饲养数量时，相互之间存在一种相互约束、制约机制，并且这一博弈是重复进行时，那么，饲养羊数量的限额将成为一个内生的博弈规则，它不需要借助外界或第三方的力量来保证实施便能自己起到约束双方行为的作用，因而“公地悲剧”能够依靠内部的约束机制自发解决。

参考文献：

[1] Hardin GThe tragedy of the commons[J].Science，1968：162.

[2]方庆多中心视角下的“公地悲剧”治理研究——以广州亚运免费公交地铁为例[J].中国市场，2011（6）