有趣味的博弈论模型

2009-07-23方锦清

百科知识 2009年12期

方锦清

在自然界和人类社会中广泛存在合作与竞争，而能够反映这种既激烈竞争又需要合作的一门学科就是博弈论(Game Theory)，也称对策论。它是模拟和分析理性的个体在利益冲突环境下相互作用的形式、决策及其均衡理论，研究个体之间行为的相互影响和相互作用规律，它可以描述现实生活中参与者面对有限资源的合作与竞争行为。令人惊奇的是，有三次诺贝尔奖获得者是博弈论研究方面的杰出科学家，他们是1985年获得诺贝尔经济学奖的公共选择学派的领导者布坎南，1994年获奖的美国普林斯顿大学的纳什、塞尔屯、哈桑尼3位博弈论专家以及1995年获奖的理性主义学派的领袖卢卡斯。博弈论在经济学、政治学、管理学、社会学、军事学、生物学等诸多学科领域具有广泛的实际背景和应用价值。进入20世纪末，随着复杂网络科学的一些新的发现，博弈论也成为网络时代人们的一种思维、竞争与合作的模式。

博弈论对人有一个最基本假定：人是理性的，人在具体策略选择的目的全是使自己的利益最大化。博弈论就是研究理性的人之间如何进行策略选择的，因此博弈论也称为对策论。博弈论就凭这么一条最简单的假定可以展开广泛的研究，并获得了丰富多彩的结果，利用博弈论可以解读人类的社会行动或集体行动，更易理解人类社会的复杂性和特殊性。为了刻画个体间利益的冲突对整个系统的影响，人们已经提出和发展了许多博弈模型，比较著名的有三个模型：囚徒困境、“雪堆”博弈和“少数者”博弈模型，下面笔者通过对这三个模型进行简单而通俗的介绍，让大家来了解博弈论及其应用概况。

“囚徒困境”模型

囚徒困境作为一个经典的博弈模型受到广泛关注。这个博弈模型假设两个小偷合伙作案时被捕，分别被关在不同的屋子里，如果双方都拒绝承认同伴的罪行，则由于证据不足两人都会被轻判(收益为R)；为此，警方设计了一个机制：如果一方出卖同伴，而另一方保持忠诚，则背叛者将无罪释放(收益为T)；坚持忠诚的一方将被重判(收益为S)；如果双方都背叛了对方，则双方都会被判刑(收益为P)。这里假设上述收益参数满足下面的条件：T>R>P>S。对每个参与者来说，如果对手坚持忠诚，则他也选择忠诚得到的收益R小于他选择背叛得到的收益T；如果对手选择背叛，则他选择忠诚得到的收益S仍小于他选择背叛得到的收益P。

可见，无论对手采取哪种策略，自己的最佳策略就是背叛，双方都选择背叛称为囚徒困境的唯一“纳什均衡”(纳什因其提出的“非合作完全信息博弈的纳什均衡”概念而荣获了1994年的诺贝尔经济学奖)；但是同时选择背叛所取得的平均收益要低于两个人同时保持忠诚取得的平均收益。在这种情况下，理性参与者面临着两难的困境。

自然界中广泛存在的合作现象——从单细胞生物的协同工作到人类的无私奉献的行为说明，还有其他的动力学机制激励一般所认为的自私的个体认识到合作的重要性。为了揭示这种潜在的演化机制，有人提出了“针锋相对”演化规则，采用“去输存赢”策略，改进囚徒困境中的两难结局。

“营堆”博弈模型

“雪堆”博弈又称为“鹰鸽”博弈或者“小鸡”博弈(chicken Game)，是另一类两人对称博弈模型，描述了两个人相遇时是彼此合作共同受益，还是彼此欺骗来相互报复。它揭示了个体理性和群体理性的矛盾对立。可以这样来描述雪堆博弈：在一个风雪交加的夜晚，两人相向而来，被一个雪堆所阻，假设铲除这个雪堆使道路通畅需要的代价为c，如果道路通畅则带给每个人的好处量化为b。如果两人一齐动手铲雪，则他们的收益为R=(b－c)／2；如果只有一人铲雪，虽然两个人都可以回家，但是背叛者逃避了劳动，它的收益为T=b，而合作者的收益为S=b－c；如果两人都选择不合作，两人都被雪堆挡住而无法回家，他们的收益都为P=0。这里假设收益参数满足下面的条件：T>R>S>P。雪堆模型与囚徒困境不同的是，遇到背叛者时合作者的收益高于双方相互背叛的收益。因此，一个人的最佳策略取决于对手的策略：如果对手选择合作，他的最佳策略是背叛；反过来，如果对手选择背叛，那么他的最佳策略是合作。这样合作在系统中不会消亡，而与囚徒困境相比，合作更容易在雪堆博弈中涌现。

“争当少数者”博弈模型

该模型由两位数学家查勒特和张翼成于1997年提出，他们假设在一个系统中有多(奇数)个参与者，在某一时刻各自独立地在两个策略中做出选择，参与人数少的策略获胜。该模型的核心思想是少数者获胜，这是从实际中提炼出来的一个好模型，股票交易就是一个典型例子。需要指出，“少数者”博弈模型是对著名“酒吧问题”的一种抽象和简化。

“酒吧问题”研究的是一群生活在美国圣塔菲的人们在周四晚上是否去该地区的一个著名酒吧的决策问题：每周四晚上这个酒吧都会有优雅的爱尔兰音乐演奏，然而如果去的人数过多，超过了酒吧所能容纳的人数，酒吧就会变得嘈杂拥挤，人们也无法悠闲地欣，赏音乐。因此人们需要根据过去的公共信息来对当晚去酒吧的人数做预测，以决定自己究竟是去酒吧还是留在家里。“酒吧问题”和“少数者”博弈模型都反映了社会经济活动中众多千差万别的参与者对有限资源竞争的基本特征，其思想是金融市场中的普遍原则——少数人获胜。

争当少数者博弈模型原则上与前面两个模型不同，双方并非完全自私、完全理性且具有相当完整信息，并按照严格的收益计算而决策，以便达到某种博弈的均衡。人们看到该模型中的双方基本上是根据“成功的经验”或“模仿成功者”进行决策，并非理性，信息也非完整，因此它不存在争当少数者博弈模型的均衡，似乎可以说，非理性和非完整信息的博弈更为重要。确实，现实生活中究竟有哪些面临的抉择是“完全理性”地根据完整信息严格计算而进行决策的博弈?

在“少数者”博弈模型的基础上，科学家还提出了“演化少数者博弈”(EMG)模型，将进化论与少数者博弈结合在一起，发现通过学习过去的公共历史信息，可以提高参与者的平均收益。在EMG模型中，对于某一轮博弈，参与者根据他记忆中保存的公共历史信息来独立地决策本轮自己是加入“1”组还是“0”组；当所有人都做出选择后，加入人数少的一组为获胜者，加入人数多的一组为失败者。人们通过对EMG模型的研究发现一个有趣的结论：一个相互间竞争的人群最终总是趋向于分离成为具有两种相反的极端行为的人群。这意味着为了在竞争社会中生存，参与者的行为最终会走向极端：要么始终遵循基本策略，要么始终反其道而行之。

本文以囚徒困境、雪堆博弈和少数者博弈三个典型模型为例，简单介绍了近年来博弈论研究概况。在现实生活和许多领域中，博弈行为对网络结构演化的作用是令人关注的课题。随着对演化博弈动力学行为与复杂网络之间关系深入研究，博弈必定会推动复杂网络的发展，乃至社会的进步，其应用前景十分美好。

责任编辑庞云