APP下载

“囚徒困境”概论及应用

2015-05-30王治强

2015年44期
关键词:囚徒困境博弈论

王治强

摘 要:“囚徒困境”是博弈论的经典之一,是西方经济学理论的重要组成部分。本文第一部分介绍完全信息静态下的“囚徒困境”的模型,第二部分介绍重复的囚徒困境模型,最后的部分通过一个例子分析囚徒困境的经济学意义。

关键词:博弈论;囚徒困境;个体利益与集体利益

一、完全信息静态下的囚徒困境的模型

“囚徒困境”是1950年美国兰德公司提出的博弈论模型,来自一个有趣的案例。两名罪犯被警察逮捕,警察已经明确两人犯罪的事实,但苦于无法给出有力的证据而无法起诉两名罪犯,警方非常希望能找出办法让两人招供。因为在美国是这样的,如果一个犯罪嫌疑人愿意成为污点证人指出其同伙所犯的罪行,并以此与司法机关交换条件,就有可能得到豁免。于是警方设计出了一套激励机制,促使罪犯自己招供。如果两人同时坦白犯罪的事实,那么各判5年;如果同时抵赖,那就只能无罪释放;如果一个人坦白并指证另外一个犯人的罪行,那么认罪的人就判无罪,而被指证的人就要被判10年。如果从经济学的“理性人”假设出发,就会得到认罪都是划算的,因为不管另外一个罪犯不管做何选择,选择认罪都会得到较低的判刑;但是从集体来讲,两人都不认罪才是最理性的选择,这就是所谓的囚徒困境。我们用A、B来分别表示两名罪犯,即局中人,用负数表示获刑,即支付,就可得到囚徒困境的标准型表述,如图1:

图1 囚徒困境

在完全信息静态下的囚徒困境中,局中人对另一个参与人的策略集合和支付函数都是完全了解,但不知道另一个参与人的行动。此外,两个参与人同时选择决策并且只决策一次。在这里的同时行动是一个信息概念而不是时间概念,只要参与人在进行自己的决策时不知道另一个参与人的选择,就说他们在同时行动。也正是因为在这个博弈中只进行一次博弈,参与人之间容易产生不信任,即使做出了承诺也无法保证承诺的约束力。

二、重复的囚徒困境模型

所谓的重复博弈,即同样结构的博弈重复多次,每一次称为“阶段博弈”。前一阶段的博弈不改变后一阶段博弈的结构,每阶段博弈的结构相同。在重复博弈中,所有局中人都能观察到过去的博弈历史。由此可以得出有限次重复博弈的定义:给定一个博弈G,重复进行了T次,且在每次重复之前各局中人都能观察到以前博弈的结果,这样的博弈过程称为G的一个T次重复博弈,记为G(T),G为G(T)的原博弈。G(T)中的每次重复称为G(T)的一个阶段。在囚徒困境多阶段重复博弈中,只要两个局中人的策略互动关系所持续的时间固定,或者说只要囚徒困境的重复次数是预先确定的有限数,那么在理性人假设之下,重复博弈的结果一定还是个人在每次博弈中追求当时的私利,即每个局中人在每次博弈中都采取背叛策略。可以通过一个价格大战的囚徒困境来说明,现有甲乙两个企业垄断了一种商品的商场,如果他们都实行高价,各得利润5万;如果一高一低,高价一方得1万低价一方得6万;如果都实行低价,双方利润都是3万。如图2:

图2 价格大战的囚徒困境

出于对策略互动性的考虑,甲乙两家企业需要对这个持续两个阶段的博弈进行全面的分析,并选择他们各自最优的定价策略。每个局中人都会采取逆向归纳法,决定各自的策略选择。为了方便讨论,我们将有限次重复博弈限定在两个星期。我们首先从最后一个阶段即第二个星期分析开始,此时双方都会意识到,这是最后一次博弈,没有“后效”,不会有什么约束了,不必为将来打算双方都只追求这次博弈的利益。这样,每个企业都会发现,背叛是自己的一个策略优势。于是为了各自的利益双方都会实行低价策略,抢占市场份额。局中人都已经清楚,最后一次博弈对方肯定要实行低价策略,不管我现在对他如何好型,也不会在下一次得到好报。既然这样,作为理性人的“我”现在没有理由收缩产量维持高价策略。双方都这样想,于是这个两阶段博弈的第一阶段博弈的结果,也和一次囚徒困境博弈一样,是双方都只追求当时的私利。按照这样的推断,从一开始,甲乙双方都会采取背叛策略,即低价策略。这样的话,两阶段的价格大战博弈就无法走出囚徒困境。

三、“囚徒困境”的具体应用

著名经济学家林毅夫在其著作《解读中国经济》里用囚徒困境说明了合作社与农民之间的矛盾,林毅夫将农民加入合作社看成一次性的博弈。在当时人力物力有限的情况下,为恢复生产,增强农民抵御自然灾害的能力而成立的农村生产互助组织,后来农业合作社的活动不断扩大,发展到完全的大公无私,发展成人民公社。农业合作社的形成是基于规模经济,但是这种规模经济的实现是基于农民的自觉性和农业生产的监督。加入合作社,农民将农具交公,进行集体生产。生产后部分产品要交付政府采购机构,其余的才归于公社农民共有。在分配剩余时也是按工分和投入,工分是按天算的,没有真正实现按劳分配,实际上是按劳动日分配,没有真正衡量到农民劳作的质量,只要时间够了,这样干多干少一个样,这样的制度使一些农民失去了生产的积极性和意愿,从而偷懒,因为当农民努力增加生产,大多部分产品都归于其他的农民所有。

合作社的成立初期是取得了很好的效果的,1956年,人大会议通过组织章程,农民所提供的土地、农具全部归公,但是农民“入社自愿,退社自由”,林毅夫教授将其称为“退出权”。在这种政策前提下,当合作社里有越来越多的人不努力劳动,想达积极劳动的人的“便車”时,生产率就会下降,这时那些努力劳动的人就会发现加入合作社的收益还不如自己单干时多,就会退社。这种退社的自由一方面对努力劳动的人是一种自我权利的保护,另一方面对那些偷懒的人也是一种实质性的威胁。因为越来越多的不努力劳动而造成的农民退社,最终会导致合作社的解散,不好好干的人也必须回去单干,单干得到的收益没有搭便车的收益高,偷懒实在是得不偿失,这样“入社自愿,退社自由”的规定实际上是有效防止了那些偷懒的社员。

当时,政府看到了合作社取得的成功,生产力不断发展,就规定农民不许退社,强制农民留在公社里不许回去单干。到了1958年的人民公社组织章程删去了“入社自愿,退社自由”的规定,直到1978年都不允许农民单干。所以,从1958年人民公社化后,社员博弈的过程就发生了根本变化,这样就相当于一次性博弈,不再存在实质性约束。如果所有的人退出公社的自由都被剥夺了,就不存在合作社的解散或者积极劳动的人退社这种威胁,那么不愿意努力劳动的人就越继续偷懒,这样偷懒的人也越来越多,因为偷懒才是对自己最有利的选择。因此,当越来越多的人选择偷懒,消极劳动,公社的生产力就会下降。当存在退社自由时,集体生产的生产力是高于单干的生产力的,只要农民自由退社的权利被剥夺了,相应的激励机制便不复存在,在这种强制性的合作生产里,集体生产的生产力远远低于单干的生产力,并没有实现合作社成立之初的规模经济。所以,在存在“退出权”时,农民在合作社里劳动生产就是一个理性的选择;当“退出权”不存在时,就变成了一次性的博弈,这样就产生了农民个体利益与合作社集体利益的冲突。(作者单位:四川大学经济学院)

参考文献:

[1] 林毅夫,《解读中国经济》,北京大学出版社,2012年版

[2] 王则柯,李杰,《博弈论教程》,中国人民大学出版社,2004年版

[3] 张衔:《博弈论》课堂讲义,四川大学经济学院,2014年

猜你喜欢

囚徒困境博弈论
“囚徒困境”在贿赂犯罪审讯中的运用
基于博弈论的计算机网络对抗问题分析
博弈论视角下的自首行为分析
无知之幕与博弈:从“黄灯规则”看博弈论的一种实践方案
樊畿不等式及其在博弈论中的应用
博弈论视角下医疗纠纷解决方式选择