APP下载

对博弈论公设的质疑

2010-08-15蒋正峰

天津商业大学学报 2010年5期
关键词:局中人坦白囚徒

蒋正峰

(1.华南师范大学政治与行政学院,广州 510631;2.华南农业大学思政部,广州 510642)

对博弈论公设的质疑

蒋正峰1,2

(1.华南师范大学政治与行政学院,广州 510631;2.华南农业大学思政部,广州 510642)

“理性人”和公共知识是博弈论中的两个公设,即假设博弈局中人都是理性的,在公共知识的背景下选取行为策略,使自己的效用达到最大化。然而,正是从这样的假设前提出发,却使博弈理性推理陷入困境,“理性人”不理性。因此,符合逻辑的是对博弈论公设产生质疑。

理性;公共知识;集体理性;个体理性

博弈论以经济个体决策和行为互动作为研究对象,研究的主要问题是人们在互动行为中的推理问题,就是在与人们的利益和行为有直接的相互影响和相互作用的情况下个体的理性选择与策略。Harsanyi在1994年获诺贝尔经济学奖的致辞中曾这样定义博弈论:博弈论是关于策略相互作用的理论,就是说,它是关于社会形势中理性行为的理论,其中,每个局中人对自己行动的选择必须以对其他局中人将如何反应的判断为基础。

在博弈论的视野中,人类的所有理性活动,只要是互动行为,都可以看成是博弈行动。当然,局中人在博弈中如何选择自己的行动策略,一般都是经过一番推理后而采取的,而博弈推理也必须要有前提条件。为此,博弈论给出了博弈推理的两个公设,即假设博弈局中人都是“理性”的,在行动策略上努力使自己获得更多收益,并且每个局中人彼此都知悉或相信对方是“理性”人,在博弈中都使自己的效用最大化,这样博弈推理就能进行了。看大家都熟悉的囚徒困境的例子:

甲、乙两个同案犯罪嫌疑人被囚禁起来进行隔离单独审问,要求坦白交待犯罪事实。每个嫌疑人或者坦白或者抵赖,如果双方都坦白交待的话,根据法律规定犯某某罪每人将判刑三年;如果他们都抵赖,则由于证据不足,每人将只判刑一年;如果一方抵赖而另一方却坦白并愿意作证,那么根据坦白从宽抗拒从严原则,抵赖者将从严处罚,判刑五年,而坦白者将宽大处理,免刑释放。

在这个“囚徒博弈”中,每个嫌疑人究竟是选择坦白还是抵赖,大抵都需经过这样的推理:

(1)如果对方坦白,我抵赖的话所得支付为-5,我坦白的话所得支付为-3,根据理性人假设,我选坦白(-3>-5)。

(2)如果对方抵赖,我抵赖的话所得支付为-3,我坦白的话所得支付为0,根据理性人假设,我还是选坦白(0>-3)。

综合(1)、(2),所以不论对方坦白还是抵赖,我这方都坦白。这样,“囚徒博弈”的均衡解是双方都选取坦白策略,这就是所谓的纳什均衡点。

进而我们把“囚徒博弈”重复有限次,比如n次,那么局中人又将如何选取策略呢?运用倒推法,从最后一次开始,很显然,在第n次博弈中,双方都会选坦白,因为这是最后一次,就像一次性囚徒博弈一样,选择坦白是各自的严格优势策略(不论对方采取什么策略,我采取这个策略总比采取任何别的策略都好)。再看第n-1次,因为第n次已确定双方都坦白,所以在第n-1次局势中,彼此也会选择坦白策略。同样,第n-2次,第n-3次……直到第1次,双方都会选择坦白策略。于是通过倒推法得到的结论是:理性人在有限重复囚徒博弈中永远都坦白。

然而,出乎意料的是事实并非如此。在一次性“囚徒博弈”中,选择坦白并没有给双方带来最大的效用。事实上,双方都坦白所得支付从某种意义上说是最少的(两人的和支付是-6),在有限重复囚徒博弈中更是如此。双方永远都坦白的结论在直觉上是不真实的,与实际中的情形相反,这只能是“最小程度理性”。[1]面对如此困惑,人们不得不对博弈理性推理提出质疑和挑战。

1 对理性人假设的质疑[2]

理性人假设是博弈推理的两个公设之一。所谓理性人,就是追求自己的效用最大化。但问题却是:理性人如何达到效用最大化?换言之,何种行为才能在理性人假设的前提下是“理性的”?

对理性行为的理解,Harsanyi分析了对理性行为的手段—结局解释。他认为,在日常生活中,当我们谈及“理性行为”时,绝大多数情形中我们想到的是这样一种行为,它涉及为达成某种特定结局而选择最佳的可行手段……它指明为了得到某种特定结局或目标我们应该做什么。[3]就像前文囚徒博弈中的嫌疑人一样,虽然我们可以从所谓的理性人假设出发,来解释他们的行为策略和预测纳什均衡点的出现,实际上嫌疑人都坦白所得的支付并不是最大的,从理性(手段)出发得到非理性的结局。在有限重复囚徒博弈中也类似,从理性人出发得出永远都坦白的结论似乎理所当然,然而囚徒很少能够一贯地按这种理性原则行动,有时行为策略的非理性反而结局更理性。“坦白从宽,牢底坐穿;抗拒从严,回家过年。”就是这方面的生动写照。实际上,一个人选择的目标不合理,无论他如何作为,他的行为都不能称为是理性的,对理性行为的手段—结局解释过于狭隘。

偏好—机会模型是对理性行为的另一种解释,它带有很强的数理经济学色彩,概念的诠释方式本身即便于数理化。理性行为等价于效用最大化,个人的偏好就可以由一个适当定义的效用函数来表示。这样本来不易捉摸的理性行为就可表述为数学模型,成为西方经济学进行理论研究的有力工具。然而该模型也有局限性,正如Harsanyi指出,它仅提供确定性情形中理性行为令人满意的表示,但不能在风险和不确定性情形中做到这一点。再者,理性人追求自己的最大化效用,这种理性是个体理性。在博弈中每个局中人都简单地从理性原则出发去推断其他参与人的行为,个体理性是根本无法达到的。因此,理性必须以所有参与人为出发点,以集体理性(即所有参与人的效用总和最大化)取代个体理性。如前述囚徒困境的例子,各自从个体理性出发都坦白,支付总和为-6,最少,而双方都抵赖时支付最大为-2,这时双方都选抵赖是集体理性的。同时,在有限重复囚徒博弈中,个人的理性局限阶段理性,即单个回合的个体理性,而没有把理性放眼于整个过程,忽视了过程理性。这里讲的过程理性是指在所有博弈阶段的整个过程中参与人的效用最大化。

通过上述对博弈推理中理性人假设的分析,我们可以得出这样的结论:理性概念太强了。按通常的理解,它只强调了手段和标准,而忽视了结局和目标的达成,这样的“理性”理性吗?例如,在一次性囚徒博弈中各局中人为达到效用最大化,通常认为双方都选坦白是理性的,而从前面的分析中可以看出,双方坦白各自支付为-3,显然不是最大效用,因为还有0和-1的支付可能。再说,按古典经济学理论的解释,理性只适用于确定性情形中,对于风险和不确定性情形却难以做到。实际上,理性还依赖于行为人对不确定性情形的信念和对冒险的态度。在博弈推理中,理性假设的应用只局限于个体理性和阶段理性,而忽视集体理性和过程理性,所以理性人的假设是有问题的。

2 对公共知识假设的质疑

公共知识是博弈推理中的又一假设前提。公共知识的概念由Aum an提出:某事件对两个人A和B来说是公共知识,意味着A和B都知道此事,并且A知道B知道此事,B知道A知道此事,A知道B知道A知道此事,如此等等。[4]在此之前,博弈理论家非常疏忽参与人知道或不知道什么,Au2 m an和B randenburger[5]坚持证明纳什均衡根本没有公共知识假设的必要,正如他们所观察的,证明纳什均衡只要求每个参与人知道博弈和他对手所要采取的策略就足够了。然而,对博弈理性推理而言,情况就不同了。公共知识的假设成为必要,尤其是公共知识理性的假设相当重要。公共知识理性就是“每个参与人是理性的”是公共知识,即每个参与人都是理性的,每个参与人都知道每个参与人是理性的,如此等等。然而这一假设也是有问题的,是不真实的。

公共知识理性这一假设实在太强了。关于理性的分析前面已有论述,这里着重对公共知识进行剖析。如前所述,每个参与人都知道每个参与人是理性的,每个参与人都知道每个参与人都知道……每个参与人是理性的,这是公共知识,对每个参与人而言,“知道”每个参与人是理性的,那每个参与人是理性的就不是一种“可能”,而是确定的,并且这种“知道”会一直持续下去,否则参与人就不知道它为知识。这样一来,参与人在博弈中本可以自由地选取任一策略这一被博弈规则所许可的直觉上的方法却为公共知识理性假设所不许。一旦参与人拥有了公共知识理性,博弈困境的出现就是一种逻辑必然。正因为如此,Pettit和Sugden指出,参与人被归因于公共知识理性的情形对博弈论而言应该没有丝毫利益,在这种公共知识的情形下,没有参与人被允许策略地思考。……我们相信,公共知识理性的假设正如博弈理论所激发的一样,不应该严格地逐字采纳,它或许应该为像我们所给予“公共信念”这样的意思所取代。[6]

然而需要指出的是,“公共信念”也未必能行, Schick就对此持有异议,他认为“公共信念”还是太强了。[7]他以有限囚徒困境为例,“公共信念”暗示着每个参与人相信对方始终是理性的,而且也都相信自己始终是理性的,参与人在最后阶段的囚徒困境中,一开始他心里就相信那时他会选择抵赖,然而到时他却不能选择抵赖,以前的每个阶段也都是如此,他始终不能选择抵赖。这样一来就破坏了基本的困境前提:局中人须有选择的余地。只要给定“公共信念”,这一基本的前提就不能成立,每个局中人都知道他们将做什么,这样就无可选择,也就无困境可言。如果要谈困境的话,我们必须放弃“公共信念”。于是,Schick进而对“公共信念”进行了弱化,提出了“相互信念”假设。这一假设只是暗示参与人相信对方或除他之外别的参与人是理性的,而并不暗示参与人自己相信自己是理性的。他认为,在博弈中有“相互信念”就行了,“公共信念”只能使我们的思维混乱。

Schick提出以“相互信念”假设来弱化“公共信念”,进而取代“公共知识”假设,可以肯定地说,这种弱化的过程是合理的,它切中了导致博弈困境的真正原因。

[1] Berm udez L.Rationality and the Backw ards Induc tion A rgum ent [J].Analysis,1999,59(4):243-248.

[2] 蒋正锋.博弈推理中“理性人”的困惑[J].广东教育学院学报,2003(1):75-78.

[3] Butts,H intikka.A dvances in Understanding Rational Behavior [C]//ReidelD.Proceedings of the Fifth In ternational Congress of Logic,M ethodo logy and Philosophy of Science.PartⅡ.Ho l2 land:Dord recht,1977:315-343.

[4] Aum an R.Agreeing to d isagree[J].The Annals of Statistics, 1976(4):1236-1239.

[5] Aum an R,B randenburgerA.Ep istem ic Conditions forNash Equi2 librium[J].Econom etrica,1995,63:1161-1180.

[6] Pettit P,Sugden R.The Backward Induction Paradox[J].The Journalof Philosophy,1989,86:182.

[7] Schick F.Supp rise,Self2know ledge,and Commonality[J].The Journalof Philosophy,2000(8):448-449.

[8] 黄涛.豪尔绍尼评传[M].太原:山西经济出版社,1999.

[9] W eirich P.Equilibrium and Rationality[M].黄涛,译.北京:经济科学出版社,2000.

[10]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,1996.

Doubt on Pub lic Pre2assum p tions in Gam e Theory

JIANG Zheng2feng1,2
(1.Schoo lof Po litics and Adm inistration,South China Norm alUniversity,Guangzhou 510631,China; 2.Ideo logicalDepartm ent,South China Agricu lturalUniversity,Guangzhou 510642,China)

“Rational agent”and common know ledge are two public p re2assump tions in gam e theory,w hich assum e that p layers in gam e are rational,and choose action strategy againsta background of common know ledge tom axim ize utility. However,it consequentially puts rational reasoning in a dilemm a,and“rationalagent”is reasonless.Logically,whatwe can do is to throw doubton public p re2assump tions in gam e theory.

rationality;common know ledge;co llective rationality;individual rationality

B81

A

1674-2362(2010)05-0037-03

(责任编辑 朱慧娟)

2010-06-01

国家社会科学基金“经济逻辑研究”(06BZX050)

蒋正峰(1970—),男,湖南道县人,讲师,博士研究生,主要从事逻辑哲学研究。

猜你喜欢

局中人坦白囚徒
基于可信度方法在严格优势策略中的算法研究
张一山、潘粤明联手 演绎《局中人》
机智的囚徒
2×2型博弈决策均衡的归一化解法
中文的魅力,老外理解不了
超对策模型中多形式结局偏好认知信息融合的0—1规划方法
囚徒
真情告白
论坦白的处遇
论男性出轨者的囚徒困境