APP下载

寻路行为策略的进化博弈分析

2015-07-07史英杰

运筹与管理 2015年2期
关键词:收益导向乘客

段 琦, 史英杰

(天津大学 管理与经济学部, 天津 300072)



寻路行为策略的进化博弈分析

段 琦, 史英杰

(天津大学 管理与经济学部, 天津 300072)

针对我国交通枢纽站中乘客的寻路行为,建立了初访者群体之间以及初访者与熟悉者群体间的博弈模型及其复制动力学方程,并对复制动态做了分析和讨论,得出模型中博弈双方的进化稳定策略。研究结果表明枢纽站内初访者、初访者与熟悉者在有限理性基础上得到的进化稳定策略与标识布设的合理性有关,提出了改进标识布设以推进积极寻路行为发生的合理对策和建议。

进化博弈论;进化稳定策略;复制动力学方程;寻路行为;枢纽站

0 引言

我国城市轨道交通建设已随着城市的发展而步入快速发展阶段。处于多种轨道交通交叉点的枢纽站是城市轨道交通建设的重要组成部分,是实现客流有效组织的重要载体。但是,由于枢纽站自身建筑空间大且复杂的特点,导致了枢纽站中行人自我定位以及高效地找到目的地等行为的困难。而枢纽站客运组织功能的复杂性、多家建设单位参与建设的现状,更导致了枢纽站中导向标识布设的复杂性以及传递信息的不统一性。在枢纽中进行寻路所依赖的信息,主要来源于两个方面:导向标识传递的信息和其他乘客的行为信息。由此导致了初次进入枢纽的乘客会有两种寻路行为:模仿寻路以及标识寻路。基于当前我国枢纽站建设中标识布设的不良现状,上述两种寻路策略带有不对等的收益色彩。按照导向标识以及模仿他人作为人类在新环境中进行寻路的两种行为策略,都可以被看做是在任何人进行决策行为的过程中不断进行学习进化的结果。按照导向标识进行寻路与模仿寻路可以说是博弈双方的两种基本策略,最佳寻路的策略就是在模仿他人最有利的策略之后,再通过一个长期模仿和对标识自我理解的过程后,使得博弈双方趋于一个进化稳定策略(ESS)。本文运用进化博弈的复制动态法对枢纽站中的乘客在寻路过程中的寻路策略进行了研究,指出影响不同策略采用的因素以及合理的标识布设应该成为寻路行为的一种积极诱导。

1 相关研究进展

Fewings[1]依据寻路者到达目的地的原因而将寻路行为划分为娱乐性寻路、果断性寻路以及紧急性寻路。娱乐性寻路者,其目的在于自身的娱乐,例如在公园中散步、在商场中购物;果断性寻路是以尽可能高效地找到目的地为目标,例如外出就餐或者乘车去上学、工作等;紧急性寻路是尽最大努力快速到达特定目的地,可指火灾逃生、逃避恐怖袭击等。交通枢纽一般集交通、办公、商业、休闲、娱乐等服务于一体,其中行人的寻路行为在常态下一般涉及到Fewings分类中的娱乐性和果断性寻路,在危急情况下涉及到紧急性寻路。而现实中,由于注重娱乐的娱乐性寻路者放松、休闲的心态,果断性寻路者所面临的时间紧迫以及紧急性寻路者面对生命威胁等特点,导致了枢纽中乘客寻路行为是有限理性的。此外,由于人类寻路行为是一种复杂的系统决策过程,因此寻路现实中决策者行为的完全理性是很难满足的高要求。从而,有限理性的情况是普遍发生的。

一般来说,导向标识是用来抵消建筑物空间结构复杂性的一种手段[2]。标识是一种景观,是人与环境交流的一种媒介[3,4]。导向标识布设与交通枢纽站的建设并非同步开展,标识布设一般位于枢纽站功能分区确定之后。因此,人为安装在枢纽站的标识,由于毕竟不是随其所处环境一起产生的,容易产生标识信息不准确、不必要的现象。该现象在我国交通枢纽站中极为常见。这也在一定程度上解释了乘客在新步入某一枢纽站后不根据标识寻找目的地,而是通过问询他人或者直接模仿、尾随他人而到达目的地的行为,这种寻路行为是有限理性的行为。标识布设不合理而导致乘客无法获取自己下一步决策所需的信息、标识布设过于复杂而导致乘客无法在有限时间内获取所需信息等,都能成为解释模仿、尾随他人的寻路行为普遍存在的原因。

进化博弈理论最早可追溯至Fisher、Hamilyon和Trivers等发现使用博弈论的方法可以在多数情况下且不依赖任何理性假设的前提下对动植物进化结果进行解释[5]。1973年,Maynard Smith和Price提出进化稳定策略(Evolutionarily Stable Strategy, ESS),被学术界普遍认为是进化博弈理论诞生的标志。ESS作为进化博弈中最为基础的均衡概念,其核心思想为,若一个现存策略是进化稳定均衡策略,那么必须存在一个正的入侵障碍,使得在变异策略的频率低于该障碍时,现存的策略能够比变异策略获得更高的收益。

任何策略x作为ESS具有以下两个性质(y为任何变异策略)[6,7]:

u(x,y)≤u(x,x) ∀y

(y,x)=u(x,x)⟹u(y,y)

近年来,由于进化博弈理论能够反映出博弈方的学习和策略调整过程、行为和策略的动态稳定性以及分析和预测出有限理性个体组成的群体间的博弈,并已被广泛应用于经济制度及行为进化[9~11]以及社会行为进化等研究领域之中。其中,对社会行为进化的相关研究中,Nowak和Sigmund对人类的间接互惠行为进行了分析,从进化博弈的角度来理解人类社会合作[12];余孝军运用进化博弈理论研究了驾驶员群体与交管部门之间就超速与反超速的行为策略选择,得出了各博弈方的进化稳定策略[13];陶锋和邢会歌采用进化博弈的复制动态方法,分析了技术和制度创新中决策者的模仿及创新行为,提出构建诱导创新的社会氛围等建议措施[14]。上述将进化博弈理论应用于社会行为进化中的研究证实,进化博弈理论适合于研究人类在遇到复杂选择问题时由直觉引导或对成功者进行模仿的非理性行为方式。因此,采用进化博弈理论对交通枢纽站中人类的寻路策略选择进行分析和研究也是具有可行性的。

2 进化模型的建立与讨论

2.1 初访者群体间博弈

2.1.1 模型

初访者是指首次到达该交通枢纽站,或是曾在该枢纽中使用过其他非当前欲使用的功能的乘客。为了表示方便,将初访者群体抽象为两个个体,它们都是有限理性的博弈局中人。假设s表示初访者模仿他人寻路时的超额收益,即模仿比自己通过阅读、理解标识后寻路所节省的时间;w表示由于初访者与他人不同路时发生模仿错误而浪费的时间以及因此而导致的误车、误工等损失;x表示初访者模仿发生错误的概率(0

表1 初访者博弈的收益矩阵

其中s、w、x均为正数,该博弈的均衡取决于s、w以及xw的数值大小以及它们彼此间的相对大小。

2.1.2 复制动力学方程和ESS

由上述收益矩阵,构建复制动力学方程,以研究初访者群体间的进化动态规律。在构建复制动力学方程之前,还需要假设初访者中愿意采取模仿行为的乘客比例为y,则采取阅读标识行为的乘客比例为1-y。在此基础上,采取两种策略行为的博弈方的期望收益和群体平均期望收益为:

u模=y(s-w)+(1-y)(s-xw)

u标=y×0+(1-y)×0=0

根据以上所示收益得到初访者在采取模仿策略情形下的复制动力学方程为:

由Weibull[8]对ESS的定义可知,非内部最优的策略是不能成为ESS的。也就是说,作为进化稳定策略的点y*,必然是对采取策略的某博弈方来说是最优的,即若该博弈方由于一些偶然的错误导致其策略偏离了y*而采取了策略y,经过复制动态一定会使y回复到y*,可以说y*在进化压力下是稳健的。

2.1.3 讨论

对于上述三个平衡点,需要根据s、w、x的大小来具体进行分析:

按照常理来说,博弈双方都采取标识寻路策略时,其Pareto优于双方都采取模仿寻路策略,即s-w<0,所以y*=1这一平衡点被排除。

当s-w<0且s-xw>0时,即模仿错误时初访者的收益小于看标识时所得收益,同时也说明模仿的收益大于模仿发生错误后所受到的损失,此时y*=(s-xw)/(w-xw)是ESS,即由于建筑物自身通达性好、各功能区区分性强等结构特点或导向标识系统由于布设位置或内容不合理而导致初访者无法在不驻足的情况下得以理解利用时,初访者进行模仿的寻路行为是以上述y*=(s-xw)/(w-xw)的概率而发生的。而s-w<0且s-xw<0时,同样若模仿发生错误时初访者的收益小于看标识时所得收益,同时模仿所得收益小于模仿错误后所受到的损失,此时y*=0是ESS;由于枢纽站建筑结构复杂、目的地为不同方向的人流众多、标识设计符合人因需求等,这导致初访者阅读理解标识后根据标识的导向内容而作出寻路行为为最佳策略。

2.2 初访者群体与熟悉者群体之间的博弈

2.2.1 模型

在一个正常运营的交通枢纽中,除了初访者之外,还有经常使用该枢纽的乘客,将此类乘客称作熟悉者。除了前面讨论的初访者博弈行为之外,还需要考虑在寻路过程中,熟悉者与初访者之间的博弈行为。在前述的博弈模型中,可知初访者因选择策略的不同而收益有差,但是,熟悉者的行为也是初访者是否采取模仿或是标识策略的重要因素。此外,初访者策略选择也会对熟悉者产生一定的影响。除了继承上一模型中初访者的两种寻路策略之外,由于初访者犹豫、驻足阅读标识导致人流行进速度减缓等原因,导致熟悉者因初访者行为策略的不同而有同路或绕路两种策略供其选择。

假设熟悉者在行走路线通畅的情形下收益为s,可将该收益理解为节省的时间、赶上最近一班车等;熟悉者采取绕路行为时,会造成a的损失;由于初访者驻足阅读标识导致人流变缓时,寻路者的损失为b;初访者由于模仿发生错误的损失为w;模仿错误的概率为x。表2是该博弈中初访者和熟悉者的收益矩阵。

表2 初访者和熟悉者博弈的收益矩阵

其中s、w、x、a均为正数,b为非负数。

2.2.2 复制动力学方程和ESS

假设有比例为y的初访者选择模仿策略,则选择标识策略的初访者比例为1-y;选择同路策略的熟悉者比例为z,1-z比例的熟悉者选择绕路策略。

熟悉者采用同路和绕路策略的收益分别为:

u同=y(s-xw)+(1-y)(s-b),u绕=y(s-a-xw)+(1-y)(s-b)

该群体平均期望收益为:

=z[y(s-xw)+(1-y)(s-b)]+(1-z)[y(s-a-xw)+(1-y)(s-b)]

根据以上所示收益得到熟悉者在采取同路策略情形下的复制者动力学方程为:

初访者采用模仿或标识策略的收益如下:

u模=zs+(1-z)(s-a),u标=z(s-b)+(1-z)(s-a)

群体平均期望收益为:

=y[zs+(1-z)(s-a)]+(1-y)[z(s-b)+(1-z)(s-a)]

由以上各收益得到初访者在采取模仿策略情形下的复制动力学方程为:

2.2.3 讨论

3 结论

3.1 结论

初访者群体间博弈中,由于现实以及人类的行为特点,初访者全都不按照导向标识而模仿其他初访者进行寻路的情况是不可能发生的。由对两种条件下不同的ESS的讨论,可得如下结论:

(1)初访者选择模仿的人数比例与模仿发生错误所受到的损失是负相关的,即模仿发生错误的概率越大,初访者选择模仿行为的概率就越小,当这种错误概率达到一定程度时,初访者模仿行为的现象就会消失。(2)当模仿的收益小于看标识所得收益时,说明标识布设得较为合理,能够满足乘客在寻路过程中保持正常行进速度下理解标识、并按照标识指向而找到自己的道路。

由初访者与熟悉者间群体博弈讨论,可得如下结论:

(1)若存在一定比例的初访者不采用按照标识指示的寻路策略,即采用模仿策略的初访者在整体初访者中所占比例不为零时,熟悉者群体会逐渐倾向于选择同路策略。究其原因,在于选择绕路策略时会产生一定程度的损失。(2)当标识布设得足够合理,使初访者免于驻足而能够在正常行进中获取寻路所需要的信息时,任何比例的混合策略都是稳定的。这时初访者的行为策略完全由个人行为偏好所决定。(3)当标识布设不能满足在正常行进中被初访者所捕获,即初访者必须驻足以获取自身寻路所需的信息,由此导致的人流变缓给所有寻路者带来一定的损失。此时,若熟悉者群体中采取同路策略的比例不为零时,初访者群体逐渐倾向于采取模仿策略。

4.2 建议

(1)改善标识布设位置的合理性,在寻路过程中的关键决策点设置导向标识。在距离较长的通道或走廊内,为保证寻路者心理连续性而布设适当数量的标识。

(2)提高单个标识布设的合理性,从寻路者的需求角度出发,设计出内容满足寻路者行为决策时所需要信息的标识,保证标识信息布设的结构符合人因特点,满足高工效的要求。

(3)保证标识的简洁性和易读性,使标识布设在不因人流阻挡而破坏视野的范围之内,尽量满足标识内容无须驻足而在正常行走速度下可被理解的要求。

[1] Fewings R. Wayfinding and airport terminal design[J]. Journal of Navigation, 2001, 54(2): 177-184.

[2] O’Neill M J. Effect of signage and floor plan configuration on wayfinding accurancy[J]. Evironment and Behavior, 1991, 23(5): 553-574.

[3] Fuller G. The arrow-directional semictics: wayfinding in transit[J]. Social Semiotics, 2002, 12(3); 231-244.

[4] Raubal M, Winter S. Enriching wayfinding instruction with local landmarks[J]. Lecture Notes in Computer Science, 2002, 2478: 243-259.

[5] 洪开荣,孙倩.经济博弈论前沿专题[M].北京:经济科学出版社,2012.127.

[6] Smith J M, Price G R. The logic of animal conflict[J]. Nature, 1973, 246: 15-18.

[7] Smith J M. The theory of games and the evolution of animal conflicts[J]. Journal of Theoretical Biology, 1974, 47: 209-221.

[8] Weibull J W. Evolutionary game theory[M]. Cambridge: MIT Press, 1995. 9-11.

[9] Homburg C, Fuerst A, Ehrmann T. Incumbents’ defense strategies: a comparison of deterrence and shakeout strategy based on evolutionary game theory[J]. Journal of The Academy of Marketing Science, 2013, 41(2); 185-205.

[10] Ito J. Collective action for local management in rural Runnan, China: empirical evidence and hypotheses using evolutionary game theory[J]. Land Econimics, 2012, 88(1): 181-200.

[11] Cai G S, Kock N. An evolutionary game theoretic perspective on e-collaboration: the collaboration effort and media relativeness[J]. European Journal of Operational Research, 2009, 194(3): 821- 833.

[12] Nowak M A, Sigmund K. Evolution of indirect reciprocity[J]. Nature, 2005, 437(27): 1291-1297.

[13] 余孝军.超速驾驶行为的进化博弈分析[J].数学的实践与认识,2009,39(11):14-18.

[14] 陶锋,邢会歌.创新与模仿行为的进化博弈分析[J].科技进步与对策,2008,25(11):35-37.

Evolutionary Game Analysis of Wayfinding Behavior

DUAN Qi, SHI Ying-jie

(SchoolofManagementandEconomy,TianjinUniversity,Tianjin300072,China)

For the wayfinding behavior of passengers in transit hubs, and a game model among unfamiliar passengers, a game model between familiar and unfamiliar passengers are presented. The duplicative dynamic equations of these models are formulated and analyzed to obtain evolutionary stable strategies. It is showed that the evolutionary stable strategies of unfamiliar passengers and familiar passengers based on bounded rationality depend on the rationality of singage layout. Finally, some reasonable advices about how to optimize singage layout to improve positive wayfinding behaviors are proposed.

evolutionary game theory; evolutionary stable strategy; duplicative dynamic equation; wayfinding; transit hubs;

2013- 07- 03

国家自然科学基金青年基金资助项目(71201114)

段琦(1986-),女,北京延庆人,博士研究生,从事人因工程、标识布设及寻路行为研究;史英杰(1977-),女,管理学博士,讲师,从事消费者行为、博弈论应用研究。

F224.3;U291

A

1007-3221(2015)02- 0087- 05

猜你喜欢

收益导向乘客
以生活实践为导向的初中写作教学初探
嫦娥五号带回的“乘客”
“偏向”不是好导向
螃蟹爬上“网” 收益落进兜
汽车顶层上的乘客
最牛乘客
怎么设定你的年化收益目标
需求导向下的供给创新
犬只导向炮
2015年理财“6宗最”谁能给你稳稳的收益