APP下载

动态激励视角下建筑工人不安全行为演化博弈分析

2020-04-20吕云翔王晓峰

安全与环境工程 2020年1期
关键词:建筑工人惩罚激励机制

陈 艳,吕云翔,柴 访,王晓峰

(1.青岛理工大学管理工程学院,山东 青岛 266520;2.烟建集团有限公司第四分公司,山东 烟台 264000)

建筑业是世界上最危险的行业之一[1]。据统计,2018年全国房屋市政工程生产安全事故734起、死亡840人,与前一年相比,事故起数增加42起、死亡人数增加33人,分别上升6.1%和4.1%[2]。已有研究表明,90%以上的建筑安全事故与建筑工人的不安全行为密切相关[3]。可见,控制建筑工人的不安全行为是降低建筑安全事故发生的重要手段。

建筑业不同于其他行业,有其独特的结算方式、组织结构和作业条件,其显著的特点是大部分建筑工人(如钢筋工、木工、瓦工)的工资结算是以工程量为依据,这一特点促使建筑工人为完成更多的工程量,获得更多的工资收益,从而违反施工安全制度,做出可能引发建筑安全事故的不安全行为。加之建筑工人具有受教育程度低、流动性强、安全意识薄弱等特点[4],导致工程项目管理者制定的安全制度和安全守则难以约束建筑工人的不安全行为。而激励机制被广泛认为是促进群体间合作行为演化的重要机制,因此工程项目管理者可以采取合理的激励机制对建筑工人的不安全行为进行引导和矫正。

目前,关于建筑工人不安全行为的研究多集中于不安全行为的致因[5-6]、传播机理[7]、预防措施[8-9]等方面,对于建筑工人群体安全行为的激励机制的研究相对较少。如祁神军等[10]通过调查数据分析了建筑工人不安全行为与激励机制之间的关系,但该研究仅说明激励机制对建筑工人不安全行为有一定的干预作用,并没有阐述激励机制促使建筑工人不安全行为转变的原因。由于建筑工人群体和工程项目管理者存在不同的利益动机,建筑工人群体的不安全行为与工程项目管理者所采取的激励机制其实是一种动态博弈过程,所以从行为的“成本-收益”角度出发[11],运用博弈方法可以直观地分析建筑工人不安全行为的变化情况。如陈述等[12]基于博弈理论构建了水电工程施工安全管理激励模型;但经典博弈理论虽然应用广泛,但逐渐也暴露出其不足之处,即以完全理性假设为基础,而该假设显然与现实不符[13]。

演化博弈理论是以博弈者的有限理性假设为基础,并延续了传统博弈模型的竞争性、策略依存性等特点,强调博弈过程的动态演化[14],目前演化博弈论开始在安全行为研究中兴起。如王斯佳[15]构建了建筑施工群体与监管群体的演化博弈模型,认为有效的激励机制能够减少安全事故发生的概率,但该研究只涉及单一激励机制研究,而在实际工作中奖励(正向激励机制)与惩罚(负向激励机制)常常共存[16]。因此,传统的单一激励机制不能满足博弈双方期望收益的最大化,而采取正向激励机制与负向激励机制相结合的动态激励机制能更有效地控制建筑工人的不安全行为。为此,本文从建筑工人和工程项目管理者双方的利益动机出发,构建了以建筑工人和工程项目管理者为主体的动态激励机制下建筑工人不安全行为演化博弈模型,探究双方关注的利益焦点、策略选择条件和行为演变过程,并运用系统动力学(System Dynamics,SD)仿真工具对该博弈模型进行了仿真模拟,进一步分析关键参数变化对建筑工人不安全行为的影响,进而依据仿真结果,提出控制建筑工人不安全行为的对策与建议。

1 动态激励机制下建筑工人不安全行为演化博弈模型的构建

1.1 模型假设

根据建筑工程项目实际的安全管理情况,本文对构建的动态激励机制下的建筑工人不安全行为演化博弈模型做出如下假设:

假设1:将博弈主体分为建筑工人和工程项目管理者,且均表现为有限理性。

假设2:不安全行为指员工在生产过程中,违反安全生产制度、安全作业办法、生产技术规定等具有风险的行为[17]。本文认为建筑工人不安全行为是指由建筑工人做出的违反安全制度和安全规范或可能引发建筑安全事故的行为。

假设3:建筑工人在实际工作中面临两种选择:“安全行为、不安全行为”;而工程项目管理者作为对建筑工人的管理者,在实施激励机制时面临两种选择:“负向激励机制、正向激励机制”。

假设4:工程项目管理者采用负向激励机制时,如果建筑工人没有发生不安全行为,则获得正常收益,若建筑工人发生了不安全行为,则给予一定惩罚(包括经济惩罚、降薪、批评教育);工程项目管理者采用正向激励机制时,如果建筑工人没有发生不安全行为,则获得正常收益、安全奖励(包括经济奖励、加薪、通报表扬、称号),若建筑工人发生了不安全行为,则不可获得安全奖励。

1.2 模型构建

基于上述假设,模型的具体参数如下:R1表示建筑工人采取安全行为时的工资收益值;R2表示建筑工人采取安全行为时工程项目的收益值;R3表示建筑工人采取不安全行为时的工资收益值;R4表示建筑工人采取不安全行为时工程项目的收益值;h表示因建筑工人不安全行为造成工程项目的损失值;B1表示工程项目管理者采用负向激励机制时对建筑工人不安全行为的惩罚金;B2表示工程项目管理者采用正向激励机制时对建筑工人安全行为的安全奖励;p为建筑工人做出安全行为的概率;1-p为建筑工人做出不安全行为的概率;q为工程项目管理者采取负向激励机制的概率;1-q为工程项目管理者采取正向激励机制的概率。结合建筑工人不同行为发生的概率,可以得到建筑工人和工程项目管理者相应的收益矩阵,见表1。

表1 建筑工人和工程项目管理者的收益矩阵

1.3 模型分析

根据演化博弈的复制动态方程,按下面公式可求得建筑工人“安全行为”和“不安全行为”的期望收益SMN和SMO以及平均期望收益SM:

SMN=qR1+(1-q)(R1+B2)

SMO=q(R3-B1)+(1-q)(R3-B2)

(1)

SM=p×SMN+(1-p)×SMO

同理,按下面公式可求得工程项目管理者采取“负向激励机制”和“正向激励机制”的期望收益TWR和TWS以及平均价值感知TW:

TWR=pR2+(1-p)(R4+B1-h)

TWS=p(R2-B2)+(1-p)(R4+B2-h)

(2)

TW=q×TWR+(1-q)×TWS

在演化博弈进程中,某种策略的平均期望收益越高,建筑工人模仿和学习该策略的次数就越多。假设某一时刻建筑工人采取安全行为策略的概率为p,根据演化博弈理论,建筑工人下一时刻选择安全行为策略的概率变化率与现在时刻的安全行为策略概率、安全行为策略的平均期望收益的差值成正比。根据公式(1),可得建筑工人采取安全行为策略的复制动态方程式为

(3)

同理,可得工程项目管理者采取负向激励机制策略的复制动态方程式为

(4)

通过上述均衡点证明了建筑工人不安全行为发生的概率与建筑工人做出安全行为时的收益R1、不安全行为时的收益R3、不安全行为时的惩罚金B1、安全行为时的安全奖励B2等有关。该博弈模型存在5个均衡点,但以现有的条件并不能确定均衡点的稳定性。因此,本文将利用系统动力学仿真工具,构建动态激励机制下建筑工人不安全行为演化博弈SD模型,并从参数变化、时间推移等角度[18]分析博弈双方行为的演变过程。

2 基于系统动力学的仿真分析

2.1 系统动力学(SD)模型构建

王永刚等[19]所构建的民航安全监管演化博弈SD模型相对于其他奖惩类演化博弈SD模型[20-21],其结构更为简单,运用少量的中间变量即可演示出研究对象的变化情况,具有极强的可借鉴性。故本文以该演化博弈SD模型为基础,构建了以建筑工人和工程项目管理者为主体的动态激励机制建筑工人不安全行为演化博弈的SD模型。

由于应用场景不同,本文对王永刚等所构建的演化博弈SD模型进行了一定的修正。本文构建的动态激励机制下建筑工人不安全行为演化博弈的SD模型由4个水平变量、2个速率变量和12个辅助变量构成。其中,建筑工人做出“安全行为”的概率和做出“不安全行为”的概率、工程项目管理者采取“负向激励机制”的概率和“正向激励机制”的概率分别用4个水平变量来表示;建筑工人不安全行为的概率变化率和工程项目管理者采用不同激励机制的概率变化率分别用2个速率变量来表示。该模型的流图见图1。

图1 动态激励机制下建筑工人不安全行为演化 博弈的SD模型Fig.1 SD model of the evolution game of construction workers’ unsafe behaviors based on dynamic incentive mechanism

根据文献数据并结合工程项目实际情况对模型变量赋值,建筑工人不安全行为的惩罚金和安全行为的安全奖励分别为B1=7、B2=1,由于建筑工人不安全行为的工资收益值大于安全行为的工资收益值,设R1=1、R3=4,其余参数初始值的设置则是为了保证行为选择概率能够保持相对稳定所进行的随机赋值,这将利于改变其中任何一个参数,能有效观察行为选择概率的变化,设置的初始参数如下:INITIAL TIME=0,FINAL TIME=200,TIME STEP=1,时间单位为周,R2=5,R4=6,h=2。其中,外部变量分别对应表1收益矩阵中的7个变量取值。

结合上述分析,采用软件Vensim Ple对动态激励机制下建筑工人不安全行为演化博弈的SD模型进行了仿真模拟。SD模型中流率公式及其涉及到的变量根据前面分析得到的变量之间的关系和公式(1)~(4)确定。其中,SD模型中的主要变量(以建筑工人模块为例)有建筑工人做出不安全行为的概率(NSB)、建筑工人做出安全行为的概率(SB)、行为变化率(BV)、安全行为与不安全行为期望收益的差异值(MP)、不安全行为期望收益(NSBI)、安全行为期望收益(SBI)、工程项目管理者采用正向激励机制的概率(PI)、工程项目管理者采用负向激励机制的概率(NI)。SD模型中主要变量的方程如下:

NSB=INTEG(BV,initial)

SB=INTEG(-1×BV,initial)

BV=NSB×SB×MP

NSBI=PI×(R3-B2)+NI×(R3-B1)

SBI=PI×(R1+B2)+NI×R1

2.2 SD模型仿真分析

将博弈模型的纳什均衡代入上述SD模型中,以纯策略(1,0)和混合动态策略(0.5,0.5)为例进行仿真模拟。当采用纯策略时,纯策略(1,0)的演化博弈过程仿真模拟结果,见图2。

图2 纯策略(1,0)的演化博弈过程仿真模拟Fig.2 Simulation of evolution game process of pure strategy(1,0)

由图2可见,当工程项目管理者100%采用正向激励机制,而建筑工人100%做出安全行为,双方达到稳定状态。

为了验证纯策略的稳定性,假定纯策略中出现新的策略(0.99,0.01),分析其演化博弈过程,见图3。

图3 纯策略(0.99,0.01)的演化博弈过程仿真模拟Fig.3 Simulation of evolution game process of pure strategy(0.99,0.01)

由图3可见,当工程项目管理者采用正向激励机制时,建筑工人做出不安全行为的概率开始只有1%,但随着时间的推移,建筑工人做出不安全行为的概率越来越高,说明其通过实践发现当工程项目管理者采用正向激励机制时实施不安全行为带来的收益更多,实践和模仿该行为的次数逐渐增多,最终建筑工人都做出不安全行为。通过分析可知,上述纯策略存在路径依赖现象,表明纯策略均衡点是不稳定的,不存在进化稳定策略。

当采用混合动态策略时,混合动态策略的演化博弈过程仿真模拟结果见图4。

图4 混合动态策略的演化博弈过程仿真模拟Fig.4 Simulation of evolution game process of mixed dynamic strategy

由图4可见,其仿真曲线是以p=0.5为中心振荡发展,表明工程项目管理者采用动态激励机制与建筑工人不安全行为的博弈过程是不断循环进化的。以初始情况为建筑工人做出安全行为、工程项目管理者采用正向激励机制为例,工程项目管理者采用正向激励机的目的在于以奖励的方式来促使建筑工人做出安全行为,但当建筑工人做出安全行为时,随着时间的推移,工程项目所需付出的成本也在增加,致使其利润降低,故工程项目管理者会逐渐调整为负向激励机制;由于建筑工人在负向激励机制下没有相应的安全奖励,且当其不安全行为的收益大于安全行为的收益时,建筑工人开始做出不安全行为;当建筑工人做出不安全行为造成工程项目损失时,工程项目管理者会逐渐调整至正向激励机制,以此鼓励建筑工人做出安全行为;因做出不安全行为所扣除安全奖励的缘故,建筑工人做出不安全行为的收益要明显小于安全行为的收益,建筑工人会逐步做出安全行为;此时,双方又回到原始出发点,如此循环前述过程。上述仿真模拟结果证明:混合动态策略的均衡点也是不稳定的,不存在进化稳定策略。

3 仿真结果分析与对策建议

由上述分析可知,博弈过程不存在进化稳定策略,建筑工人的不安全行为和工程项目管理者采用的激励机制呈现出循环状态,这既不利于建筑工人不安全行为的控制,也不利于建筑企业进行安全管理。为了减少博弈过程的波动性或促使其达到某种稳定状态,使建筑工人在实际工作中主动做出安全行为,可通过调节关键参数,分析建筑工人不安全行为的演变趋势,进而提出控制建筑工人不安全行为的建议。

3.1 采取与不安全行为收益相关的动态惩罚策略

不安全行为带来的“高工资收益”是建筑工人做出不安全行为的主要原因。而当静态惩罚策略无法使演化博弈过程达到均衡状态时,可采用动态惩罚策略使演化博弈趋势逐渐达到收敛[22]。因此,将建筑工人不安全行为的惩罚金B1由静态惩罚机制中的固定常数变为与不安全行为收益相关的惩罚函数:g(R3)=(R3-R1)K(其中K表示惩罚系数),此时将惩罚视为动态惩罚策略。本文对工程项目管理者采用动态惩罚机制下建筑工人做出安全行为的概率进行了仿真模拟,其结果见图5。

图5 与不安全行为收益相关的动态惩罚策略的演化 博弈过程仿真模拟Fig.5 Simulation of evolution game process of dynamic penalty strategy related to unsafe behavior income

由图5可见,随着时间的推移,工程项目管理者采用动态惩罚机制下建筑工人做出安全行为的概率曲线演化趋势呈逐渐收敛状态,最终稳定到均衡点,这说明当不安全行为收益增大时,工程项目管理者对于建筑工人实施的惩罚力度也加大,建筑工人在做出相应行为时会将不安全行为收益与惩罚后的期望收益进行对比,选择期望收益较高的行为。因此,工程项目管理者可以采取动态惩罚策略,通过对K值的调节,调整与建筑工人不安全行为收益相匹配的惩罚力度,使动态激励机制演化博弈过程达到均衡状态。

3.2 合理的惩罚力度

目前国内外关于惩罚力度对于不安全行为概率的影响研究已有很多。如王永刚等[19]认为在短期内随着惩罚力度的上升,博弈方违规概率会快速下降;张攀等[20]认为从长期来看,加大惩罚力度会使博弈过程提前达到新的平衡。为了验证提高惩罚力度对建筑工人不安全行为的影响,本文将惩罚金B1的取值从3变为6,仿真模拟了工程项目管理者提高惩罚力度后建筑工人做出安全行为的概率曲线,见图6。

图6 惩罚力度变化的演化博弈过程仿真模拟Fig.6 Simulation of evolution game process of the variation of penalty intensity

由图6可见,工程项目管理者提高对建筑工人不安全行为的惩罚力度后,建筑工人做出安全行为的概率得到了提升,但到达较高程度后逐渐趋于稳定,即动态激励机制下演化博弈过程达到均衡状态,这说明工程项目管理者实施较高惩罚力度降低了建筑工人不安全行为的收益,建筑工人考虑到做出不安全行为的收益要小于安全行为的收益,在实际工作中会倾向做出安全行为,从而降低了不安全行为发生的概率。

3.3 提高安全奖励的额度

已有研究表明,提高安全奖励额度也可以使演化博弈过程加快达到新的均衡状态[20]。本文将安全奖励额度B2的取值从2变为4,仿真模拟了在惩罚力度不变的情况下建筑工人做出安全行为的概率曲线,见图7。

图7 安全奖励额度变化的演化博弈过程仿真模拟Fig.7 Simulation of evolution game process of the variation of security reward amount

实施安全施工作业是建筑工人的义务和责任,不对建筑工人进行安全奖励(即采取正向激励机制)是建设项目管理者的传统做法。但由图7可见,当安全奖励额度增大时,建筑工人做出安全行为的概率逐渐增大,最终稳定到新的均衡,这说明工程项目管理者在制定激励机制时,应充分考虑安全奖励因素对建筑工人不安全行为的影响,综合运用奖惩措施,提高对未发生不安全行为的建筑工人给予一定的安全奖励额度。

通过对比图5、图6和图7可见,上述三种措施均可降低建筑工人不安全行为的概率,但三者达到的均衡不同,而控制建筑工人不安全行为的有效措施依次为:加大对建筑工人不安全行为的惩罚力度、提高安全奖励的额度、采取与不安全行为收益相关的动态惩罚策略。由此可以看出,建筑工人对于惩罚参数的变化更为敏感。

“心理账户理论”认为,人们会无意识地把财富划归于不同的心理账户进行管理,不同的心理账户有不同的“记账方式”,因此会导致非理性决策行为的发生。建筑工人依照获得感知或失去感知,将心理账户分为效价账户和成本账户,不同的心理账户有不同的感知参照点,即建筑工人在面对回报时,如果回报值大于回报参照点,其相对回报便是正值,即获得相对收益感知;如果回报值小于回报参照点,其相对回报便是负值,即获得相对损失感知。同理,成本账户也是如此。建筑工人往往希望通过低付出获得高回报,所以易形成高效价参照点和低成本参照点。

一方面,基于效价账户视角,安全行为效价与不安全行为效价相差无几,效价账户主要来源是工资而不是安全奖励,当效价参照点较高时,建筑工人会对效价差异感知微弱,不会因为低额的安全奖励改变自己的策略选择,说明高效价参照点不利于建筑工人选择安全行为策略。另一方面,基于成本账户视角,安全行为成本与不安全行为成本相差较大,当采取安全行为时的工资收益小于采取不安全行为时的工资收益,建筑工人通常将采取不安全行为时获得的工资收益作为正常收益,而当建筑工人获得安全行为的工资收益时,其会产生成本损失感知,一般情况下建筑工人倾向于选择不安全行为策略,由于建筑工人对成本差异感知强烈,说明低成本参照点不利于建筑工人选择安全行为策略。因此,可以考虑通过改变建筑工人收益结构,依托劳务合同条款设置,在总收益不变的情况下,提高安全奖励占总收益的比例,若在施工过程中发生不安全行为,则扣除相应的安全奖励,以此降低效价账户的参照点;同时,降低工资收益占总收益的比例,提高成本账户的参照点。由此将建筑工人的策略选择控制在低效价参照点和高成本参照点区域,引导其选择安全行为策略。

4 结 论

建筑工人的不安全行为与工程项目管理者所采用的激励机制的博弈演化过程是动态变化的,而现实中多数工程项目管理者所采用的激励机制却是静态的,这不但不能满足博弈双方期望收益的最大化原则,同时也难以实现激励机制的预期效果。本文从博弈双方利益动机出发,借助演化博弈理论以及系统动力学(SD)理论构建了动态激励机制下建筑工人不安全行为演化博弈的SD模型,并利用Vensim Ple软件对纯策略、混合动态策略以及关键参数变化进行了仿真模拟,得出以下结论:

(1) 建筑工人不安全行为与工程项目管理者采用不同激励机制的博弈过程是不断循环、进化的,如果工程项目管理者对建筑工人实施一成不变的激励机制,建筑工人可能通过学习找到政策漏洞,形成“上有政策、下有对策”的情形,使激励机制难以达到预期的目的。因此,对于工程项目管理者来说,应针对建筑工人不同的行为策略,及时调整相应策略,寻找既能促使建筑工人采取安全行为,又能尽可能地减少管理成本支出的策略,以减少建筑工人不安全行为发生的概率,促进工程项目的安全生产。

(2) 当采用混合动态策略时,仿真曲线呈现围绕中心振荡的波动性,说明在该条件下建筑工人的行为选择不会趋于某一种策略;提高安全奖励的额度、加大对建筑工人不安全行为的惩罚力度、采用与不安全行为收益相关的动态惩罚策略均可有效地抑制仿真曲线的波动性,理论上可以降低建筑工人不安全行为的概率。

(3) 依据心理账户理论,加大对建筑工人不安全行为的惩罚力度能更有效地控制建筑工人的不安全行为;同时,通过改变建筑工人的收益结构,可将建筑工人的策略选择控制在低效价参照点和高成本参照点区域,引导其选择安全行为策略。

猜你喜欢

建筑工人惩罚激励机制
激励机制在企业人力资源管理中的应用
激励机制在中小学班级管理中的应用
神的惩罚
Jokes笑话
建筑工人
建筑工人
真正的惩罚等
“同舟计划”:为建筑工人撑起一片天
浅议中小企业激励机制
如构何建电力系统员工有效激励机制