保险驱动的网约车三方演化博弈研究*

2023-05-12胡群鹏袁鹏鹏陈文昊朱俊武

计算机与数字工程 2023年1期

胡群鹏袁鹏鹏陈文昊朱俊武

（1.扬州大学信息工程学院（人工智能学院）扬州 225009）（2.中国船舶集团有限公司第七二三研究所扬州 225127）

1 引言

随着我国科技实力的日益增强，网络信息技术促进着各行业的蓬勃发展，不但推动工业领域迅速进步，更是在人民日常生活中起到日益重要的作用，助力人们的新型生活方式。然而，网约车的发展在带给大众出行便利的同时，也引发了一系列出行安全问题，暴露出网约车监管层面存在的若干漏洞：1）行业协会建立得很不成熟；2）依靠产业经营自律公约缺乏足够的约束力；3）缺少宏观层面的调控无法保证市场的健康有序发展。自2017 年开始网约车门槛降低，发生了许多影响恶劣的恶性事件，受害者有乘客也有司机，这些事件不仅给受害者家庭带来了极大的不幸，更是引起了人们对网约车平台安全性的讨论。由于信息不对称以及高昂的监管成本，政府难以对于网约车平台以及乘客进行有效监管的根本原因在信息不对称和成本太高。2021 年7 月交通运输部发文要求加强网约车监管，各大城市不断完善相关政策，网约车保险成为了监管的有效手段之一。同年11 月交通运输部等八部门共同印发《关于加强交通运输新业态从业人员权益保障工作的意见》，其中也指出了保险对于网约车行业的重要性。保险公司在保障网约车司机与乘客的生命安全方面具有不可或缺的职责和功能。

现有的网约车保险难以发挥市场监管及保障事故中司机和乘客利益的作用。所以，针对网约车平台、保险公司和乘客三方的演化博弈过程的深入探讨，就有很大的研究价值：一方面，对于网约车司机和乘客的不良行为起到约束作用，提升司机和乘客的服务满意度；另一方面，对于保险公司推出合适的保险产品具有一定帮助，能够有效协助网约车保险保费进行动态调整。

近年来，网约车监管在学术界引起了广泛关注，学者对网约车的监管主体、监管手段等方面都进行了深入研究。网约车的出行安全是政府部门与网约车平台应该共同恪守的底线，可靠的网约车保险能够对网约车司机和乘客的不良行为起到约束作用，提升司机和乘客的服务满意度。在网约车迅速发展的背景下，行业监管缺失［1］正成为首要问题。基于此，Rogers［2］分析了网约车迅速发展下的社会成本与收益。高颖在文献［3］中指出了网约车监管的必要性和网约车保险的缺失，阐述了网约车保险能够规范和统一网约车平台的经营服务并进行有效监督，以此推动其持续的良性发展。文献［4］中蒋大兴等剖析了平台的地位、竞争规则等关于共同经济规制方面的问题。

创新性的保险方案是目前的研究热点。周佳璇［5］通过案例引入和现实分析研究了如何化解网约车难题，使得保险公司能够正常赔付，保证司机和乘客的合法利益。在文献［6］中陈牮等对网约车的新型保险问题加以研究，并试图用构建新险种来满足对网约车出行的保险需要。文献［7］中Carfora等提出了几种创新的汽车保险概念并通过施行一个真实案例研究来评估所提出的解决方案的有效性。文献［8］中Tselentis 等提出了一种保险方式，司机必须根据自己的驾驶行为支付保费，而不是固定的价格。许利娜［9］提出将“人”的因素引入车险定价，给予保险公司对于保险定价一个新的思路。顾建强等［10］根据网络安全保险制定了新型网络系统安全保障机制。

很多监管、决策问题学者通过演化博弈的方法解决。文献［11］付淑换等人引入演化博弈方法，跟踪并调研了网约车平台和保险公司之间博弈行为的演化路径，深入挖掘了在保险监管下影响网约车平台战略决策的主要因素，试图厘清网约车平台和保险公司在静态、动态惩罚模式下利益博弈的均衡关系。WAN X［12］通过模拟网约车平台与政府之间的演化博弈体系，试图从政府的创新投入与技术治理角度探讨网约车行业的新型监管机制，但其并未考虑保险公司与乘客这两大主体对网约车营运的实际影响。在文献［13～14］中作者都使用了三方演化博弈的方式，通过复制动态方程和稳定性分析来解决不同领域的问题，给予本文完成网约车保险驱动的三方演化博弈的研究方法和思路。文献［15～16］尝试以三方演化博弈的方法研究网约车公司、司机和乘客之间的关系，但忽略了保险公司在网约车领域的重要作用。

为解决网约车保险的监管难题并保障乘客的出行安全，本文从分析保险的监督职能出发，通过构建保险公司、网约车平台和乘客三者的博弈关系，利用演化博弈理论探究三方策略选择的动态变化过程，为保险公司对网约车平台和乘客的监督工作提供可行的理论依据。

2 模型建立

2.1 问题描述

在保险公司、网约车平台和乘客的博弈体系中，考虑三方主体均具备有限理性，即总是在不完全信息下做出不完全理性的战略选择，实现预期中的最大化利益。

保险公司作为风险经营主体，其往往在综合考量承保风险的基础上决定承保险别和保费高低。在网约车平台购买保险后，保险公司将依据网约车平台营运的“危险程度”拟订保费，并参考相应的监管标准惩处平台的违规营运行为。在乘客投保后，网约车平台的任务是监督乘客的行为，通过分析乘客平时的个人行为以及司机对乘客的评价来将具体数据上报给保险公司。

设保险公司的策略空间为{B1(监督),B2(不监督)}、网约车平台的策略空间为{W1(监督),W2(不监督)}、乘客的策略空间为{ }C1(守纪),C2(违纪) 。设保险公司选择监督的可能性为q，选择不监督的可能性为1-q；网约车平台选择监督的可能性为p，选择不监督的可能性为1-p；乘客选择守纪的可能性为m，选择违纪的可能性为1-m。

2.2 模型假设

假设1网约车平台从事经营活动时，对网约车司机的财产和人身安全具有投保义务，最低保费金额为S1。

假设2乘客作为被服务主体，因网约车事故频发，考虑到人身安全问题，在网约车平台的规定下为个人出行订单投保，最低保费金额为S2。

假设3用户人数不会随保险公司、网约车平台和乘客的不同策略选择而改变。

假设4保险参与社会风险管理的职能体现在保险公司监督网约车平台和乘客的行为并动态调整保险保费。当网约车平台没有正常开展安全监督工作时，保险公司不仅收取最低保费S1，还需在其基础上加收惩罚性保费F1；当乘客作出影响网约车安全营运的违纪策略选择时，保险公司在其最低保费S2的基础上还需加收惩罚性保费F2/ya。

假设5保险公司的风险监督仅能帮助其根据网约车平台和乘客的行为策略来调整保费，无法对网约车营运的事故发生率产生影响。网约车平台不监督会导致事故率上升，乘客的违纪行为也会导致事故率上升。

假设6 政府对保险公司罚金高于保险公司监管成本。

假设7 保险公司的监督成本远小于保险公司总收入。

2.3 变量设定与基本概念

基于博弈模型假设，如表1 所示进行变量设定。

表1 变量设定

一个三方演化博弈机制M是一个十二元组，记作：M=（（参与三方I，O，P），Φ，C1，C2，F1，F2，L1，L2，L3，L4，pi，δ）。

其中I 是保险公司，O 是网约车平台，P 是乘客，Φ 是各参与主体策略集的笛卡尔积，δ是三方演化博弈的结果。

定义1决策规则

直接机制(q,t)包含行为人的每个类型到一个选项的映射q:Φ →A，以及行为人的每种类型到行为人付出的货币转移支付（正t）或得到货币的转移支付（负t）的映射t:Φ →R，称q为“决策规则”。

定义2激励相容

对三方演化博弈机制，如果对于所有的θ，θ′Φ ，有u(q(θ),θ)-t(θ)≥u(q(θ′),θ)-t(θ′) ，则一个直接机制是“激励相容的”。

定义3预算可行

对三方演化博弈机制，如果对于所有的θΦ，有，则一个直接机制是“预算可行的”。

定义4个体理性

对三方演化博弈机制，令aA。若对所有的θΦ，有u(q(θ),θ)-t(θ)≥u(a,θ)，则一个直接机制是“个体理性的”。

2.4 三方博弈关系的构建

通过对保险公司、网约车平台和乘客的分析，可得出图1来表示网约车保险中的三方博弈关系。

网约车保险机制的顺利运行离不开保险公司、网约车平台、乘客三方之间的共同作用。由图1 可知，三方主体在该机制的运行过程中各具职能，其主要业务流程为网约车平台监督乘客、乘客向保险公司交付保险、保险公司监督网约车平台。

图1 三方博弈关系

于是，在该业务流程的基础上建立三方博弈关系。如图1 所示，可供保险公司、网约车平台、乘客三方主体选择的行为策略分别有{B1(监督),B2(不监督)} 、{W1(监督),W2(不监督)} 、{C1(守纪),C2(违纪)} 。随着网约车保险机制的运行，三方作出不同行为策略的选择，形成三方演化博弈。图1 中呈现了不同主体利益出现主要损失的三种博弈结果，分别为网约车平台选择“不监督”被保险公司加收罚金而带来损失、网约车平台选择“监督”提高营运成本而带来损失、乘客选择“违纪”被保险公司加收罚金而带来损失。

厘清此处的三方博弈关系，有利于我们在下文中进一步开展三方演化博弈分析与纳什均衡求解的相关工作。

3 三方演化博弈与稳定性分析

3.1 三方演化博弈支付矩阵的构建

根据第1 节中的问题描述、模型假设及博弈关系分析，对保险公司、网约车平台和乘客的三方演化博弈进行支付矩阵构建，结果如表2所示。

表2 三方演化博弈支付矩阵

在该三方演化博弈支付矩阵中，表头所包含的信息为：保险公司、网约车平台和乘客三方主体的策略选择和作出相应策略选择的概率。由表2 可知，博弈三方作出不同的策略选择将带来不同的损益结果。

以支付矩阵中第3行、第2列的收益公式为例，S1+ya*S2-br*ya*(L1+L2)-C1表示的是当保险公司采取“监督”策略、网约车平台采取“监督”策略、乘客采取“守纪”策略时，保险公司获得的收益。

特别地，无论保险公司、网约车平台和乘客三方作出何种策略选择，乘客收益总为负值。

3.2 复制动态方程

博弈三方的参与主体将依据现有信息对策略的变化做出选择，不断调整概率值q、p、m 的大小，直到最终实现动态平衡。通过求解各参与主体预期收益和动态复制方程，进行各策略的分析，求得演化均衡策略。

由表2 三方博弈主体间的混合策略支付矩阵得出，保险公司采取“监督”策略时的期望收益为Eb1，保险公司采取“不监督”策略时的期望收益为Eb2，保险公司平均收益为Eb，则有：

根据Malthusian 方程，保险公司选择“监督”策略的数量增长率等于期望收益Eb1与平均收益Eb之差，由此可得保险公司的动态复制方程：

同理，可得网约车平台和乘客的动态复制方程：

3.3 演化博弈模型的稳定性分析

对比保险公司、网约车平台和乘客三方群体演化，可以通过三方的复制动态方程来分析。下面根据雅可比矩阵定性分析系统在这些均衡点的局部稳定性，令F(q)=0，F(p)=0，F(m)=0，联立三者的复制动态方程，并赋值得到以下方程组：

当均衡点为纯策略组合时，对方程组（7）求解：

由3.2 节中的三个动态复制方程，求得雅可比矩阵(J)：

根据Lyapunov 判别法，当雅可比矩阵的所有特征值λ<0 时，该均衡点是渐进稳定点；当雅可比矩阵中所有特征值λ>0 或有正有负时，该均衡点是不稳定点。由于本文主要关注网约车保险的制定问题，所以主要关注纯策略纳什均衡点O8(1,1,1)的雅可比矩阵为

解得此时的特征值为λ1=C1-L4、λ2=C2-L3-F1、λ3=pi-F2。假设O8(1,1,1)为稳定点，则需要同时满足以下条件：

此时，保险公司倾向于采取“监督”策略，网约车平台倾向于采取“监督”策略，乘客倾向于采取“守纪”策略。

此外，我们还可以知道三方演化博弈的最终演化结果与保险公司赔偿金额、事故率以及每一位乘客带来的收益无关。

4 保险驱动的网约车三方演化博弈算法

根据以上公式以及演算结果，通过Matlab得到不同输入情况下的三方演化博弈仿真。根据演化博弈模型，本文首先设计了算法1 来得出三方演化博弈的结果。

在算法1 中，输入为政府对保险公司罚金L4，用户人数ya，网约车平台监管成本C2，政府对网约车平台罚金L3，网约车平台惩罚性罚金F1，乘客违规潜在收益pi及乘客惩罚性罚金F2。在设置三方演化博弈主体选择策略的初始概率后，通过动态方程以及输入数据仿真出三方演化博弈的图像，最终输出为三方演化博弈的演化结果。

算法1 三方演化博弈结果

输入：政府对保险公司罚金L4，用户数量ya，网约车平台监管成本C2，政府对网约车平台罚金L3，网约车平台惩罚性保费F1，乘客违规潜在收益pi，乘客惩罚性保费F2

输出：三方演化博弈的结果

1 Set the initial value of tripartite evolutionary game；2 Draw the evolutionary game image A by the input parameters；3 B←A（size（A，1））；4 if B（1）=1 then 5 Ic=1； //保险公司采取监督策略6 else 7 Ic=0； //保险公司采取不监督策略8 end if 9 if B（2）=1 then 10 Oc=1； //网约车平台采取监督策略11 else 12 Oc=0； //网约车平台采取不监督策略13 end if 14 if B（3）=1 then 15 Pc=1； //乘客采取守纪策略16 else 17 Pc=0； //乘客采取违纪策略18 end if

在算法2 中，输入为三方演化博弈所需要的三方参数，通过算法1 中的三方演化的结果来对于保险公司惩罚性保费进行动态调整，通过动态方程的结论来对惩罚性保费做限制，使得最后三方演化博弈的结果趋向于保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略。

算法2 保险公司调整保费建议

输出：不同初始条件下惩罚性保费的调整策略

1 Execute allocation algorithm shown in Algorithm 1；2 if the output of Algorithm 1 is［supervision，su⁃pervision，discipline］then 3 Pm=0； //保险公司不需要调整保费4 else 5 if C2 ≥L3+F1 then 6 Propose to increase penalty premium F1；7 else if pi ≥F2/ya then 8 Propose to increase penalty premium F2；9 else 10 Insurance companies can not super⁃vise；11 end if 12 end if

5 定理证明

定理1网约车保险驱动的三方演化博弈机制满足激励相容

证明：三方演化博弈的理想策略是保险公司选择“监督”策略，网约车平台选择“监督”策略，乘客选择“守纪”策略，此时保险公司的收益为S1+ya*S2-br*ya*(L1+L2)-C1，如果保险公司选择“不监督”策略，此时保险公司的收益为S1+ya*S2-br*ya*(L1+L2)-L4，由于政府罚金L4远大于监管成本C1，易得：

理想策略下网约车平台的收益为ya*sr-S1-C2，如果网约车平台选择“不监督”策略，此时保险公司的收益为ya*sr-S1-F1-L3，由于政府罚金L3和惩罚性保费F1之和大于监管成本C2，易得：

理想策略下乘客的收益为-sr-S2，如果乘客选择“违纪”策略，此时乘客的收益为-sr-S2-F2/ya+pi，由于惩罚性保费F2/ya大于潜在收益pi，易得：

综上，可以看到在理想策略下，保险公司、网约车平台和乘客的收益都能增加。由此可知，博弈主体将会向着理想策略演化。

定理2网约车保险驱动的三方演化博弈算法是预算可行的

证明：由于理想策略下事故率较低，所以当价值为fi的任务被加入分组中时，保险公司对每一个乘客i 的平均赔付不会超过fi，保险公司的总支出为br*ya*(L1+L2)+C2，总收入为S1+ya*S2，又由于保险公司的监督成本远小于保险公司总收入，对于支出和收入有以下公式：

定理3网约车保险驱动的三方演化博弈算法对保险公司是个体理性的

证明：在保险公司采取“监督”策略时，预期收益为

在保险公司采取“不监督”策略时，预期收益为

在所有情况下，由于政府罚金L4远大于监管成本C1，我们可以得到：

在算法过程中，惩罚性保费过低会使得三方演化博弈的结果不向理想策略演化。对于惩罚性保费，任何不向理想策略演化的初始值都会向着理想策略演化的初始值演化，任何不向着理想策略演化的初始值都将被修改。

6 仿真实验与结果分析

6.1 仿真环境介绍

为了评估保险公司、网约车平台、乘客之间策略选择的动态演化结果，本文在联想Y7000P，i7-10750H，Windows10 的硬件环境下，借助Matlab R2018b 软件对网约车保险驱动的三方演化博弈进行数值仿真实验。

6.2 仿真结果分析

6.2.1 三方主体策略选择的初始概率对演化博弈结果的影响

设初始时间为0，保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略的概率初始值设定为［0.8，0.5，0.2］、［0.5，0.2，0.8］、［0.2，0.8，0.5］，即策略选择的初始概率不同时，系统演化的稳定情况及仿真结果如图2 所示。研究演化轨迹可以发现，在满足稳定策略的参数条件下，演化博弈的结果都会逐渐演化为保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略，这说明系统的稳定情况与初始策略人群占比无关，策略选择的初始概率只会影响系统演化的路径与中间状态，不会影响系统向均衡点演化的最终结果。

图2 策略选择的初始概率不同时的演化结果

调整保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略的概率初始值设定为［0.2，0.2，0.2］、［0.5，0.5，0.5］、［0.8，0.8，0.8］时，由图3 中系统演化的稳定情况及仿真结果可知，初始策略选择越趋近稳定情况下的策略选择，系统演化达到稳定情况的时间越短。

图3 策略选择的初始概率逐渐趋近稳定情况时的演化结果

6.2.2 调整网约车平台惩罚性保费对演化博弈结果的影响

设初始时间为0，保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略的概率初始值设定为［0.5，0.5，0.5］时，调整网约车平台惩罚性保费，系统演化的稳定情况及仿真结果如图4所示。

图4 调整网约车平台惩罚性保费的演化结果

由图4 可知，增加网约车平台惩罚性保费或减少网约车平台监督成本，有助于达到预期演化结果。若网约车平台惩罚性保费与政府罚金之和低于平台监督成本，则会导致网约车平台倾向于“不监督”策略，从而影响网约车的安全性。

6.2.3 调整乘客惩罚性保费对演化博弈结果的影响

设初始时间为0，保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略的概率初始值设定为［0.5，0.5，0.5］时，调整乘客惩罚性保费，系统演化的稳定情况及仿真结果如图5所示。

由图5 可知，增加乘客惩罚性保费或提高乘客违规成本，有助于达到预期演化结果。若乘客惩罚性保费低于乘客违纪潜在收益，则会导致乘客倾向于选择“违纪”策略，从而影响网约车运行的安全性。

图5 调整乘客惩罚性保费的演化结果

6.2.4 惩罚性保费动态变化时的演化结果

设初始时间为0，保险公司选择“监督”策略、网约车平台选择“监督”策略、乘客选择“守纪”策略的概率初始值设定为［0.5，0.5，0.5］时，将保险公司对网约车平台、乘客收取的惩罚性保费初始值设为0、步长设为500 进行演化。惩罚性保费动态变化时，系统演化的稳定情况及仿真结果如图6所示。

图6 惩罚性保费动态变化时的演化结果

经过不断循环，即惩罚性保费不断上升，可以看到惩罚性保费的调整对于三方博弈策略有着决定性作用。惩罚性保费的高低能够间接决定三方演化博弈的结果，影响三方的博弈策略选择。

7 结语

本文在分析网约车出行体系三方主体的基础上，通过建立保险公司、网约车平台和乘客之间的三方演化博弈体系，通过演化仿真在不同数值下的演化路径与稳定策略，结果表明：系统的稳定情况与初始策略人群占比无关，提升惩罚性保费、提高违规成本有利于推动结果向理想策略演化。本文还设计了一种协助保险公司调整惩罚性保费的算法，使得网约车监管得到保证的同时乘客采取守纪策略，能够改善网约车保险的缺失以及网约车难以监管的现状。

然而，由于考虑到政府罚金动态调整难度大、时间长等问题，本文并没有将改变政府罚金纳入考虑。另外，如果在三方演化博弈的基础上加入政府转换为四方演化博弈，将乘客不投保纳入考虑，将网约车保险金额和平台用户数量挂钩会使得情况更接近于现实，对于网约车保险这一领域的健康发展更具有现实意义。