APP下载

基于Agent网络化博弈的建模与分析

2022-01-28徐名海

计算机应用与软件 2022年1期
关键词:合谋汽车品牌网络化

章 超 徐名海

(南京邮电大学通信与信息工程学院 江苏 南京 210003)

0 引 言

近年来,随着我国市场化程度越来越高,同行企业间为争夺市场、扩大占有率采取各种营销策略。作为一种传统的市场营销策略,价格竞争策略在现代市场竞争中具有重要的作用。网络化博弈是一种研究市场价格竞争策略的重要方式,其在博弈理论中引入网络拓扑的概念。网络化博弈在社会网络、生物网络、信息网络与交易网络中都具有广泛的应用,从一个团队成员间的竞争合作博弈关系到国内运营商市场中电信、移动和联通三大品牌的博弈,汽车市场各品牌的价格竞争,甚至国家与国家间的博弈交涉,不同规模的网络都可以借助博弈论进行分析。

经典博弈论是用数学方法研究主体在特定环境和一定规则下如何选择策略和行动方案,如:Li等[1]运用纳什均衡理论研究高频通信系统中的信道分集问题;Zhang等[2]使用博弈论框架设计用于抑制主瓣中的欺骗性干扰的最佳发射极极化;Ding等[3]将博弈论方法应用于分析和调节复杂网络中节点的行为;Jing等[4]以伯特兰模型为基础,探讨港口物流企业间的价格竞争;Fu等[5]采用价格战博弈模型分析中国电信企业如何获得竞争优势等。但是经典博弈论存在三种缺陷:假设缺陷、方法缺陷和实证缺陷[6]。其中:假设缺陷[7]是指经典博弈论假设博弈参与个体是完全理性的,可以获得完全的信息,参与人还可以通过精确计算推理得到最优策略,然而现实中的参与人只具有有限理性;方法缺陷[8]是指经典博弈论关注如何求出博弈的均衡解,但不能解释博弈的参与者是如何达到均衡的,这就忽略了博弈的过程;实证缺陷是指经典博弈论基于理想的假设和精确的数学推导,现实中的实验却发现博弈并非按照人们预期方向发展[9]。

演化博弈论[10]是结合博弈论和动态演化过程分析发展起来的一种理论,研究有限理性个体在一个动态过程中如何随时间演化在重复博弈中自适应地学习,选择最优策略以最大化自身利益的问题。网络化博弈主要在演化博弈理论中引入网络拓扑的概念,其研究途径可以归结为两方面:(1)从个体出发,研究群体层面的策略选择机制;(2)从群体需求出发,研究个体层面的干预调控机制[11]。为了剖析个体层次的行为规则与群体层次的涌现行为之间的复杂关系,国内外许多学者做了深入研究。Nowak等[11]首先将空间结构引入囚徒困境,研究二维方格子上的重复囚徒困境博弈;Szabo等[12-13]则在方格格子上的简化囚徒困境基础上,使用蒙特卡罗仿真和动态聚类技术研究稳态下合作者的密度;Vukov等[14]研究平均度为4的两种正则格子上的囚徒困境,发现收益和噪声(温度)对维持合作具有影响,当改变噪声水平和(或)最高收益时,系统表现出从合作者和叛逃者的混合状态到仅叛逃者活着的吸收状态的二阶相变;Wang等[15]考虑到个体的决策过程与记忆经验密切相关,提出一种基于记忆的雪堆博弈模型;Hauert等[16]研究随机正则小世界网络上的囚徒困境博弈行为,研究发现拓扑随机化有利于合作的涌现,与方格格子相比,合作者更容易在随机网络上结成大的合作簇,促进合作行为在随机网络上的涌现;Santos等[17-19]研究无标度网络上的两人两策略博弈行为,通过与全耦合网络和随机网络上的两人两策略博弈行为比较发现,不论是囚徒困境博弈,还是雪堆博弈或者猎鹿博弈,BA无标度网络都能极大地促进合作行为的涌现;翟丹妮等[20]通过构建移动通信产业产学研合作网络,建立网络演化博弈模型;徐建中等[21]研究无标度网络上的企业低碳创新合作行为的网络演化机理;张宏娟等[22]基于复杂网络演化博弈对传统产业集群低碳演化模型进行了研究。总体而言,目前绝大多数网络化博弈研究主要存在四个问题:(1)网络拓扑局限于规则网络(方格格子、Kagome格子和四点派系正则格子等)、小世界网络或者无标度网络;(2)缺少考虑博弈个体之间的竞争激烈程度的不同,博弈个体之间的差异化会导致竞争强弱不同;(3)博弈模型缺乏实际性,如博弈模型中没有考虑环境背景等在实际社会中会对博弈参与者决策带来重要影响的因素;(4)网络化博弈建模方式欠佳,网络化博弈是一种自下而上的科学范式,它通过对个体的行为规则、个体之间的交互方式和结构进行建模,对动态变化的复杂系统适宜采用基于Agent的建模方式。

本文针对上述问题,选取南京地区汽车品牌市场为应用场景,提出一种基于Agent的网络化博弈建模方式,构建符合现实的复杂网络拓扑结构,在网络拓扑中引入“强竞争”和“弱竞争”的概念,建立博弈模型。

1 应用场景及需求分析

考虑到汽车品牌市场的复杂性,本文以南京地区汽车品牌市场为应用场景,车型只选择中大型车,并基于价格设定汽车品牌为四档,分别记为超豪华系列(如宾利)、一线豪华系列(如宝马5系)、二线豪华系列(如凯迪拉克CT6)和普通高端系列(如大众帕萨特)。

实际经济活动中,许多因素都会影响到汽车品牌间的价格竞争。如消费者生活地区的经济水平、地理位置、政策形势等环境背景因素,消费者品牌忠诚度因素,汽车品牌的合谋、车型属于家用车还是商务车、汽车品牌的宣传力度、售后服务和科研投入等汽车品牌本身因素。

应用场景如图1所示,每个小车代表一种汽车品牌,汽车品牌分为四档,消费者地区以南京为例。

图1 应用场景

本文研究南京汽车市场的网络化博弈建模,需要构建网络拓扑结构,针对汽车品牌之间的竞争关系链路建模,并结合影响汽车品牌价格竞争因素建立博弈模型。考虑到影响汽车品牌价格竞争的因素较多,为简化分析,在后续的网络化博弈模型中,假设南京地区消费者用户均为价格敏感用户,汽车品牌本身因素只考虑汽车品牌的合谋,环境背景因素不予考虑。

2 网络化博弈模型

网络化博弈理论首先由Nowak等提出,网络结构、博弈模型和策略更新规则是网络化博弈的三个要素[23]。

2.1 网络结构建模

图论是一种有效的构建网络的方式,根据图论构建网络G=(V,E),其中:V表示网络中节点的集合;E表示所有边的集合。因此,本文基于南京地区汽车品牌的销售情况,构建汽车品牌间的价格竞争网络。具体来说,V为汽车品牌的集合,eij∈E表示品牌i和品牌j之间存在竞争关系。用邻接矩阵A=[aij]来描述汽车品牌间的价格竞争网络,aij表示品牌j对品牌i的竞争程度(aij不一定等于aji),其中aij用式(1)来表示。

(1)

网络结构如图2所示,其中每个节点代表一种汽车品牌,不同的灰度表示汽车品牌所属的档次不同,节点间的边粗细表示竞争关系的强弱aij。

图2 网络结构

2.2 链路建模——“强竞争”和“弱竞争”概念

关于汽车品牌竞争关系的强弱,考虑到不同档品牌面向消费者用户不同,产品差异化程度不同,不能片面地用销量来分析,本节从同档次不同品牌间的竞争和不同档次不同品牌间的竞争两个方面分析。

(1)同档次不同品牌。同档次不同品牌间的竞争强弱是不同的,在60个汽车品牌近10个月南京市销量(数据来源:e易车、车主之家)的基础上运用Pearson系数来划分竞争强弱关系,计算式表示为:

(2)

(2)不同档次不同品牌。不同档次不同品牌间的竞争强弱也是不同的,以两档品牌平均价格差为基础,划分到不同的竞争段,得出不同档次品牌间的竞争关系。竞争关系的权值如表1所示。

表1 竞争关系

2.3 博弈模型

2.3.1模型基本假设

假设1:假设有限理性。有限理性意味着各博弈方在策略选择的过程中,并不是一开始就能找到最优策略,而是通过在博弈中不断学习、更新进而找到较优策略。

假设2:假设主体在选择博弈对手进行博弈时,将博弈范围r限定在邻域内,博弈半径r=1。实际网络中各品牌由于成本等条件限制,无法与网络中其余所有品牌进行比较,因此假设博弈半径r=1更符合实际情况。

假设3:假设所有品牌只有不降价和降价两种策略,并采用同一策略更新规则。汽车品牌降价可以看成汽车品牌不合谋,而汽车品牌不降低价格可以看作汽车品牌合谋(合谋:企业协调相互竞争关系以使利润最大化)。

假设4:假设市场上有两个差异化品牌i和j,品牌的差异程度可以用交叉价格弹性Eji来衡量[24]。Eji表示品牌j价格变化对品牌i需求量变化的影响,Eji的计算式为:

(3)

式中:Qi、Qj为品牌i、j的市场需求量;Pi、Pj分别是品牌i、j的价格。为便于分析,本文构造品牌i和j的需求函数:

Qi=Qi(Pi,Pj)=a-aijPi+Pj

(4)

Qj=Qj(Pi,Pj)=a-ajiPj+Pi

(5)

式中:aij为品牌j对品牌i的竞争强弱程度;市场需求总量a为常数。假定品牌i、j的边际成本为MCi=MCj=c(a>c),则品牌i、j利润为:

πi=(Pi-MCi)Qi=(Pi-c)(a-aijPi+Pj)

(6)

πj=(Pj-MCj)Qj=(Pj-c)(a-ajiPj+Pi)

(7)

假设5:假设品牌i、j合谋时产生的附加收益Lij(MCi+MCj)。Lij指利益分配系数,表示品牌i分配利益占i、j合谋产生附加利益的比,同理Lji指品牌j分配利益占i、j合谋产生附加利益的比。

假设6:假设品牌i、j合谋时,一方背叛合谋会受到惩罚δi=δ(MCi+MCj)以及收益ηi=η(MCi+MCj),其中:δ、η分别记作违约惩罚系数和背叛收益系数。当品牌i、j不合谋时,不存在违约惩罚和背叛收益,即δi=0、ηi=0。

2.3.2支付矩阵及收益函数

表2 收益矩阵

(8)

Ti=(Pi-MCi)Qi-δi+ηi=

(Pi-c)(a-aijPi+Pj)-(δ-η)2c

(9)

Si=(Pi-MCi)Qi-ηi+δi=

(Pi-c)(a-aijPi+Pj)+(δ-η)2c

(10)

Ri=(Pi-MCi)Qi+Lij(MCi+MCj)=

(Pi-c)(a-aijPi+Pj)+Lij2c

(11)

假设在博弈初始阶段只有汽车品牌i和汽车品牌j,品牌i选择不降价(合谋)的概率为x,选择降价(不合谋)的概率为1-x,品牌j选择不降价的概率为y,选择降价的概率为1-y。x和y是时间t的函数,根据收益矩阵可知:

品牌i采取合谋(不降价)时的收益为:

Uij1=yRi+(1-y)Si=y[(Pi-MCi)Qi+Lij(MCi+

MCj)]+(1-y)[(Pi-MCi)Qi-ηi+δi]=

(Pi-c)(a-aijPi+Pj)+yLij2c-

(1-y)(η-δ)2c

(12)

品牌i采取不合谋(降价)时的收益为:

Uij2=yTi+(1-y)Pi=y[(Pi-MCi)Qi-δi+ηi]+

(1-y)(Pi-MCi)Qi=

(Pi-c)(a-aijPi+Pj)-(δ-η)2c

(13)

则品牌i以x概率不降价,1-x概率降价的平均收益为:

Uij=xUij1+(1-x)Uij2=(Pi-c)(a-aijPi+Pj)+

xyLij2c+(η-δ)2c(xy+1-2x)

(14)

同理品牌j以y概率不降价、以1-y概率降价时的平均收益为:

Uji=yUji1+(1-y)Uji2=(Pj-c)(a-ajiPj+Pi)+

xyLji2c+(η-δ)2c(xy+1-2y)

(15)

通过上述收益函数,可得到复制动态方程[25]:

x(1-x)[yLij2c-(2-y)(η-δ)2c]

(16)

y(1-y)[xLji2c-(2-x)(η-δ)2c]

(17)

将式(16)和式(17)联立,可以得到汽车品牌i、j的复杂动力系统为:

(18)

令F(x)=F(y)=0,可以得到局部稳定点为E1(0,0)、E2(0,1)、E3(1,0)、E4(1,1)。

2.3.3策略更新规则

大多数学者在分析复杂网络中个体的博弈行为时指出,在网络演化的过程中,节点的效用和收益是非常重要的指标。因此,本文研究汽车品牌在复杂网络中的个体行为时,仍将节点的收益作为重要的衡量指标。

网络中任意汽车品牌节点的策略更新规则:

(1)每一时刻汽车品牌个体与其所有邻居节点进行博弈,每次博弈作为一个博弈周期;一次博弈完成后,计算当期收益Ui(t)。

(19)

式中:Uij为节点i和节点j博弈后所获得的当期收益;θi为节点i的邻居节点,θi数值的大小等于节点i的度ki。

(2)费米规则。在每一轮博弈中,节点i以当期收益Ui(t)为基准,随机选择一个邻居j进行收益的比较;下一轮中i采取j本轮策略的概率根据统计物理中的费米函数计算[14]:

(20)

式中:si(t)、sj(t)分别表示i、j本轮采取的策略;κ指环境的噪声因素,反映了节点在策略更新时的不确定性;当κ→0时,意味着策略的更新是确定性的,节点i的非理性选择趋近于0,相反,当κ→∞时,意味着节点处于噪声环境中,无法做出理性决策,只能随机更新自己的策略。

3 实验与结果分析

本文的实验目的是对所构建的网络化博弈模型进行验证和分析,可以分为以下两点:(1)分析模型的精度,并与其他方法进行对比,验证网络化博弈模型的可行性和优越性;(2)对影响模型的部分因素进行数值分析。

3.1 实验平台与参数设置

网络化博弈是一种自下而上的科学范式,它对个体的行为规则、个体之间的交互方式和结构进行建模。因此本文采用基于Agent建模方法ABM(Agent Based Modeling),并将NetLogo作为实验平台。

本文首先对南京地区汽车品牌市场的价格竞争进行抽象,构建网络拓扑结构。通过数据调研搜集,可以获得以上模型的数据,为便于分析,参数设定如表3所示。

3.2 结果分析

3.2.1模型精度分析

为验证基于Agent的网络化博弈模型与现实汽车品牌价格竞争的符合程度并计算误差,本文以奥迪A6L为例,统计了其在近十个月份的实测市场价格,并与基于Agent的网络化博弈模型的仿真结果进行对比,结果如图3所示。

图3 1月至10月网络化博弈仿真价格与实测价格对比

可以看出,基于Agent的网络化博弈模型在1月至10月仿真价格与实测价格非常相似。为更直观地表示相似情况,用范数平均相对误差NMRE公式(式(21)),求出基于Agent的网络化博弈模型仿真价格与实测价格的NMRE为2.11%。

(21)

为体现基于Agent网络化博弈模型相比于其他方法的优越性,本文与改进前的规则网络(方格子网络)博弈以及不考虑竞争强弱的网络化博弈进行对比。仿真价格与实测市场价格的范数平均相对误差如表4所示。

表4 多种模型仿真价格与实测价格相对误差对比

除此之外,基于Agent网络化博弈相对于改进前的两种博弈更贴近现实市场。

图4(a)、(b)和(c)分别是三种模型仿真价格演化曲线与实际价格演化曲线的对比,图4(d)是前三幅图的汇总,包含4种模型价格演化曲线的对比。

(a) (b)

综上所述,本文提出的基于Agent的网络化博弈模型误差小,更贴合于实际汽车品牌市场的价格竞争,具有有效性、高精度性。

3.2.2影响因素数值分析

数值分析如图5所示。

(a)参与意愿x、y同时变化的演化结果 (b)参与意愿x变化的演化结果

(1)初始意愿对演化关系的影响。图5(a)是在其他参数不变的情况下(控制变量法,下同),品牌i、j参与合谋的初始意愿变化对演化关系的影响,违约惩罚力度δ=3,背叛收益系数η=5,其中:横坐标t指博弈次数;纵坐标p指品牌参与合谋的意愿的概率。假设品牌i、j的参与合谋的初始意愿相同,即x=y,由图5(a)可知,当初始意愿x、y大于零时,x、y均收敛于1,最终平衡点趋向于(1,1)。当初始意愿x、y都等于零时,x、y均收敛于0,最终平衡点趋向于(0,0)。初始意愿x、y越大,收敛速度越快;初始意愿x、y相等时,品牌i收敛速度大于品牌j的收敛速度。图5(b)是在其他参数不变的情况下,品牌i参与合谋的初始意愿变化对品牌j参与合谋策略的影响。由图5(b)可知,初始意愿x、y均大于零,收敛于1,最终趋向于平衡点(1,1)。初始意愿x的增大,会加快y的收敛速度。这说明品牌i参与合谋的初始意愿越高,越会促进品牌j参与合谋。图5(c)是在其他参数不变的情况下,品牌j参与合谋的初始意愿变化对品牌i参与合谋策略的影响。

(2)违约惩罚力度对演化关系的影响。图5(d)、(e)是在其他参数不变的情况下,违约惩罚力度δ变化对品牌i、j参与合谋策略演化的影响,初始意愿x=y=0.5,背叛收益系数η恒为5。可以看出违约惩罚力度δ的临界值在3~4之间。当δ小于该临界值时,x、y收敛于0,最终平衡点趋向于(0,0),此时δ的增加使x、y的收敛速度减慢,δ相同时利益分配系数大的品牌收敛速度小于利益分配系数小的品牌。当δ大于临界值时,x、y收敛于1,最终平衡点趋向于(1,1),此时δ的增加使x、y的收敛速度加快,δ相同时利益分配系数大的品牌收敛速度大于利益分配系数小的品牌。这是因为当δ小于临界值时,违约惩罚力度小于背叛收益,品牌不合谋可以获得更多的收益,说明了增大违约惩罚力度δ可以促进品牌的合作合谋。

(3)利益分配系数对演化关系的影响。图5(f)是在其他参数不变的情况下,利益分配系数变化对品牌i、j参与合谋策略演化的影响,初始意愿x=y=0.5,违约惩罚力度δ=3,背叛收益系数η=5。可以看出利益分配系数越大,对应x或y收敛速度越快,最终趋于平衡于(1,1)。这说明利益分配系数大的品牌倾向于合谋,通过合谋获得更大的收益。

综上所述,汽车品牌间的价格竞争对违约惩罚力度δ最为敏感,对利益分配系数Lij和参与合谋初始意愿x、y敏感次之。增大违约惩罚力度δ可以有效促进品牌间的合作合谋行为,实现利益更大化;利益分配系数和参与合谋初始意愿越高,汽车品牌越倾向于参与合谋。

4 结 语

本文提出一种基于Agent的网络化博弈建模方式。在建模过程中,以南京地区汽车品牌间价格竞争现象为应用场景,将汽车品牌看作Agent个体。接着基于现实网络复杂结构特征,引入“强竞争”、“弱竞争”概念,并结合地区经济水平背景因素,运用演化博弈理论研究有限理性下汽车品牌价格竞争行为。最后,以NetLogo软件进行仿真实验,与汽车品牌市场实测价格数据和传统网络化博弈模型对比,验证了本文提出模型的有效性和高精度,并通过MATLAB软件对影响价格竞争的部分因素进行数值分析。分析结果表明,违约惩罚力度δ对汽车品牌间的价格竞争影响最为显著,利益分配系数Lij和参与合谋初始意愿次之。这些分析结论对指导汽车品牌间价格竞争的竞合关系具有一定的理论和实践价值。

本文存在一定的局限性,例如,选取汽车品牌数目有限,会使网络中汽车节点中心性与现实存在偏差,从而导致网络拓扑结构偏差较大。除此之外,本文对汽车品牌竞争关系强弱的划分较粗糙,这会造成网络拓扑结构的偏差。消费者生活地区地理位置、政策形势等环境背景因素,消费者品牌忠诚度因素,汽车品牌的宣传力度、售后服务和科研投入等汽车品牌本身因素等均会对价格竞争带来影响,致使博弈模型不同。这些不足有待今后研究改进。

猜你喜欢

合谋汽车品牌网络化
职业院校财务会计网络化建设
网络化运营条件下地铁车辆架、大修的管理研究
地铁网络化运营乘客信息需求阐述
建立和管理汽车品牌铁杆粉丝策略研究
纵向差异产品下价格领导制对默契合谋的影响
我国自主品牌汽车的市场营销策略研究
汽车品牌的互联网+营销实战研究
新闻业经营管理的网络化思维
基于计算实验的大型工程合谋治理机制研究
可以打电话的汽车品牌