APP下载

常规公交风险的SEM与Bayesian Network组合评估方法研究*

2018-10-12陈相茹

交通信息与安全 2018年4期
关键词:公交事故变量

宗 芳 于 萍 吴 挺 陈相茹

(吉林大学交通学院 长春 130022)

0 引 言

公共交通作为一种承载量大、充分利用道路资源的交通方式,其安全评估受到社会的广泛关注,尤其是客运周转量较大的城市,对城市公共交通的运行安全有更高的要求。目前,国内外学者对城市常规公交的风险评估研究取得了一定进展。Mallia等[1]根据调查结果建立了结构方程模型,得出个性特征与异常的驾驶行为有着直接和间接的相关关系。Cafiso等[2]得出在常规公交系统的参与者中,搭载的乘客和公交周围的行人面临着相对高的安全隐患。Amadori和Bonino[3]通过对常规公交车站的调查研究得到使车站更安全的系列标准的措施。可以用来识别公交车站的安全性是否仍有提升空间,并给出了不同情况下的改进措施。南爱强[4]采用二级评价方法,根据西安市和昆明市的情况进行了城市公交安全模糊评价。但是对小型城市的情况并没有进行合理分析。彭明[5]通过研究公共交通的运营状况,分析影响运营的人、车、路、环境等因素,指出安全管理的疏忽是造成事故发生的最关键原因,并提出安全管理方面的具体措施和建议。但是其研究的适用性有待考察。在道路安全评估和其他城市客运方式[6-7]风险评估方面,也有学者做了一定的研究。贺文雅等[8]运用AHP法分析了影响高速公路风险驾驶行为的要素,发现换道频繁(变换车道行为)是高速公路上风险性最高的驾驶行为,并探讨了减少风险驾驶行为的安全对策。赵学刚[9]提出了城市道路交通安全综合风险实时分析评价的方法和技术,提出了基于最小欧氏距离判断法的新型交通安全综合风险评价方法,对敏感风险源可以实现定量评价[9]。

目前国内外对城市公交风险评估多采用层次分析法、模糊评价法[10]等,无法实现对风险的定量化评估。虽然贝叶斯网络模型可对交通事故风险进行评估[11-12],但贝叶斯网络模型无法标定指标间的双向影响关系,而风险指标间可能存在复杂的相关关系。另外目前的研究缺乏依据风险因素在对事故进行预测时的可信度测算,因此,笔者将采用可进行互相关分析的结构方程模型进行结构化建模,分析风险因素对常规公交事故的复杂影响关系,运用信息熵理论筛选可信度较高的风险因素,并结合贝叶斯网络模型的高精度参数学习[13]估计组合风险下的公交事故发生概率,从而全面、定量地估计常规公交事故发生的可能性,弥补现有研究在双向结构化分析、定量预测精度等方面存在的不足。

1 常规公交风险指标体系的建立

1.1 常规公交事故致因分析

对国内外554起常规公交发生碰撞、刮擦、翻车、失火、碾轧、爆炸、踩踏等7种事故类型进行总结。常规公交发生事故的主要原因有:驾驶员的各种违法行为[14]、道路线形差、交通参与者的安全意识淡薄、乘客是否携带易燃品或吸烟车厢内存在火灾隐患、不良天气、车内温度与车外温度等。

1.2 风险因子的分类提取

笔者从“人、车、路、环境”4个角度,对引起常规公交事故的风险源进行识别。

1) 人的因素。人是影响常规公交系统安全最活跃的因素[15-16]。常规公交车驾驶者、车内乘客、行人[17]等,他们在系统风险中所占比例不同,统计数据显示,常规公交驾驶者违法行为[18]是常规公交系统风险的主要原因。

2) 车辆因素。常规公交技术性能的好坏,是影响常规公交风险的重要因素。车辆制动失灵、灯光失效等,都是酿成交通事故的因素。据我国交通事故的统计资料表明,制动系和转向系故障是车辆因素造成事故的主要原因。

3) 道路因素。道路线性差,中央分隔带和路边两侧护拦设置较少,标志不规范,这些从客观上增加了道路交通伤亡事故的发生率。因此道路本身的技术等级、设施条件作为构成道路交通的基本要素,对交通安全的影响不容忽视。

4) 环境因素。 交通环境主要是指天气状况、噪声污染以及道路交通参与者之间的相互影响等。驾驶员行车的工作状况,不仅受道路条件的影响,还受到交通环境的影响。

1.3 常规公交风险评估指标

总结现有公交风险源[4-6,8],结合相关性分析,识别出与常规公交事故相关性参数显著性检验水平大于1%的风险评价指标,见表1。

表1 常规公交风险评估指标

2 常规公交风险评估模型

2.1 风险评估的结构方程结构学习

结构方程模型(structural equation modeling, SEM),整合了因素分析(factor analysis)与路径分析(path analysis),检验模型中包含的显性、潜在、干扰或误差变量间的关系,进而获得自变量与因变量间的关系[10]。SEM与贝叶斯网络模型相比,具有可以解析变量间互相关关系的优点,对于复杂的相关分析更为深入[19]。选取334条事故数据作为训练样本集进行模型标定。

由于各外部变量均可以被指标项直接表示,因此,只考虑外生变量和内生变量之间的路径关系,并不引入潜变量,SEM可以表述为

η=Bη+Γξ+ζ

(1)

式中:η为内生变量;ξ为外生变量;B为内生变量之间的关系;Γ为以直接随机效应矩阵表示的外生变量对内生变量的影响;外生变量对内生变量无法解释的部分称为残差项,以ζ表示。外生变量和内生变量特征见表2~3。

表2 外生变量特征

笔者采用最大似然法对模型进行标定,标定时经过相关性分析过滤掉影响程度较小的变量,得到常规公交风险评估的结构学习结果见图1,得到作为内生变量的刮擦事故对碰撞事故、失火事故对爆炸事故存在影响,且经标定,指标变量间的影响均为单向。

以关注度较高的失火事故为例,对事故风险进行结构学习,见图2。

图2 失火事故风险评估结构学习Fig.2 Structure learning of catching fire assessment

经过学习,发现共8个因素对失火产生影响。其中直接影响因素为:油气泄漏、车厢内是否存在火灾隐患、车内温度、车外温度、乘客是否携带易燃品或吸烟。

2.2 基于信息熵理论的风险因素预测权重值的计算

为了研究直接影响因素对常规公交事故的作用,需确定当利用直接影响因素进行事故风险预测时,各影响因素对预测可信度的贡献程度,即影响因素在事故风险预测中的权重。笔者利用信息熵理论进行事故预测中风险因素影响权重值的计算。熵作为物理概念,最早源于热力学,用于描述系统的无序状态。Shannon[20]于1948年提出信息熵的概念,用于反映系统的各个信息源信号出现的几率。

假设某系统X可能处于n种不同的状态xi(i=1,2,…,n),pi(i=1,2,…,n)代表状态xi出现的概率,则该系统的信息熵H(X)定义为

(2)

若用X表示某个变量,k表示事故的发生状态,pk表示不同事故发生状态中X取值为1发生的概率,即可根据式(2)计算出事故中此变量的信息熵H(X)。H(X)越小,表明不同事故发生状态中此变量发生的概率值越均匀,用此变量预测事故发生状态的可信度越高;相反,H(X)越大,表明用此变量预测事故发生状态的可信度越低。因此,利用信息熵可以表示此变量在该种事故态势预测中的可信程度,进而可以确定此变量在事故风险预测中的影响权重。

对于发生状态有m种的事故,选择n个变量uj(1≤j≤n)进行事故态势预测的变量可信度权重值的计算步骤如下。

步骤1。建立决策矩阵A=(aij)m×n,其中行变量i(1≤i≤m)表示事故的发生状态,列变量j(1≤j≤n)表示决策变量uj,aij表示在事故发生状态为i时,uj=1的概率。

(3)

步骤2。为了消除不同量纲对变量预测可信度的影响,对矩阵A做规范化运算,得到矩阵B=(bij)m×n,其中

(4)

步骤3。对矩阵B做列归一化运算,得到矩阵S=(sij)m×n,其中

(5)

步骤4。计算变量uj的信息熵。

(6)

步骤5。计算变量uj的权重值βj。

(7)

式中:βj满足β1+β2+…+βn=1。

对于失火事故,其直接影响因素的概率统计结果见表4,各因素的影响权重计算结果见表5。

表4 失火事故直接影响因素发生概率数据统计

表5 失火事故直接影响因素预测影响权重

由表5可知,在利用直接影响因素进行失火事故风险预测过程中,油气泄漏对事故预测可信度的影响权重最大,为0.676 0;其次为乘客是否携带易燃品或吸烟,权重值为0.203 2;是否存在火灾隐患的权重值最小,仅为0.009 3。

对各影响因素特征及其影响权重进行分析,可以发现,油气泄漏、车内温度、车外温度及乘客是否携带易燃品或吸烟均为显性变量,可通过检测器或简单的人工检查进行直观判断,但是否存在火灾隐患属于隐性变量,在实际事故数据获取时,无统一衡量标准;同时火灾隐患又与油气泄漏及乘客携带易燃品或吸烟存在交集,因此在实际的事故数据统计及事故风险预测中,此变量的数据记录值偏差较大,取值规范性差、准确度低,导致此变量在事故预测中影响权重很低。在事故预测时,可以将此变量剔除,利用油气泄漏、车内温度、车外温度及乘客是否携带易燃品或吸烟4个变量即可得到精度较高的预测结果。

2.3 风险评估的贝叶斯网络参数学习

由SEM的结构学习结果可知,常规公交风险指标和事故类型间的影响均为单向的,且由于结构方程模型在进行参数学习时不能得到组合风险下的事故发生概率,因此,采用贝叶斯网络模型进行参数学习。

贝叶斯网络是一个有向无环图,其结点代表随机变量,边代表随机变量间的条件依赖关系。它以概率论为基础,研究客观事物中多个变量(或多个因素)之间相互依赖的统计规律性,以图论的形式形象直观地表达随机变量之间的因果关联关系[21]。

参数学习是在给定网络拓扑结构下,确定各节点处的条件概率分布。贝叶斯参数学习法的基本思想是:给定一个含有未知参数的分布以及一个完整的实例数据集合。c和θ是一个随机变量,具有一个。参数θ的信息发生变化,表示为p(θ|c),称为参数θ的后验概率。贝叶斯参数学习的任务就是计算后验概率。

p(θ)取作Dirichlet分布

p(θ)=Dir(θ|α1,α2,…,αr)=

(8)

在剔除影响因素N7后,将结构学习结果带入GeNIe(Graphical Network Interface)软件中进行贝叶斯网络的参数学习。

在剩余4种直接影响因素的影响下,发生失火事故的概率见表6。

表6 失火事故情况参数学习结果

根据表6的标定结果,各变量对失火事故的影响可以总结如下。

1) 油气泄漏。在车内温度、车外温度、乘客是否携带易燃品或吸烟均不变的条件下,表6中的序号1和序号9这2组数据等参数学习结果表明,油气泄漏时发生失火事故的概率较大。

2) 车内温度。当油气泄漏、车外温度、乘客是否携带易燃品或吸烟这3个变量保持不变时,得到当车内温度较高≥50℃时,发生失火事故的概率较高。

3) 车外温度。当油气泄漏、车内温度、乘客是否携带易燃品或吸烟这3个变量保持不变时,发现当车外温度较高≥50℃时发生失火事故的概率较大,而在车外温度稳定在常温时发生事故的可能性较低。

4) 乘客是否携带易燃品或吸烟。当油气泄漏、车内温度、车外温度这3个变量保持不变时,在乘客是否携带易燃品或吸烟,存在较大的失火事故概率。

5) 在油气泄漏。车内外温度均较高、乘客是否携带易燃品或吸烟时,常规公交发生失火事故的概率高达0.842 9,而当油气瓶状态正常、车内外温度均正常或较低(车内温度<50℃且车外温度<0℃)、乘客没有携带易燃品或吸烟时,事故发生概率仅为0.002 1。因此,为了防止失火事故的发生,应重点防控上述风险源,降低事故发生概率。

2.4 风险评估结果验证

选取其余的220条数据作为检验集,对模型的预测结果进行检验,得到失火预测模型的最大绝对误差为0.013 6,平均绝对误差为0.004 6,最大相对误差为0.083 3,平均相对误差为0.015 2,模型命中率为99%。相比国内外常规公交的风险评估分析中缺乏精度检验的研究现状,本预测方法精度较高,可以更准确地估算事故发生风险,为防范常规公交事故提供决策支持。

3 结 论

1) 根据城市常规公交的事故数据和致因总结,从“人、车、路、环境”4个方面对常规公交风险源进行分析和整理,得到常规公交风险指标体系。

2) 建立结构方程模型,通过模型求解,选取出导致常规公交事故风险较大的相关因素,对风险指标与事故类型的影响关系进行结构学习,同时建立起不同事故类型的联系,得到指标变量间的结构化关联关系。

3) 基于信息熵理论计算风险指标对事故预测可信度的影响权重,通过权重值进行变量筛选,确定事故预测变量。

4) 利用贝叶斯网络模型和GeINe软件对结构学习得到的拓扑结果进行参数学习,以失火事故为例详述参数学习结果。得到在组合风险指标作用下,失火事故发生的概率范围为0.002 1~0.842 9。

猜你喜欢

公交事故变量
学中文
一元公交开进太行深处
抓住不变量解题
也谈分离变量
废弃泄漏事故
等公交
小恍惚 大事故
分离变量法:常见的通性通法
变中抓“不变量”等7则