APP下载

城市区域火灾事件分布规律及概率密度预测

2022-04-28高建勋苗建敏张鹏宇

西安科技大学学报 2022年2期
关键词:城区场所密度

马 砺,黄 霄,高建勋,苗建敏,张鹏宇

(1.西安科技大学 安全科学与工程学院,陕西 西安 710054;2.中化舟山危化品应急救援基地有限公司,浙江 舟山 316000)

0 引 言

城市火灾防范对于公共安全至关重要,掌握城市区域内火灾事件的分布规律对有效地防范城市火灾意义重大[1-2]。城市区域火灾发生概率受到众多因素影响,如人口密度、自然因素、交通通达性[3]等,同样,区域的功能性也会影响火灾发生概率,如商业服务较多的地区更易发生火灾。由于引起火灾的各个环境因素以及致灾条件都随着时间和空间发生变化,地理环境的不确定性也影响着火灾事件的时空分布。为了提高消防安全管理的有效性,需要分析城市区域火灾事件分布规律,为消防安全策略的制定及消防资源的有效配置提供依据[4-5]。

国内外研究人员从不同角度研究了城市区域火灾特点和防控方法[6]。1976年,美国的BERTRAND等学者研究了人口因素对城市火灾风险的影响[7];2007年,澳大利亚的CORCORAN等学者采用空间分析技术探索火灾事件的空间和时间动态,通过火灾的动态分析揭示了火灾时空集中的趋势[8];2010年,土耳其的NISANCI等学者对2005—2008年城市中心的火灾记录进行分析,发现GIS技术有助于确定消火栓的最佳分布位置,为城市消防安全管理提供支持[9]。国内对城市火灾的研究起步较晚,张晓祥等基于GIS研究了2002—2013年南京城市火灾的时空动态,从空间、时间和时空3个方面研究了占火灾总数50%左右的住宅火灾和设施火灾的变化,据此为防火规划的提前制定提供了依据[10];张玉涛等从发生时间及空间分布方面研究了2007—2016年间我国重特大火灾事故分布规律[11],发现了火灾发生频率最高的前3名场所分别为宾馆、加工厂以及商业建筑;董新明等采用火灾风险综合评价对山东省临沂市兰山区的建筑火灾风险进行了识别及评价,优化了消防力量配置[12]。通过以上分析可知,城市火灾研究有许多的理论和方法,针对城市区域规律的发展,火灾的时空分布规律还需要得到充分研究,在市域尺度上的城市火灾发生概率的建模非常少。因此,考虑到城市区域快速发展带来风险的不确定性及一旦发生火灾后果的严重性,研究城市区区域火灾分布规律及预测方法对城市火灾防控具有重要意义。

以西安市某城区为研究对象,分析2017—2019年间发生火灾空间分布规律,采用小波分析法研究火灾时间序列,利用核密度法对影响因素重要度较大的场所进行概率密度分析;基于随机森林机器学习算法对火灾易发程度进行预测。

1 区域火灾事件与研究方法

1.1 区域概况及火灾事件

选取西安市某城区为研究对象,该城区总面积为159.3 km2,包含5个街道办,35个社区,此外还有107个行政村。从陕西省消防力量云平台获取2017—2019年期间该城区内发生的879起火灾案件,数据属性包括火灾事件发生地址、火灾种类、接警时间及处理过程等信息。

区域火灾事件的发生受人口密度、道路通达性、等多种因素影响。本研究将研究区域的类别、人口、道路等因素相结合,同时为了预测该城区火灾发生概率,通过与文献的比较分析,选取500 m作为栅格网格的尺寸[13],并据此建立起所需的因素特征集。

人口密度分析:泰森多边形是利用调查期间所统计的居民点位置在ArcGIS 10.4中生成的,将该多边形与研究区作叠置分析[14]。运用VBA代码计算各个泰森多边形的面积后进行属性存贮,输入居民点人口总数并进行属性存储,然后除以相应多边形的面积即可得到以泰森多边形为边界的人口密度。通过叠置分析得到每个网格的人口密度信息,将人口密度矢量图转为栅格,并利用渔网点提取样本的人口密度值[13-14]。如图1所示,人口密度在空间上的分布呈渐变趋势,密度高的区域周边主要分布为较高密度区,中度密集区则分布在较高密度区周边。

图1 某区域人口密度Fig.1 Population density in an area

交通通达性分析:路网数据包含道路长度及类型等属性,是西安市该城区道路的线要素。如图2所示,通过奥维地图(Omap)提取道路数据,以道路线密度作为交通的通达性。

图2 城市区域道路密度Fig.2 Road density in a city

其他解释变量:依据前期现场调研,采用核密度法提取该城区火灾危险性较大的场所如老旧小区、工业产业园、城中村、高层小产权房以及工业产业园的栅格值,以此表征其空间分布;采用ArcMap中“近邻分析”工具获得火点分别与小型消防站及与一级普通消防站的最短路径距离。

1.2 研究方法

1.2.1 Morlet小波分析法

小波分析是利用一簇小波函数系表征或者逼近某一函数或是信号,在频域和时域上都有着良好的局部化功能[15],能够揭示出时间序列中各种隐藏的变化周期[16-17]。按火灾发生月份分别提取火灾频次,对于给定的小波函数Ψa,b(t),其连续小波变换为

(1)

将小波变换系数的平方值积分到b域中即可得到小波方差,即

(2)

小波方差与时间尺度a的对应关系称为小波方差图,表示信号振荡强弱随时间尺度a的分布规律。因此,火灾事件的主要时间尺度,即主周期,可以通过利用小波方差图中的数据峰值进行分析。

1.2.2 核密度分析法

核密度估计方法是分析任一地理事件发生在空间不同位置上的概率,将一维或多维的样本数据平滑处理成连续的核密度函数,其中一个关键参数是带宽,可控制生成的密度曲面的平滑度[18]。点稀疏表示区域事件发生概率低,点密集则表示区域事件发生概率高,区域内单位面积上的事件密度或强度可通过事件数目估计。本研究中采用的空间研究单元为500 m,搜索半径为1 000 m,带宽为1 000。核密度函数见式(3)

(3)

式中K为核函数;d为维度;h为平滑参数或带宽;n为数据样本点个数;Xi为第i个样本点,所以当d=2时,核密度函数的公式[19]即为

(4)

通过核密度分析法可以识别出内部不同位置的聚集强度差异性,研究火灾分布空间变化特性。

1.2.3 随机森林模型

随机森林(random forest,RF)模型用于分类及回归,可处理高维数据,并通过集成多棵决策树的方式来提高预测精度。模型具有预测准确率高、计算开销小、性能强大的优势[21]。样品和特征是随机森林模型构造过程中最重要的2个参数,可以采用Bootstrap重抽样的方法从命名为L的观测数据集中可以随机选取训练样本,具体计算见式(5)

(5)

式中T为决策树的数量,Yi,t,mean表示在第t棵树中第i个样本的预测值。同时,随机森林算法可根据得分情况对不同的特征变量进行重要性排序[22]。

(6)

为了验证模型的预测性能,采用平均绝对误差EMAE、均方根误差ERMSE和确定系数R23个参数作为预测模型的评价指标。

(7)

(8)

(9)

2 结果分析

2.1 区域火灾时空特性分析

2.1.1 区域火灾的空间分布

运用核密度法对2017—2019年西安市该城区火灾空间进行分析。图3为全部火灾点生成全局核密度图。从图3可以看出,绕城高速以东及西三环以西的地段是该城区的火灾多发地,火点在位于绕城高速以东的地段呈高度聚集状态,向郊区延伸过程中“热度”不断降低,且分散着零星的高发热点[23]。此区域居民区及工业场所居多,商铺及物流仓储均较密集,火灾风险更大。

图3 2017—2019年西安市某城区火灾密度空间分布Fig.3 Spatial distribution of fire density in an urban area of Xi’an from 2017 to 2019

2.1.2 区域火灾的时间分布格局

采用Matlab2019a中的Morlet小波分析研究该城区发生的火灾在多时间尺度上的周期性,图4显示了小波分析周期结果。

图4 小波分析周期结果Fig.4 Period results of wavelet analysis

从图4(a)可以看出,1~2 a,3~4 a,11~16 a是该城区月均火灾起数的3个周期变化规律。在时间尺度(11~16 a)上,小波系数实部等值线最密集,具有全域性且高低值变化规律明显。从图4(b)可以得到4个峰值,分别为14 a、9 a、6 a和3 a,分别对应着火灾频次变化的4个主周期。从图4(c)可得到,9 a时间尺度的小波变化实部曲线在分析区段内连续性更好,平均变化周期6个月。火灾频次在冬季和夏季较高,这主要由于夏季温度高,用电量大,电力设备易因超负荷运作而发生短路着火[24]。冬季天干物燥使得可燃物更易着火,用电及气用量受天气寒冷的影响增加,导致居民房屋内火灾隐患大。14 a时间尺度的小波变换实部曲线比较稳定,火灾频次变化的平均周期为10个月。由上述分析可知,该城区火灾发生量以第1主周期为主,第2、3、4主周期为辅,在不同时间尺度下的交替变化不同。

2.2 随机森林预测模型分析

随机森林预测模型以火灾密度做为因变量来表示火灾发生概率。结合调研的结果,从社会经济、人文地理等方面综合考虑选择了13个因素做为自变量进行评估[25],火灾风险评估指标见表1。因素包括火灾风险较大场所的核密度分布、人口密度、道路密度以及火点距消防站的距离等,其中火灾密度作为因变量。通过现场调研,该城区火灾危险性较大的场所及数量分别为:老旧小区53个、高层小产权房50个、城中村43个、餐饮娱乐场所649个、建筑工地56个、工业产业园61个、加油/加气/甲醇站41个、充电站33个等。文中将自变量与火灾发生概率进行建模,对城市区域火灾进行预测分析。所有的自变量和因变量均进行了标准化处理,模型选取整个样本的80%作为训练样本,20%作为验证样本。

表1 14个火灾风险评估指标Table 1 Fourteen assessment indicators of fire risk

2.2.1 随机森林算法参数的确定

节点值mtry和决策树的数量ntree作为随机森林预测模型中2个最重要的模型参数,共同决定模型计算效率以及预测精度。在实验过程中发现模型的均方根误差RMSE随着节点值mtry的增大先大幅降低而后基本保持平稳,在mtry取值为8时,RMSE最小,此后数值基本稳定,故在本模型中设置mtry参数值为8,按照上述方法优选出ntree为500。

2.2.2 影响因素重要度分析

区域火灾的发生受到多种因素影响,不同因素之间可能存在非线性关系,通过运用随机森林算法,可以直接显示出输入变量及输出变量间的对应关系。图5为影响因素的重要度排序,可以看出高层小产权房小区和老旧小区这2类场所的火灾密度对该城区火灾发生概率影响最大,其重要度之和为0.55,与实际情况相符。根据影响因素重要度的排序结果,优选前8个自变量参与到随机森林算法的建模。

图5 影响因素重要度排序Fig.5 Importance ranking of influencing factors

2.2.3 模型结果的检验

通过将随机森林模型在全样本上进行拟合,可以得到火灾密度的实际值与预测值之间的散点图分布情况。如图6(a)所示,当样本数量较小的时候(即散点的左下角部分),样本预测值与真实值较为分散;而随着样本数量的增加,其拟合效果越来越好。通过计算可得出随机森林预测模型的决定系数较高(R2为0.88),且平均绝对误差EMAE和均方根误差ERMSE分别为0.046 7和0.068,均保持在较低的水平,表明所的随机森林算法对于该城区火灾发生概率具有较高的预测能力。

为了进一步检验随机森林模型的预测效果,同时采用BP神经网络算法进行该城区的火灾密度进行预测,火灾密度的实际值与预测值之间的散点图情况如图6(b)所示。通过对比可看出,BP神经网络的预测表现总体上不如随机森林预测模型,样本的真实值与预测值的分布更为分散。表2列出了2个模型预测误差指标的计算结果,2个预测模型的决定系数R2超过0.75,且平均绝对误差EMAE和均方根误差ERMSE保持在较低的水平,BP神经网络模型相比随机森林模型的预测结果误差较大。

表2 火灾预测模型评价参数对比Table 2 Comparison of evaluation parameters of fire prediction models

图6 2种模型实际值与预测值散点Fig.6 Scatter plots of actual and predicted values of the two models

2.3 区域火灾概率分布

区域火灾事件是多种影响因子共同作用的结果,其具有一定的空间分布特征。核密度法可以被用来探索区域内各个火灾事件分布的热点区域和聚集情况,通过选定每个火灾事件发生的空间位置并分别设定一个核密度函数,提取每个场所内所有火灾事件的核函数并计算求出火灾概率密度平均值,便可用来掌握区域火灾事件发生的空间分布规律[19]。

根据前面运用随机森林算法得出的火灾发生因素重要度排序,针对重要度较大的场所分别做相应的核密度分析。如图7所示,为了进一步分析城市区域火灾的空间分布特点,对各场所核密度中心值进行提取并求出平均值,以此来反映各场所火灾发生概率的高低,分析结果见表3。通过分析该城区各场所火灾核密度值及分布图可知,研究区域在2017—2019年内老旧小区、高层小产权房小区、餐饮场所这3类场所火灾发生概率最大,同时对研究区域火灾发生率影响也最大,其概率密度平均值分别为303.15,245.89,105.3,这与对该城区现场调研结果也相互印证。

图7 各场所火灾概率密度预测Fig.7 Analysis of fire probability density in various places

表3 各场所火灾概率密度Table 3 Fire probability density in various places

3 结 论

1)结合ArcGIS分析可知,该城区在空间尺度呈现中心城区火灾“热度”高,向郊区延伸“热度”不断降低的空间分布规律;由Morlet小波分析周期结果可知,该城区火灾事件存在着3 a,6 a,9 a和14 a等较为明显的时间尺度。在14 a的特征尺度上,火灾频次变化的平均周期为10个月;在9 a的特征尺度上,火灾频次变化的平均周期为6个月,且在冬季和夏季较高,呈现季节性波动特征。

2)建立基于随机森林的西安市某城区火灾发生概率的预测模型,以火灾密度作为因变量、重要度排序前8的影响因素作为自变量,预测模型评价参数R2为0.88,且均方根误差ERMSE和平均绝对误差EMAE都保持在较低的水平。

3)利用ArcGIS对该城区火灾发生影响因素重要度较大的场所分别做核密度分析,概率密度值分别为:303.15,245.89,105.3,老旧小区、高层小产权房小区、餐饮场所这3类场所对区域火灾发生概率影响最大。

猜你喜欢

城区场所密度
长沙市望城区金地三千府幼儿园
新建城区消防安全管理体系的完善措施
广州市增城区松丁山遗址出土石器
2020年5月全市场发行情况(按托管场所)
2020年4 月全市场发行情况(按托管场所)
2019年12月全市场发行情况(按托管场所)
2019年11月全市场发行情况(按托管场所)
“密度”练习
密度的应用趣谈
密度的不变性与可变性