APP下载

基于人工神经网络模型的福建南平市滑坡危险性评价

2022-04-29陈水满赵辉龙李全悦

中国地质灾害与防治学报 2022年2期
关键词:危险性滑坡灾害

陈水满,赵辉龙,许 震,谢 伟,,刘 亮,李全悦

(1.福建省南平市公路局,福建 南平 353000;2.中国科学院海西研究院泉州装备制造研究所,福建 泉州 362000;3.上海华测导航技术股份有限公司,上海 201702)

0 引言

滑坡是岩石、泥土、岩土碎屑在重力、水或者其他工程活动作用下沿斜坡向下滑移、崩落或流动的一类地质灾害,其危害巨大、分布广泛,持续影响着区域社会经济发展和人民生命财产安全[1]。福建省是我国遭受滑坡灾害较严重的地区之一,仅2013—2017年间就发生1 334 次滑坡,造成数亿元的经济损失和数百人伤亡[2]。滑坡危险性评价是滑坡灾害风险评估的重要组成部分,能为防灾减灾和灾害治理提供参考依据和关键信息[3]。

滑坡危险性评价过程包括滑坡影响因子选择、研究单元划分、建立评价模型和模型评价等步骤,选取高效精确的模型对于评价结果具有至关重要的作用[4]。滑坡危险性评价方法主要包括历史滑坡分析法、启发式方法、基于岩土物理模型方法和基于统计模型方法[5]。基于统计模型的方法得益于其高效准确而被应用于大量工程项目与科学研究中,包括逻辑回归模型、支持向量机、贝叶斯方法、决策树方法与人工神经网络等[6−8]。

刘丽娜等[5]利用层次分析法对芦山地震区进行了滑坡危险性评价,分析了地震区滑坡影响因子,给出了研究区滑坡危险性分区图。王萌等[9]采用GIS 技术和贡献权重模型在米易县进行了滑坡危险性评估,实现滑坡危险性评价的科学化和信息化。Dehnavi等[10]提出了一种基于逐步权重评估比分析(SWARA)方法和自适应神经模糊推理系统(ANFTS)的新型混合模型应用于伊朗滑坡危险性评估中并拥有良好表现。Bourenane 等[11]分别使用层次分析法、频率比法、逻辑回归和证据权重法对康斯坦丁市进行了危险性评价和比较,结果表明频率比法在该研究中具有最优效果。随着计算机性能的进一步加强,人工神经网络模型对比其他简单模型具有更加优越的性能和广阔的应用前景,其在滑坡危险性评价中也有着较为突出的表现[12−14]。

福建省南平市滑坡灾害多发,一些学者对该地区的单体滑坡灾害进行了研究,认为该地区滑坡具有典型的东南沿海台风暴雨型滑坡特征[15−17]。然而,该地区区域性的滑坡危险性评价工作仍缺乏。本研究以南平市的历史滑坡灾害作为研究对象,收集多种滑坡影响因子,运用人工神经网络模型对该区域滑坡灾害危险性进行评估。

1 研究区概况与滑坡影响因子

1.1 研究区概况及滑坡数据

研究区南平市位于福建省北部,面积2.63 万km2(图1)。研究区地形地貌受构造运动的影响强烈,构造地貌特征相当明显,山脉多呈东北-西南走向。低山丘陵分布广,山间盆谷地沿河交替分布,山地切割明显,高差悬殊,以断裂为主的断块山山峰陡峭,断层崖、断裂谷等地貌分布广。研究区属典型的亚热带季风气候,年平均降雨量约为1 500~2 000 mm,降雨多集中在夏季。闽江、建溪、富屯溪是市内主要的水系。

研究区滑坡灾害点分布情况见图1(b),根据最新版2014年Varnes 滑坡分类体系共包含滑移、崩塌和泥石流3 种主要类型和多种次级类型[18]。其中,滑移1 008例,崩塌679 例,泥石流24 例,共计1 711 例。

图1 研究区地理位置及滑坡编目Fig.1 Location of study area and landslide inventory

1.2 滑坡影响因子

影响滑坡发生的因子众多,本研究共收集高程、坡度、坡向、曲率、地层岩性、土壤类型、降雨、水系、土地利用类型、公路和铁路等11 类因子(表1)。所有因子均离散为分类变量,其中,坡向因子根据方向分类,其余影响因子按照自然断点法进行分类(图2、图3)。

图2 滑坡影响因子专题图1Fig.2 Thematic map1 of landslide conditional factors

图3 滑坡影响因子专题图2Fig.3 Thematic map2 of landslide conditional factors

表1 滑坡致灾因子描述与来源Table 1 The description and source of landslide inducing factors

地形地貌对滑坡的形成具有重要控制作用。海拔的高低对于人类工程活动等影响有直接作用,从而影响边坡的危险程度;坡度是一种被广泛应用的滑坡危险性评价因子,其影响斜坡上失稳岩土体的稳定性和总体移动速率。通常,坡度越大的区域其势能越大,稳定性越差;坡向决定了光照和水的流向,不同的坡向其阳光照射时间与强度不同、水流方向也不同,这些影响导致了坡面植被生长和坡体稳定性;曲率是描述流域盆地的物理特征,它能够影响流动的加速和减速,汇聚和分散[19]。

地质构造与土壤属性是滑坡危险性评价中重要的影响因子,他们直接决定滑坡是否会发生,以何种形式发生,[20]。地层岩性和土壤属性是斜坡最重要的物理特征,通常决定了坡体的软硬性质、结构强度、松散程度等关键性质。从地层岩性上看,滑坡常发生于各种构造软弱结构面和较软弱的岩土层;从土壤属性看,较松散的土体和较大程度的土壤侵蚀有利于滑坡的孕育[21]。

水文条件通常是是滑坡发生的诱发因素和直接原因。研究区地处亚热带海洋性季风区,降雨多且集中,每年有数十例滑坡发生在雨季,持续的降雨能直接引发山体滑坡,也能侵蚀边坡为其失稳提供条件。因此,选择年平均降雨与河流作为影响因子。地表覆盖的不同对于滑坡的孕育也有着不同程度的影响。通常对于地表覆盖而言,裸露的坡地较植被茂盛的坡地更易发生失稳,根系发达的森林较草地则更稳定。

人类活动对于边坡的直接影响日益加大。大量的基础设施建设和道桥施工破坏了边坡原有的结构,山区铁路和公路的修建通常开挖隧道和人工切坡,公路、铁路沿线是滑坡发生的重灾区同时也是减灾防灾的重点区域[22]。因此,选择公路、铁路作为表征人类活动的因子。

2 研究方法

2.1 研究单元划分

目前,滑坡危险性评价常用的基本研究单元有:网格单元、地貌单元、行政单元、独立条件单元、斜坡单元等[23]。其中,网格单元和斜坡单元应用最广。网格单元十分规则,对于复杂模型的计算和模拟具有极好的适应性,在许多研究中得到了应用。因此,本研究选择网格单元作为基本评价单元。

网格单元大小的选取至关重要,太大难以表示局部区域的空间差异,太小则会影响计算效率,研究者通常选取在30 m~1 km。出于对研究区面积和计算效率的综合考虑,本研究选择300 m 正方形网格作为基本研究单元,总计得到374 666 个单元。分别计算落入每个单元的滑坡点数量,数量为0 的单元记为0,数量不为0 的单元记为1,以此形成滑坡在空间上的二元分布。该分布将成为危险性评价模型的因变量。然后计算各网格单元的影响因子的属性值作为模型的自变量。

2.2 因子相关性检测

多个滑坡影响因子之间可能存在相关性,相关性的存在会使得评价模型难以捕捉有用信息,从而影响评价结果。本研究使用Spearman 相关性分析对研究区各因子进行分析,通过相关性系数R衡量各因素的相关程度。因子的相关性检测由SPSS 软件计算,结果见表2。

Xiao 等[24−25]研究认为,因子间相关性系数∣R∣<0.5 表明因子间相关性较低。由表2 可知,各因子间相关性系数∣R∣<0.5,因此本研究保留全部11 项影响因子。

表2 因子间相关系数Table 2 Correlation coefficient of conditional factors

2.3 滑坡危险性评价模型

人工神经网络(Artificial Neural Networks,ANN)模型是一种优秀的机器学习模型,它既能够拟合线性关系也能够解决非线性问题,因而被广泛的应用于滑坡危险性评价和风险评估中[26−28]。

人工神经网络是由构成动物大脑的生物神经网络模糊启发的计算系统[29]。人工神经网络由被称为人工神经元的连接单元或节点组成,这些单元或节点可以对生物脑中的神经元进行松散建模。每个连接都像生物大脑中的突触一样,可以将信号传输到其他神经元。接收信号的人工神经元随后对其进行处理,并可以向与之相连的神经元发出信号。在许多实际应用场景中,人工神经网络通常被当作一种复杂的分类器,在本研究中亦是如此[12,30]。

在本研究中,使用多层感知器(Multilayer Perceptron,MLP)构建神经网络,其基本结构如图4所示,从左到右分别为输入层、隐藏层和输出层。将数据导入输入层,经过第一层神经元的计算得到输出,然后第一层的输出作为第二层的输入,依次运算直至到输出层,最终得到结果。本研究中使用Sigmoid 激活函数,自动计算单元格数、计算隐藏层层数与神经元个数,使用随机搜索确定模型参数值。同时,为防止过拟合,指定30%集合用于防止过拟合。

图4 神经网络基本结构Fig.4 The basic structure of ANN

本研究中,1 711 个滑坡灾害点分别落入1 653 个单元中,该1 653 个单元作为数据集中的正样本。以所有正样本几何中心300 m 外的区域为选择区域,选取等数量的单元作为负样本。因此,共计3 306 个样本用于模型的训练和测试,其中训练集和测试集数量比例各占50%。

2.4 模型评估和验证

2.4.1 混淆矩阵

混淆矩阵(confusion matrix)衡量的是一个分类器分类的准确程度,也称误差矩阵。混淆矩阵常被用于二分类模型的结果评价,该方法可以对模型结果中0 值预测的正确率和对1 值预测正确率以及整体预测率进行定量表达。本研究使用了sklearn.metrics.confusion_matrix计算混淆矩阵。

2.4.2 ROC 曲线

ROC( Receiver Operating Characteristic Curve)即“受试者工作特征曲线”,该曲线是反应敏感性和特异性变量的综合指标。在滑坡危险性评价中,ROC 曲线的X轴为特异性,表示非灾害点被错误预测的概率。Y轴为敏感性,代表灾害点预测成功率。模型预测精度用曲线与横坐标围成的面积的大小表示,曲线下面积为AUC(Area Under the Curve),AUC值的取值范围为[0,1]。AUC值越接近于1,表明模型的精确度越高。

3 结果分析

3.1 危险性评价结果分析

按照神经网络模型分析结果得到研究区滑坡危险性指数。其结果范围为0~1,使用自然间断法进行分区,分别为低危险区、较低危险区、中等危险区、较高危险区和高危险区。图5 为研究区滑坡危险性分区图。

图5 研究区滑坡危险性评价分区图Fig.5 Landslide risk assessment map

其中,低危险区占比15.96%,较低危险区63.78%,中等危险区为17.52%,较高危险区和高危险区总计占2.74%。全部滑坡点落入各级别危险区的数量和比例为:低危险区142 个,占比2.25%;较低危险区499 个,占比29.16%;中等危险区最多为802 个,占比46.87%;较高危险区和高危险区268 个,占比15.66%。

总体上看,研究区滑坡危险性分布主要特征为东北和西南高,中部低。其中延平区、浦城县发生滑坡灾害较多,区域地层岩性主要为古生界沉积岩和变质岩以及花岗岩,降雨均少于平均水平,说明研究区内降雨并非造成滑坡空间分布差异的主要原因。中等危险区分布较广,主要在研究区的东北和西南部。较低危险区和低危险区主要分布于建阳区和建瓯市。研究区内较低危险区和中等危险区分布最为广泛,这些地区往往发生过一些滑坡灾害,但远远没有达到较高危险程度。

3.2 模型精度评估和验证分析

为测试危险性评价模型的精度和可靠性,选用混淆矩阵和ROC 曲线对模型的预测正确率进行了验证分析。混淆矩阵的结果如表3所示,ROC 曲线和AUC值如图6所示,AUC值为ROC 曲线下面积。

图6 滑坡危险性评价模型ROC 曲线Fig.6 ROC curve of landslide risk assessment model

表3 混淆矩阵Table 3 Confusion matrix

混淆矩阵对结果中滑坡发生与不发生的精度进行了统计,最终准确度为84.91%,表明实际预测精度较高。而模型AUC值达到0.93,表明模型预测能力极好,精度较高。

4 结论与讨论

(1)本文基于GIS 和机器学习技术,应用神经网络模型对南平市进行滑坡危险性评价,并对评价结果进行检验。结果表明:预测准确率84.91%,ROC 曲线下面积AUC值为0.93,表明研究所使用的神经网络模型具有较好的预测性和精度。研究结果可进一步的为研究区防灾减灾与发展的选址问题上给决策者与工程师提供参考与建议。

(2)研究区危险性结果为东北和西南危险性高,中部低。延平区、浦城县是滑坡最危险的地区,中等危险区分布较广,主要在研究区的东北和西南部。较低危险区和低危险区主要分布于建阳区和建瓯市。南平市大部分地区属于丘陵山区,滑坡地质灾害危险性高,对于山区居民和公路等基础设施存在的严重的威胁。

(3)文中仍存在一些不足之处,例如神经网络模型采用了较常规的超参数设置,并未进一步深入,待以后的研究中改善和解决。

猜你喜欢

危险性滑坡灾害
河南郑州“7·20”特大暴雨灾害的警示及应对
2001~2016年香港滑坡与降雨的时序特征
危险性感
危险性感
一起汽车火灾调查与油品泄漏危险性分析
输气站场危险性分析
灾害肆虐
浅谈公路滑坡治理
“监管滑坡”比“渣土山”滑坡更可怕
多星联动紧急服务地震灾害监测