APP下载

基于随机森林的地质灾害气象风险防御服务的研究

2023-03-04曹巧云潘奉乐刘素平

农业灾害研究 2023年1期
关键词:嘉禾县易发隐患

曹巧云,李 刘,周 璇,潘奉乐,张 龙,刘素平

1.郴州市气象局,湖南郴州 423000;2.嘉禾县气象局,湖南嘉禾 424500

在全球气候变暖的背景下,极端降水事件强度和频次加剧,滑坡、泥石流等地质灾害对人类和社会的影响已成为一个不可忽视的环境灾害,其危害程度仅次于地震。2021年,湖南省已查明各类地质灾害在册隐患点18 311处,威胁71.2万人,威胁财产299.2亿元。按照《湖南省地质灾害防治管理办法》,相关部门应加强降雨型地质灾害定时、定点精细化风险预警服务,全面提升地质灾害防灾减灾救灾能力,最大限度地避免或减轻地质灾害造成的人员伤亡和财产损失,科学防范地质灾害,减少人员伤亡和财产损失。

1 现状分析

2006年,陈建平[1]调查发现了地质灾害隐患点,划分了重点防治区域,还提出了全县地质灾害防治规划和重要地质灾害点防治预案建议稿,协助当地政府建立了群测群防网络。基于气象因子,结合GIS技术,利用随机森林模型,对研究区进行地质灾害易发性评价,为嘉禾县未来的地质灾害气象风险防御奠定基础。

2 基于随机森林的地质灾害气象风险防御研究

2.1 研究区域与研究数据

2.1.1 研究区域概况 嘉禾县隶属于郴州市,位于湖南省郴州市西南部,南岭北麓,舂陵水(钟水河)中上游。地处112°14′E~112°35′E,25°26′N~25°47′N。东部与郴州市桂阳县为邻,南部与郴州市临武县、永州市蓝山县接壤,西部与永州市宁远县相接,北部与永州市新田县交界。辖区土地总面积为699.33 km2,占郴州市总面积的3.61%、占湖南省总面积的0.3%,是湖南省地域面积最小的县。2020年末,辖珠泉、晋屏、塘村、袁家、龙潭、行廊、石桥、坦坪、广发9个镇,普满1个乡,共10个乡镇政区(图1)。

图1 研究区域及地质灾害隐患点分布

2.1.2 研究数据 在地质灾害的影响因素中,地形有着决定性的作用。提取地形的基本数据是数字高程模型(Digital Elevation Model,DEM)[2]。本次研究的因子有高程、坡度、坡向、剖面曲率。坡度是评价地质灾害的重要因子[3]。降水和太阳辐射受坡向影响大,植被、土地利用、土壤情况也受坡度影响,滑坡的发生与上述因子联系密切[4]。水流速造成土壤侵蚀和沉积,而剖面曲率影响着水的流速,说明水流速与滑坡有着密切的联系[5]。地质断层的构造断裂常常会影响低围岩的硬度[6]。植被覆盖对土壤侵蚀有着直接影响,也是评估生态环境质量的重要指标[7]。

本研究收集了嘉禾县地质灾害隐患点数据和与地质灾害相关的因子数据,包括地形地貌、距河流距离、地质构造、降雨等。地质灾害隐患点数据从嘉禾县自然资源局获取。DEM数据利用ASTER卫星的GDEM数据,空间分辨率为30 m,用于产生坡度、坡向、剖面曲率等数据。原始的地质资料数据通过中国科学院资源环境科学数据中心资源环境数据云平台下载获取。在OpenStreetMap下载嘉禾县河流数据,通过地理空间数据云平台下载2020年10月22日的Landsat8 OLI数据,进而得到NDVI数据。为了统一降雨数据的尺度,从NASA下载2020年的降雨数据。

2.2 基于随机森林的滑坡易发性的模型构建

2.2.1 样本数据选取与处理 滑坡样本与非滑坡样本组成了需要的样本数据。研究区共有34个滑坡点。研究表明,在进行易发性区划中,样本滑坡点与非滑坡点的比例在(1∶5)~(1∶10)之间构建的模型效果最好[8]。本研究选取比例为1∶5,通过随机抽样的方法抽取170个样本作为非滑坡样本数据。

2.2.2 模型建立与评价 采用R语言,逻辑回归模型通过glm()函数构建,随机森林模型通过randomForest()函数构建。为了减小袋外误差,通过循环迭代计算不同的随机特征数,误差越小,说明精度越高,模型预测越精准。

在混淆矩阵中,通过灵敏度曲线(Receiver-Operating Characteristic,ROC)和灵敏度曲线下的面积(Area Under Curve,AUC)来评价模型的效果[9]。模型通过对比灵敏度曲线下的面积来确定诊断的价值大小。当AUC=0.5时,诊断为无价值;当AUC=1时,诊断为最理想。本模型AUC=0.85,说明模型的判别效果非常好(图2)[10]。

图2 ROC曲线

2.2.3 结果分析 (1)模型识别。随机森林算法在滑坡预测方面应用广泛,基于随机森立建立地质灾害隐患点识别模型。在204个样本点中,191个样本点被正确分类,模型准确率为93.63%;在170个滑坡灾害隐患点中,被模型识别为滑坡的有168个,识别为非滑坡的有2个,召回率为70.59%;在模型识别的188个滑坡灾害隐患点中,实为滑坡的有168个,实为非滑坡的有20个,精确率为96%,模型识别OOB分数为0.813 6(表1)。

表1 基于随机森林算法的滑坡灾害隐患点识别混淆矩阵

(2)特征重要性分析。模型的解释度根据因子的重要程度来反映。本模型中因子的重要性见图3所示。重要性最高的因子是距河流距离,为41.46%;其次是坡度,为17.8%;植被覆盖率的重要性指数为8.64%;降雨的重要性指数为4.29%,影响性较小,但不能忽略。

图3 特征重要性排序

2.3 滑坡灾害易发性划分与日常服务

在ArcGIS软件中将嘉禾县分成2 524个格网,同时得到2 524个格网中心点,利用ArcGIS软件工具将因子数据提取至点,将数据导入已训练完成的随机森林模型,从而确定格网的地质灾害发生概率。根据GIS中的自然断点方法,对地质灾害易发性指数进行划分。将研究区地质灾害易发性区域划分为5级区域,包括较低易发区、低易发区、中易发区、高易发区和极高易发区(图4)。

图4 嘉禾县地质灾害易发性分布图

2022年以来,嘉禾县启动7次气象灾害Ⅳ级(暴雨)应急响应,一次气象灾害Ⅲ级(暴雨)应急响应,累计降水最多发生在5月22日00:00—23日18:00,过程降雨量累计92.2 mm,27个站点降雨量超过100 mm,其中最大降雨量出现在观音山水库(125 mm);最大小时雨强发生在6月4日08:00—5日08:00,广发镇邹山(38.4 mm)。

针对2022年汛期强对流强降水过程,结合地质灾害易发性分布图,在暴雨来临之前,气象部门通过手机短信、QQ、微信群发布针对性的地质灾害提醒信息;在暴雨来临之时,及时电话叫应服务,特别是行廊镇、袁家镇、坦坪镇、晋屏镇、珠泉镇;暴雨之后,结合地质灾害易发性分布图,对行廊镇、袁家镇、坦坪镇、晋屏镇、珠泉镇的乡镇负责人进行特别的电话警示,防范地质灾害的滞后性。将服务从县一级延伸至乡镇,甚至村一级,筑牢了气象防灾减灾的第一道防线。

3 结束语

通过分析地形地貌、地质条件、环境条件等因素,构建了研究区地质灾害易发性评价指标体系,研究了嘉禾县的地质灾害易发性,实现了气象防灾减灾服务从县延伸至乡镇、村的突破,并应用在2022年汛期服务中。但是此次研究依然存在不足之处:(1)因子的选取忽略了人类活动情况;(2)研究区域太小,容易出现耦合性;(3)地质灾害的易发性分布图属于离线版,倘若能够与雷达图、降水实况图相结合,气象服务将会更加精细化、更加精准。

猜你喜欢

嘉禾县易发隐患
隐患随手拍
隐患随手拍
互联网安全隐患知多少?
隐患随手拍
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
郴州市农村网络联校 全覆盖攻坚行动显成效
冬季鸡肠炎易发 科学防治有方法
申遗之后