APP下载

基于确定性系数与Logistic回归模型的地质灾害易发性评价

2019-03-05钟亩锋

世界有色金属 2019年23期
关键词:马山县易发确定性

钟亩锋

(广西地矿建设集团有限公司,广西 南宁 530023)

中国是世界上地质灾害发育最齐全的国家之一,发生的地质灾害以崩塌、滑坡和泥石流为主。据不完全统计,全国共发育较大型崩塌3000多处、滑坡2000多处,中小规模的崩塌、滑坡、泥石流多达数十万处。根据自然资源部最新统计数据,2018年全国共发生地质灾害2966起,造成105人死亡、7人失踪、73人受伤,直接经济损失14.7亿元。地质灾害已经成为造成人民生命财产损失的最重要因素,开展地质灾害易发性评价研究愈发迫切和重要。

地质灾害易发性评价是根据区域的地形地貌、地质背景、水文条件、人类活动、土地覆盖/利用等因素进行分析,对区域地质灾害发生的可能性进行评估和划分,为地质灾害预测、防治提供技术支持。目前,国内外学者常用的地质灾害易发性评价模型主要有:模糊综合评判法、层次分析法、信息量法、确定性系数法、人工神经网络等[1-5]。Schicker等[6]采用多元统计分析方法对区域灾害进行易发性分析并制图;Lee等[7]利用RS技术、GIS平台及其空间分析工具对韩国龙仁地区进行滑坡易发性评价研究;Floris M等[8]利用IFSAR数据进行滑坡易发性研究。国内学者彭珂等[9]利用信息量模型对赣州市地质灾害进行易发性分析;刘艳芳等[10]采用确定性系数方法研究秭归县滑坡易发情况;许冲等[11]利用GIS与确定性系数分析方法对汶川地震滑坡进行易发性评价。单一的评价模型不能客观确定评价因子权重,难以定量、准确地进行区域地质灾害易发性评价。

本文以广西马山县为例,选择统计学方法来进行地质灾害易发性评价,主要有三个步骤:①选取评价因子并分级,通过已知灾害点计算地质灾害评价因子分级指标对应的确定性系数值。②利用Logistic回归模型分析灾害点和非灾害点样本,计算各因子回归系数。③将各评价因子的确定性系数值和相关系数带入到Logistic回归模型,计算研究区所有单元格地质灾害发生的概率,以此来进行地质灾害易发性评价。

1 研究区概况

马山县位于广西壮族自治区中部,居红水河中段南岸、大明山西北麓。地理范围在东经107°41′~108°29′,北纬23°24′~24°2′之间,东接忻城、上林县,西接大化瑶族自治县、平果县,南与武鸣县为邻,北隔红水河与都安瑶族自治县相望,总面积2345 km2,如图1所示。马山县属于南亚热带湿润气候,夏季降雨量充沛,冬季较少。境内的河流主要属于红河水系与武鸣河水系。马山县地貌包括岩溶地貌和非岩溶地貌二大类,岩溶地貌分布面积占全区的72.1%,非岩溶地貌分布面积占全区的27.9%。马山县境内出露岩性以沉积岩为主,地层岩性由下到上依次为寒武系、泥盆系、石炭系、二叠系、三叠系和第四系。地质构造属于广西山字型构造前弧西翼的一部分,主要构造线呈西北——东南方向。境内已查明的地质灾害有崩塌、滑坡、危岩、地面塌陷和地裂缝,主要以崩塌和危岩为主,地质灾害规模多为小型、中型。

图1 马山县位置图

2 数据源

本研究所用到的样本分为地质灾害点数据和非地质灾害点数据。地质灾害点数据包括崩塌81处、滑坡3处、危岩28处、地面塌陷2处、地裂缝1处,共计115个地质灾害点。非地质灾害点数据是根据研究需求,利用ArcGIS随机生成的非地质灾害样本115个。除了样本数据以外,还包括地质灾害易发性评价因子的基础数据:数字高程模型(30m分辨率)、Landsat-8 OLI影像、马山县1:5万地质灾害详细调查工作部署图、马山县1:10万水文地质图、土地覆盖/利用和路网数据。其中,土地覆盖/利用是利用ArcGIS支持向量机监督分类得到的分类数据;路网数据是在BIGEMAP地图下载器下载获取的。

3 评价基本方法

3.1 Logistic回归模型

Logistic回归模型(Logistic Regression Model)是一种因变量满足二项分布的多元回归模型,通过建立多个自变量与一个因变量之间的多元回归关系,预测某一事件发生的概率。在对地质灾害进行易发性评价时,选取评价因子作为自变量,将灾害是否发生作为因变量,因变量取值为1和0,分别代表灾害发生与不发生。设为灾害发生的概率,为灾害不发生的概率。若用来拟合,的取值可能不在[0,1]范围内,因此采用odds函数对进行约束,odds函数为事件发生与事件不发生的比值,即,并取其自然对数作为因变量,建立线性回归方程:

利用公式(1)和(2)便可对灾害发生概率进行预测[12]。

3.2 确定性系数模型

确定性系数(Certainty Factor,CF)本质上是一个概率函数,由Shortliffe[13]提出,Heckrman[14]进行改进,为了把评价因子量化到以0为中心,变化区间在[-1,1]范围内,采用确定性系数对各评价灾因子进行量化。其计算公式如下:

式中:Pa为地质灾害在评价因子分类a中发生的条件概率,此处表示为评价因子分类a中发生的地质灾害个数(或面积)与评价因子分类a面积的比值;Ps为地质灾害在整个数据中发生的先验概率,此处表示为整个研究区内已发生的地质灾害个数(面积)与研究区域总面积的比值[15]。

公式(3)中CF的取值在[-1,1]之间,当CF取正值时,表示区域容易发生地质灾害;当CF取值为负值时,表示区域不易发生地质灾害。

3.3 确定性系数与逻辑回归模型结合

图2 评价方法流程图

用灾害点样本计算出每一个评价因子指标的确定性系数值,提取灾害点样本与非灾害点样本对应的每一个评价因子的确定性系数值,建立回归方程,计算逻辑回归常量α和每个评价因子的回归系数,计算出区域所有单元格的概率值,以此为依据进行地质灾害易发性评价。具体流程如图2所示。

4 评价因子选择与分级

马山县的地貌条件主要为岩溶地貌,致使马山县容易发生崩塌和形成崩塌隐患点。因此,马山县的地质灾害更多的是侧重研究崩塌,本文在进行马山县地质灾害易发性评价时,将不同的地质灾害类型合并统计分析。

根据收集的区域统计资料和实地现场踏勘,初步确定的马山县地质灾害评价因子有:地形地貌、地质背景、水文条件、人类活动、土地覆盖/利用等五类。具体细分,地形地貌分为高程、坡度、坡向,地质背景分为地层岩性、距断层距离,水文条件为地下水类型,人类活动用距道路距离来表示,以及土地覆盖/利用共8个因子,每个因子的分级指标如表1所示。

表1 地质灾害易发性评价因子分级指标和CF值

距道路距离(m) 4 0~300 0.17528 300~600 0.31997 600~900 -0.33452>900 -0.44896土地覆盖/利用 5水域 -1裸地 -1建设用地 -0.53957耕地 0.13601林地 0.01893

高程与地质灾害的发育无直接关系,但高程与人类活动和土地覆盖/利用密切相关,不同高程植被的发育类型不同,人类活动的强度也不一样,形成的土地覆盖/利用类型也完全不一样。坡度与产生崩塌、滑坡的势能、下滑力有关,也会确定灾害的影响范围。坡向不同,山坡受到的光照条件也不一样,南面朝向的为阳坡,北面朝向的为阴坡。光照条件会影响到植被发育、坡面水分蒸发量、风化程度等。斜坡岩土体的岩性影响着岩石强度、风化程度、节理裂隙发育、地下水类型等,是地质灾害发育的内在控制因素。地质构造活动会造成区域岩体破碎,节理裂隙发育,为加速岩体风化、降低岩土体强度提供了内地质营力。地下水沿裂隙面渗流,使岩土体粘合力降低,岩土体强度下降。地表河流对坡脚冲刷、侵蚀易使边坡失稳,水位上升会浸湿坡脚,坡岸岩土体稳定性降低。道路的分布反映人类活动频繁程度,道路密集说明该区域人类活动强烈。人类活动:修筑道路、人工切坡、工程爆破等都会增加区域发生地质灾害的可能性。土地覆盖/土地利用在一定程度可以反映区域植被类型、人类活动的情况。

5 地质灾害易发性评价

5.1 评价因子分析

通过收集准备的资料,将所有的因子图层矢量用统一的矢量范围进行裁剪,然后全部转化为栅格数据。同时,设置每个因子图层的栅格大小为30m×30m。根据115个灾害点在各个评价因子分级指标中的分布,结合公式(3)计算出每一个评价因子分级指标的确定性系数值,确定性系数值如表1所示。利用ArcGIS的多值提取到点,就可以得到每一个灾害点对应的评价因子分级指标的确定性系数值。

为了确保地质灾害易发性分析的合理性,要使因子之间保持相互独立。本文利用相关分析对8个因子进行独立性检验,各因子之间的相关系数如表2所示。从表2可以看出,高程与坡度、地层岩性、土地覆盖/利用的相关系数大于0.3,其余因子之间的相关性基本都小于0.3或只与某个因子相关性略偏高,综合考虑后去除高程因子,保留其余7个因子。

利用ArcGIS在研究区范围内随机生成115个非灾害点,与已知的115个灾害点一起作为地质灾害易发性评价的统计样本。将各个影响因子的确定性系数值作为自变量,是否发生地质灾害作为因变量(取0代表地质灾害不发生,1代表地质灾害发生)。把330个样本点导入到SPSS中进行二项逻辑回归分析,逻辑回归分析的分类表如表3所示,观测值与预测值一致的可能性为64.8%,说明了方程回归的可靠性为64.8%。回归系数(B)是在回归方程中表示自变量对因变量影响大小的参数,自变量回归系数的绝对值越大,自变量对因变量的影响也越大,回归分析结果如表4所示。因此,可以用评价因子回归系数(B)的绝对值来分析评价因子的易发性,从表4分析可以得出,断层、地下水、地层岩性、降雨对区域地质灾害发生的作用较大,其中断层的控制作用最显著。

表2 评价因子相关系数表

表3 分类表

5.2 模型分析

5.2.1 合理性分析

式中:x1为坡度分区的CF值;x2为坡向分区的CF值;x3为地层岩性分区的CF值;x4为距断层距离分区的CF值;x5为地下水分区的CF值;x6为距道路距离分区的CF值;x7为土地覆盖/利用分区的CF值。由公式(2)计算出所有单元格发生地质灾害的概率P,利用自然断点法将研究区分为了5级:极高易发区、高易发区、中易发区、低易发区和稳定区。结果如图3所示,图中颜色由绿到红易发程度逐渐增加。

表4 逻辑回归分析结果表

表5 地质灾害易发性分区统计表

经过计算得出:极高易发区占比10.48%,高易发区占比24.26%,中易发区占比27.84%,低易发区占比17.46%,稳定区占比19.96%。从地质灾害易发区空间分布上看,马山县易发生灾害的地区主要集中在东部和西部,不易发生灾害的地区主要集中在中部。将灾害点与易发性结果图叠加分析,获得不同程度的易发区灾害点分布情况,如表5所示。稳定区的灾害点占比最小,灾害点密度也远小于其他易发性分区。极高易发区灾害点虽然占比不大,但灾害点密度较大,灾害点密度最大的为高易发区。研究区易发性评价的结果基本符合灾害点分布的实际情况。

图3 地质灾害易发性分区

5.2.2 精度分析

易发性评价结果的有效性可以用受试者工作特征曲线(ROC)进行定性分析,AUC是曲线下方的面积,可以用来度量分类模型的好坏,AUC越接近1,模型的模拟值越接近于样本值。本文用ROC曲线和AUC值对耦合模型进行检验,ROC曲线的横轴表示易发性面积百分比累积量,纵轴表示灾害点面积百分比累积量,结果如图4所示。AUC的值为0.688,表明该方法能较为有效地对马山县地质灾害进行评价。

图4 ROC曲线和AUC值

6 结论

本文以广西壮族自治区南宁市马山县为例,计算高程、坡度、坡向、地层岩性等地质灾害影响因子的确定性系数,并结合逻辑回归模型计算单元格地质灾害发生的概率,在此基础上进行马山县地质灾害易发性评价,主要结论有:

(1)从计算得到的回归系数可以确定,马山县地质灾害受地下水、坡度、断层和岩性的影响比较显著。研究区地质灾害易发性评价结果表明,马山县地质灾害主要分布在碳酸盐岩裂隙溶洞水区域,离断层距离小于400m区域,二叠系、泥盆系碳酸盐岩区域。马山县地质灾害防治工作应该重点关注有断层经过的碳酸盐岩区域,这些区域是地质灾害详查的重点调查对象。

(2)基于耦合模型的易发性评价方法可以准确客观地计算出评价因子与发生地质灾害之间的确定性关系和各个因子的权重。利用GIS平台可以很好的解决不同数据转换、叠加分析的问题。精度分析中ROC曲线和AUC值用来检验耦合模型易发性评价的有效性,检验结果表明该方法可以较为准确的对马山县地质灾害进行评价。

本文选取的评价因子主要为一些符合区域灾害特点且容易获取的因子,还有一些其它方面重要的影响因子未被纳入其中分析,如降雨、地震烈度等。对研究区进行单元格划分时,还需要结合区域地质灾害的特点,确定更加合适的单元格大小。上述两个问题还需收集更多的数据,进行更加深入的研究。

猜你喜欢

马山县易发确定性
论中国训诂学与经典阐释的确定性
论法律解释的确定性
含混还是明证:梅洛-庞蒂论确定性
机用镍钛锉在乳磨牙根管治疗中的应用
贵州省地质灾害易发分区图
夏季羊易发疾病及防治方法
冬季鸡肠炎易发 科学防治有方法
教师夫妇带儿子跨省支教
推进义教均衡应有马山精神
法律确定性的统合理性根据与法治实施