APP下载

基于机器学习的地质环境承载力评价方法

2019-10-14

福建质量管理 2019年18期
关键词:信息熵决策树承载力

(成都理工大学管理科学学院 四川 成都 610059)

一、引言

自然环境是人类社会活动的基本载体,其中与地质环境的关系尤为密切。虽然很多学者都提出了地质环境承载力的概念、研究对象和研究内容,但是能够很好地将区域环境系统和区域社会经济活动的方向、规模相结合的环境承载力理论体系的研究还很少见到报道。大数据技术的发展,一方面促进了数据采集技术的更新,另一方面也促使着地质环境承载力方法的进步,尤其是人工智能技术应用,彻底改变了传统的评价方法。本文引入机器学习方法,以地质环境承载力的评价理论为基础,提出了基于机器学习算法的地质环境承载力评价方法。通过梳理国内外地质环境评价相关成果,分析地质环境的各种评价要素,提炼出影响地质环境承载力的主控因素,在此基础上建立适合于机器学习的地质环境承载力评价指标体系,再结合机器学习方法,构建基于机器学习算法的地质环境承载力评价模型,对区域地质环境承载力进行评价,为其他区域的地质环境承载力评价提供应用示范和评价方法。

二、基于机器学习的地质环境承载力评价思路

机器学习是一门多领域交叉学科,涉及数学、统计学、计算机等相关知识,机器学习算法包含的算法比较多,例如深度学习算法,人工智能算法,回归算法,决策树算法,贝叶斯算法,聚类算法等都属于机器学习算法。针对地质环境承载力评价,采用决策树算法来进行地质环境承载力评价,决策树算法是属于有监督学习的分类,通过将不同数据源汇集到一起,建立相关的数据池,对已知分类的数据进行机器学习,训练出相关模型。通过研究地质环境承载力评价和机器学习的相关文献,提炼相关评价方法;多渠道(包括野外)收集地质环境等相关资料,系统整理地质环境评价信息,在此基础上分析影响地质环境的主控因素,并进行指标分级,构建地质环境承载力综合评价指标体系;抽取相关地质环境历史数据,进行机器学习,生成地质环境承载力评价的规则库,构建地质环境承载力评价的机器学习模型,再通过模型对评价数据进行评价,得到评价结果。

三、机器学习 ID3评价算法流程

ID3算法的生成模型根据导入的样本数据,按照80%的样本比例作为训练集,依据ID3决策树算法原理,根据训练集生成ID3决策树的具体流程如下:(1)首选选择系统熵(经验熵)最大的属性作为最优属性进行分裂,创建根节点,为分支节点分配相应类别,遍历训练集一次;(2)如果训练集均属于同一类别或者训练集中只剩下一个样本,返回子节点,并将其作为叶节点,同时判定相应类别;(3)对训练集循环执行每个属性划分,计算该属性划分的信息熵,比较各个属性的信息熵,选择信息熵最大的属性作为分支节点进行分裂,同时训练集分裂为两个子集;(4)对训练集划分的子集反复执行步骤(1)-(3),直到信息熵为0,所有分支节点为一类时,标为叶节点,输出分类结果。

根据以上流程,生成的ID3算法模型如下:

四、评价结果解释

根据构建的地质环境承载能力综合评价体系为理论基础,基于收集的乐山市地质环境方面的资料数据,对乐山市划分出的34个自然单元的地质环境承载能力,采用决策树方法进行了评价,得到了34个自然单元地质环境承载能力的综合值,并依据评价综合值将区域内的承载能力分为承载能力高(I)、承载能力中(II)和承载能力低(III)等三类。

根据乐山市地质环境承载能力综合评价结果,可得到如下结论:综合分析眉山市国土的空间特征、资源特征、环境特征,以及地质环境承载能力评价,眉山市区位优势明显,人口集聚程度高,适宜开发的资源相对丰富,是四川经济发展条件较好的区域,总体适宜优化开发。地质环境承载能力方面,高中山区为高海拔生态脆弱区,为崩滑流地质灾害高易发区,主要位于眉山市西部。地质环境承载能力大的区域位于中部和东部区域,地质环境承载能力较大的区域位于中部及中北部,总体地质环境承载能力高。

猜你喜欢

信息熵决策树承载力
基于信息熵可信度的测试点选择方法研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
一种基于信息熵的雷达动态自适应选择跟踪方法
基于决策树的出租车乘客出行目的识别
CFRP-PCP板加固混凝土梁的抗弯承载力研究
基于信息熵的IITFN多属性决策方法
耐火钢圆钢管混凝土柱耐火极限和承载力
基于肺癌CT的决策树模型在肺癌诊断中的应用
潜艇极限承载力计算与分析