APP下载

基于机器学习的森林火险因子大数据的深度约简机制研究

2020-04-10陈俊雹

现代信息科技 2020年1期
关键词:机器学习大数据

摘  要:文章研究利用改进的机器学习理论与算法,建立针对森林火险因子大数据的深度约简机制,旨在对现有森林火险预警模型中重要的火险因子进行过滤和修正,以更为充分地剔除规模较大的火险因子大数据中冗余的、无效的数据,并且利用改进的人工鱼群算法对过滤约简得到的关键火险因子进行补偿修正。为基于大数据的、有效的森林火险预测预防方法及对策奠定重要基础。

关键词:森林火险因子;机器学习;大数据

中图分类号:TP181       文献标识码:A 文章编号:2096-4706(2020)01-0086-02

Abstract:A deep reduction mechanism for forest fire risk factor big data is established to filter and correct the important fire risk factors in the existing forest fire risk warning model using the improved machine learning theory and algorithm in this paper,which is aimed at eliminating the redundant and invalid data with large scale in the fire risk factor big data more fully. Meanwhile,a modified artificial fish swarm algorithm is used to compensate and correct the key fire risk factors obtained by the filter reduction. It lays an important foundation for effective forest fire risk prediction prevention methods and countermeasures based on big data.

Keywords:forest fire risk factor;machine learning;big data

1  研究背景

随着大数据时代的来临,森林火险预警系统需要分析的森林火险因子数据逐渐增多。如何聚类这些火险因子并分析其对于森林火险的影响程度,对森林火险的预测准确度以及火势发展趋势等都尤为关键。由于数据庞大、干扰数据众多,在建立森林火灾预警模型之前,对各类火险因子的数据分析与处理就显得尤为关键。本文采用灰色关联分析与模糊集理论,研究利用改进算法的神经网络建立针对森林火险因子大數据的深度约简机制,旨在从横向和纵向对火险因子进行过滤和修正,利用多种机器学习算法建立深度约简机制。人工神经网络具有自组织、自学习和泛化能力,无需考虑数学模型的内部结构、不需假设前提条件和人为地确定因子权重就可对林火等非线性现象的任意非线性函数进行逼近和模拟。但是处理大数据时,神经网络自身易陷于最小化和收敛速度慢的情境。因此,新时期应在前人研究的基础上,结合当今的计算机科学技术和各种类型的大数据,为森林火险的预警建立动态改良的机制,提高森林火灾预测的准确率,为开展生态安全防护工作提供更加丰富的对策支撑,使因森林火灾造成的损失最小化。

在大数据时代,各行各业为了适应新的需要,都已经在建立专业的大数据的对策方面开展相关工作。林业相关部门也已经提出建立建成森林、湿地、荒漠等林业资源大数据采集、分析、预测和应用的一体化林业智慧决策机制。充分发挥大数据的作用,深化林业智慧决策机制的建立意义,实现森林、湿地、荒漠等林业资源大数据的预测和分析应用是未来的研究重点,也是森林防火研究的实际应用价值所在。

2  研究现状

森林火险预警是一个集不同影响因素于一体的复杂机制,森林火险因子大数据为其主要研究对象。目前对森林火险预警模型研究主要也集中在森林火险因子大数据分析技术的开发与研究上。我国在森林火险预警方面的研究起步较晚,但发展迅速。随着科技的进步与发展,我国的森林火灾预警的研究仍然在不断开拓与完善。尤其在基于森林火险因子大数据分析的预警机制研究上已经取得了一定的成果。

国内对森林火险因子大数据技术的分析研究中,大部分学者都认为湿度、温度和风速是影响林火发生的三个主要的火险气象因子,并对相关的气象因子在林火预测中的权重进行分析[1];还有一些学者以森林植被类型和林地面积资料等相关因子为基础,进行各区域的森林火险划分;还有运用卫星遥感获取到的火点位置信息与气象数据来推演火灾的动态变化(蔓延方向、火烧面积及强度)的研究[2];此外,一些先进国家已经形成的成熟技术,比如加拿大森林火险气候指数(Fire Weather Index,FWI),也被用来研究我国森林火灾的等级划分,已经得到了较好的研究成果[3]。除了这些可检测到的森林绿度和气象因子,还有因吸烟、祭祀等野外用火以及农耕、生产用火等人为影响的火险因子的相关研究也有报道[4]。事实上,我国对于森林火灾预警模型的指标体系还没有完全形成,本文也希望建立一种改进的神经网络模型,并对各类火险因子进行聚类与筛选,以提高预警模型的预测精度。

在处理规模较大的数据时,粗糙集理论能够识别和抽取出其中隐含的、潜在的、有意义、有价值的数据,去掉冗余的、无效的数据。基于此,许多学者利用粗糙集理论对预处理神经网络的输入数据进行简化,以提高神经网络算法的预测率。但是这些研究只考虑到了纵向维度的约简,即各类指标对预测结果的影响,而忽略了横向维度的数据。对输入数据的约简并不彻底,仍然会出现部分无关的、冗余的数据,这样可能会造成人工神经网络出现过度学习等情况,从而影响模型的预测精度。

由此可见,虽然许多专家与学者运用各种数据挖掘方法对森林火险因子大数据分析各个方面进行研究,但是对于各种类的火险因子的收集以及筛选的研究略显不足。而且大多选用人工智能对森林火险进行预警的研究,都没有进行模型参数的选择分析与优化。因此,本文对森林火险因子大数据深度约简机制的探讨具有很强的理论与现实意义。

3  研究机制

3.1  重要的火险因子的过滤机制

在森林火险预警系统中,影响森林火险的因子众多。如果将这些火险因子全部导入预测模型中,会造成模型的冗余、运行速度变慢以及预测精度下降等问题。所以模型进行预测之前,大数据的预处理与因子筛选是一项重要的工作。在可燃物因子、气象因子、火源以及火灾历史数据等火险因子中,有不少火险因子在预测划分森林火险等级时具有相关性。本文可以通过灰色相关分析与模糊集理论筛选出在特定区域或环境下具有代表性的火险因子。这样通过小部分的参数就可以对森林火险进行有效预警,以提高模型的准确度。在保持信息的决策能力不变的前提下,可以剔除输入大数据中不必要的一些数据来建立动态有效的森林火险因子体系。

3.2  关键火险因子的补偿修正机制

在特定区域或环境下具有代表性的火险因子通常具有不同程度的相关性。通过将人工鱼群算法中鱼群初始化方式、视野和步长以及拥挤度因子的适用于过滤得到的火险因子的研究,可以得到改进的人工鱼群算法。采用改进的人工鱼群算法对反向传播神经网络的初始权值阈值进行全局寻优,再用寻优后的权值阈值建立反向神经网络,对筛选过滤得到火险因子进行相关性补偿修正。修正后的火险因子输入系统后可以有效降低恒定的预警误差。

3.3  预警模型参数选择的分析优化机制

通过对BP(Back Propagation,反向传播)神经网络模型的参数选择进行分析,得出最合适的参数组合进神经网络的模型训練。针对神经网络在面对大数据量,特别是高维输入矢量时收敛速度较慢并且容易陷入局部极值的缺陷,采用遗传算法、模拟退火算法等进行全局搜索,找出基于本项目数据的优化初始权值与阈值,并建立优化的人工神经网络模型,对森林火险进行预警并进行危险等级的划分。由此,我们得到基于深度约简后的森林火险预警模型火险因子体系,建立基于优化的BP神经网络的森林火险预警机制。

4  结  论

在大数据时代,林业相关部门已经提出建立建成森林、湿地、荒漠等林业资源大数据采集、分析、预测和应用的一体化林业智慧决策平台。本文利用机器学习算法从多个维度深度剔除了冗余的森林火险因子,并建立了深度约简机制。不同于现有利用粗糙集理论对预处理神经网络的输入数据进行独立简化的方法,本文考虑了输入火险因子数据之间的相关性,采用灰色关联分析、模糊集理论以及人工鱼群算法对各火险因子大数据进行更为彻底的剔除,同时利用遗传算法,改良处理大数据时神经网络自身易陷于最小化和收敛速度慢的缺点,对模型的参数选择进行分析优化。过滤和修正后的数据输入经过优化后的神经网络,可以更加动态有效地预测森林火险。

参考文献:

[1] 梁慧玲,林玉蕊,杨光,等.基于气象因子的随机森林算法在塔河地区林火预测中的应用 [J].林业科学,2016,52(1):89-98.

[2] 李晓恋.基于MODIS数据的多因子协同作用下森林火灾预测监测研究 [D].合肥:中国科学技术大学,2016.

[3] 高德民,林海峰,刘云飞,等.基于无线传感网的森林火灾FWI系统分析 [J].林业科技开发,2015,29(1):105-109.

[4] 徐虹,程晋昕,余凌翔.基于GIS的云南省森林火险区划研究 [J].中国林业产业,2016(10):199-202.

作者简介:陈俊雹(1990.02-),男,汉族,江苏南京人,就职于信息技术学院,讲师,博士,主要研究方向:机器学习、信息安全和激光感知技术。

猜你喜欢

机器学习大数据
基于词典与机器学习的中文微博情感分析
基于网络搜索数据的平遥旅游客流量预测分析
前缀字母为特征在维吾尔语文本情感分类中的研究
基于支持向量机的金融数据分析研究
大数据环境下基于移动客户端的传统媒体转型思路
基于大数据背景下的智慧城市建设研究
数据+舆情:南方报业创新转型提高服务能力的探索
机器学习理论在高中自主学习中的应用