APP下载

基于BP神经网络的空气质量建模分析

2018-10-27何晓云罗泽蓉李明悦李亚斌赵盛萍

山东工业技术 2018年17期

何晓云 罗泽蓉 李明悦 李亚斌 赵盛萍

摘 要:随着社会的进步,我国空气质量指数日益下降,一氧化碳、颗粒物、臭氧等是影响最严重的大气污染物,且它们已经成为检测空气质量品质的重要参数,对这些空气质量参数的监控和预测已变得尤为重要。BP神经网络对非线性系统函数有良好的逼近能力,符合我们对空气质量建模的实际要求。本文选择BP网络进行建模,以空气中几种主要污染物为输入,AQI参数作为输出。并结合实际情况进行了引入时间参量和引入动量因子两种优化方法。经过仿真论证,优化后的模型拟合度更好,收敛速度更快。

关键词:BP网络;自适应学习;动量因子;神经网络改进

DOI:10.16640/j.cnki.37-1222/t.2018.17.210

1 引言

人工神经网络,是根据生物神经网络而来的一种可以处理信息的仿真模拟,它是由很多的人工神经元以某种规则衔接成人工神经网络,神经网络对训练过的数据有存储的功能,只要是训练过的数据,便可以自动生成一个训练模式,具备很高的自适应性。因为网络具有较好的独立处理数据的能力,网络实用性十分地强。神经网络对信息的处理具备诸多的优点,便于应用各个领域,因此人工神经网络广泛应用在计算机科学、模式识别技术、人工智能控制等領域[1-3]。

2 BP神经网络介绍

BP神经网络是最常用的一种网络模型。标准的BP神经网络通过不断修正网络的权值和阈值,从而使网络达到优化的目的。BP神经网络,又称前馈型网络,主要依靠输入信号(空气中的几种主要污染物)的正向传播,和误差的反向传递来进行优化建模。

3 BP算法的空气质量建模

本文用到的数据来自“中国空气质量在线监测分析“平台,数据类型。选择2016年成都的空气质量情况为依据,建立成都的空气质量数据库,随机选择260天的空气质量为训练样本,剩下的空气质量为测试样本,输入变量时六种大气污染物,分别是颗粒物PM10和PM2.5、SO2、NO2、O3、CO等,输出变量是空气质量AQI,AQI也是代表空气质量好坏的一个综合性因素。

(1)参数的分析与选择。在《环境空气质量标准》中,明确说明了颗粒物PM10和PM2.5、SO2、NO2、O3、CO等是需要我们检测的大气污染物,所以每个参数都有重要的意义:颗粒物PM10和PM2.5对造成雾霾天气有重要的影响;PM10,是可吸入颗粒物,影响着人体的健康;臭氧(O3),有着消毒、杀菌的效果,但是过量就会对人体有害;二氧化硫,在高浓度时人甚至会出现溃疡直至窒息死亡,还可以形成酸雨。一氧化碳,是约占大气百分之三十的污染物,如果浓度过高,还会危害人体的心脏、神经系统的功能;NO2,是棕红色的颜色,会快速破坏肺细胞,可能造成肺气肿、哮喘病和肺癌。

因此,在对空气质量进行建模的过程中,选择PM10和PM2.5、SO2、NO2、O3、CO这六个参数作为模型的输入变量,空气质量AQI作为模型的输出进行建模。

(2)数据的处理。归一化:利用相应的公式把样本数据限制在规定的区间内。本文里的数据都限制在了(0 1)之间。可以使神经网络的收敛性变好。所用公式如下:

在公式中,数据库样本的最大值用max表示,样本数据的最小值用min表示。X为归一化后的数据。

3.1 BP网络仿真训练

随机选择数据库中260天的空气质量数据作为训练样本,一年中其他的104天的空气质量作为测试样本,首先建立以PM10和PM2.5、SO2、NO2、O3、CO这六个参数为输入的六输入、单输出的网络拓扑结构如下图:

得到模型训练结果:

通过分析训练误差图和拟合结果图,可以看出该模型的训练误差下降较快,第1000步训练完成时误差为0.01,平均误差为0.639,预测值基本跟踪实际值。

3.2 加入时间参量的模型优化

考虑到成都各个季节的气温、风量、雨量的变化对空气质量的变化可能有较大的影响,本文考虑加入月份作为模型的输入,建立7个输入变量,一个输出变量BP网络模型,来提高模型的准确性。得到的仿真结果如图3、图4所示。

蓝色的点表示预测的空气质量AQI值,红色的点表示实际的空气质量AQI值,经验证,没有增加月份的影响时的的平均误差为0.0639,增加月份后的平均误差为0.428,可见增加月份作为输入参数后,模型的准确性得到了提高。

不难理解,因为不同的季节,不同的月份,空气质量的品质可能会有差异。

3.3 引入动量因子的模型优化

引入动量项的改进,可以近似使用最速下降法得到权值在空间中的轨迹。在学习中,η越小,权值的改变量就越小,轨迹也可以变的更光滑。在BP网络中,引入动量项后,就可以有效的改变步长η,使它不再是一个恒定的值。相当于加入了一个扰动,可以自动的调节着步长,并向着平均方向改变,所以动量项起到了加快收敛速度的效果[7]。

加入动量因子后的更新公式:

w(n0+1)=w(n0)+ η(n0)d(n0)+w(n0)

其中:

d(n0)=

w(n0)=w(n0)-w(n0-1)=η(n0-1)d(n0-1)

这是,权值修正量已经加入了修改的记忆方向,动量因子的选取一般是0.1-0.8。

同样以成都的空气质量参数为例进行建模,随机选择260天的空气质量作为训练样本,一年中其它几天的104个空气质量作为测试样本,加入了动量项,标准的BP算法采用的训练方法traingd,改进是加入动量项,所以训练函数变成了traingdx,它是引入了动量项的具有自适应的学习方法,可以自动的调整学习步长。进行建模,得到的结果如图5、图6所示。

通过分析训练误差图和拟合结果图,可以看出该模型的训练误差下降较快,第858步训练完成时误差为0.001,收敛速度变快了,平均误差为0.0322,预测值基本跟踪实际值。

4 结论

在大量的实际应用中,标准BP算法存在收敛速率慢、学习步长固定、网络不稳定,甚至会达不到网络收敛精度的要求,本文也主要根据BP算法的局限性,从而展开对空气质量的建模分析。所以在本文中,加入了动量项,对BP算法进行了改进,从而使BP算法的迭代次数变少,也减小了误差,最终优化了网络,提高了BP算法的品质。从上面可以看出在没有改进前,BP神经网络的训练函数用的是梯度下降法traingd,收敛速度很慢。所以,这里引入了优化网络的改进方法,加入动量项,也改变了训练函数,它是带有动量项的自适应学习算法traingdx,可以自动的调整学习步长。

经过仿真对比,得出加入动量项改进BP网络后,模型的收敛效果明显变好了,网络的误差平方和也变小了,所以平均误差也减小了,使得网络的拟合能力也大大地提高了,提升了网络的品质。

参考文献:

[1]曹晓强,刘胜荣,黄学敏.空气质量评价智能信息处理技术的研究[J].微计算机信息,2008(13):1-3.

[2]胡辉,谢静,侯祺棕,李湘男,徐双庆.城区大气污染物——NO_X浓度预测预报模式研究[J].城市环境与城市生态,2002(01):11-16.

[3]杨文东.大气环境质量评价的模糊综合评判法[J].武汉理工大学学报,2001(12):7-13.

[4]裴咏.浅析几种环境空气质量评价方法的优缺点[J].辽宁教育学院学报,2001(09):8-16.

[5]郝新波.环境影响评价与可持续发展刍议[J].科技情报开发与经济,2000(04):8-17.

[6]Arti3.Advances in Environmental Research[J].ElsevierScience,1997(04):5-11.

[7]C.L.M.Harnold,K.Y.Lee.Free-model Based Adaptive Inverse Neuro-controller for Dynamic Systems[C].The 37th IEEE Conference on Decision and Control,Tampa,Florida,1998:507-512.