APP下载

基于T-S模型模糊神经网络的PM2.5质量浓度预测

2015-02-22付彦丽

陕西科技大学学报 2015年6期
关键词:空气质量空气神经网络

杨 云, 付彦丽

(陕西科技大学 电气与信息工程学院, 陕西 西安 710021)



基于T-S模型模糊神经网络的PM2.5质量浓度预测

杨云, 付彦丽

(陕西科技大学 电气与信息工程学院, 陕西 西安710021)

摘要:针对空气中PM2.5浓度预测问题,提出了基于T-S模糊神经网络的预测方法.以宝鸡市监测站每小时监测数据为研究对象,进行PM2.5小时浓度预测建模.T-S模糊神经网络将模糊系统的模糊知识表达能力及神经网络的自我学习能力相结合,针对PM2.5预测这类非线性问题具有很好的处理效果.将T-S模糊神经网络的预测结果与BP神经网络的预测结果进行对比分析,结果表明,T-S模糊神经网络的预测结果具有更高的准确度和精确度.

关键词:PM2.5预测; T-S模糊系统; BP神经网络

0引言

近些年空气质量指数(Air Quality Index,AQI)逐渐成为衡量城市生活环境的主要因素,而PM2.5则是空气中的首要污染物,它也是北京继伦敦之后成为第二个雾都的重要原因.PM即Particulate Matter(颗粒物质)的缩写,PM2.5意指空气动力学等效直径等于和小于2.5微米的大气颗粒物(也称为细微颗粒),是造成雾霾天气、降低能见度,影响交通安全、危害人体健康的主要因素[1,2].1997年,美国率先将细颗粒物(PM2.5)列为检测空气质量的一个重要标准;2006年,哈佛大学在长达8年的观察中发现:空气中细微颗粒物明显降低的城市,死亡率大幅下降;PM2.5每下降1毫克/立方米,死亡率就会下降3%;Schwart研究发现心肺疾病的日病死率的增加与PM2.5有密切的关系,PM2.5日平均值每增加10微克/立方米,当日的病死率会提高1.5%[3].因此,寻求PM2.5质量浓度的预测具有十分重要的现实意义.

目前,对PM2.5的预测多采用多元回归模型、时间序列、灰色系统等预测方法,预测的准确率并不令人满意[4,5],这是由于PM2.5并不是一种单一成分的空气污染物,而是由来自许多不同的化学成分一起组成的一种复杂而可变的大气污染物.PM2.5中的一次粒子主要是OC(有机碳)、EC(元素碳)和土壤尘等,二次粒子主要有硫酸盐、硝酸盐、铵盐和半挥发性有机物等[6].

我国对PM2.5的计算主要采取物理的方法,但由于测量精度高的产品成本过高,所以我国的PM2.5观测点较少,而其他大气污染物如:O3、CO、SO2、NO2等与PM2.5的产生有着密不可分的关系[7],其观测技术成熟、设备价格低廉、观测点较多.

本文使用T-S模型模糊神经网络,采用O3、CO、SO2、NO2等六项空气污染物浓度作为输入量,对PM2.5建立预测模型,并将预测结果和实测PM2.5浓度进行比较,对预测模型进行评价和分析.

1T-S模糊模型

T-S模糊模型是由Takagi和Sugeno于1985年提出的一种新的模糊推理模型,是输出为精确量的一类特殊模糊逻辑系统[8].在模糊数学中有隶属度和模糊隶属度两种基本概念[9].隶属度指元素u属于模糊子集f的隶属程度,用μf(u)表示,其值在[0,1]之间.μf(u)越接近于0,则u属于f的程度越小,反之则越大.T-S模糊模型能不断修正模糊子集的隶属度函数并自动更新,是一个自适应能力很强的模糊系统.

(1)

(2)

其中,ω为模糊规则的适应度,最后根据模糊计算的结果计算出模糊模型的输出值y:

(3)

2T-S模糊模型神经网络的预测模型

2.1 T-S模糊神经网络

根据T-S模糊模型,可以得到如图1所示的基于T-S模糊神经网络结构:

图1 T-S模糊神经网络结构图

该网络有前件网络和后件网络两部分组成.前件网络用来匹配模糊规则的前件,由四层组成.

第一层为输入层,输入层与输入向量xi连接,节点数与输入向量的维数相同,起着将输入值传送到下一层的作用;

第二层为模糊化层.模糊化层的每一个节点代表一个语言变量值,采用隶属度函数对输入值进行模糊化得到模糊隶属度值μ;

第三层为模糊规则计算层,每一个节点代表一条模糊规则,用于匹配模糊规则的前件,计算出每条规则的适用度ωm;

第四层为归一化层,节点数与第三层相同,用于计算各适用度在适用度总和中所占份额,即:

(4)

后件网络由r个结构相同的并列子网组成,每个子网络产生一个输出量[11].第一层为输入层,输入层中第0个节点的输入值x0=1,它的作用是提供模糊规则后件中的常数量,输入层的作用是将输入变量传送到下一层;

第三层是以前件网络的输出为权系数来对第二层的输出加权求和,用于计算系统的最终输出.

2.2 T-S模糊神经网络的学习算法

T-S模糊神经网络的需要学习的参数主要有后件网络的连接权以及前件网络第二层各节点隶属度函数的中心值及宽度,主要分为三个步骤.

第一步,误差计算,取误差代价函数为:

(5)

其中,yd代表网络期望输出,yc代表网络实际输出,e为期望输出与实际输出的误差.

第二步,系数修正:

(6)

(7)

第三步,参数修正.对隶属度函数中心及宽度参数的修正按照BP网络误差反传学习算法,得出学习算法为:

(8)

(9)

3基于T-S模糊神经网络的预测实验

3.1 实验数据介绍

本文采用的空气质量数据来自于宝鸡市空气质量监测站2014年4月11日到5月22日每小时所采集的数据共980条,所有数据均按照连续的时间顺序排列.使用4月11日至5月9日共700条数据作为原始样本数据,5月9日至5月22日共280条数据作为测试数据.

本实验共有两组输入矩阵和两组输出矩阵,分别是由CO、NO2、O3-1、O3-8、SO2、PM10六个数据构成的训练输入矩阵和测试输入矩阵,以及由PM2.5构成的训练输出矩阵和测试输出矩阵.上述输入的数据用一个6×m的矩阵来表示:

其中第一列ai1代表CO的测量值、第二列ai2代表的NO2测量值,以此类推ai6代表PM10的测量值,每一行代表同一时间点这六项数据的测量值,m在这里代表时间.输出数据则用一个m×1的列向量表示:D=[d1d2…dm],其中dm代表该时刻PM2.5的测量值.

3.2 数据归一化处理

由于数据各属性单位不同,且不同属性值相差过大,比如本数据中CO测量值通常介于0.5到2.5之间,而PM10的测量值则通常在20到300之间,直接将这些数据值作为神经网络的输入将影响到训练.因此,使用数据集训练网络之前需要对数据进行归一化处理.保证每个数据项在同一区间取值,防止特征数据项数量级差别较大而造成数量级小的数据项特征无法发挥作用[12],保证程序收敛时的速度加快.

本文采用mapminmax函数作为归一化的方法,mapminmax可以把矩阵的每一行归一到[-1,1]之间,其公式为:

(10)

以4月11日15时的监测数据a=[0.868,68,13,11,12,48]为例,使用mapminmax对其进行归一化:

[b,ps]=mapminmax(a)

其中,a为输入数据,b为输出数据,ps为规范化映射记录的结构体,该数据经过归一化后结果为:b=[-1.00,1.00,-0.638 6,-0.698 1,-0.668 4,0.404 2].

3.3 PM2.5预测

在Matlab平台下编写基于T-S模糊神经网络的PM2.5预测程序,根据输入/输出数据维数确定网络结构.本实验中,输入数据为6维,输出数据为1维,通过试错法确定网络结构为6-12-1,即6个输入参数,12个隶属度函数,1个输出参数.选择7组系数,分别为p0-p6,隶属度函数中心c、宽度b,通过BP算法进行在线调整,网络迭代200次.

使用经过归一化处理的训练样本对T-S模糊神经网络的进行训练,训练结束后,分别使用训练样本及测试样本对网络训练结果进行检验,得到PM2.5小时平均质量浓度的预测值如图2~3所示.

图2 训练集PM2.5预测

图3 测试集PM2.5预测

从图2~3中可以发现,PM2.5预测值与实测值在总体走势上基本保持一致,但当PM2.5在某时刻发生较大起伏时,预测结果误差变大.为进一步计算预测结果的精度,对预测结果使用如下公式进行分析:

(11)

其中,ydi为实测值,yci为预测值,设定当pi≤10%时,认为预测结果很好;当10%≤pi<30%时,认为预测结果可接受;当30%≤pi<50%时,认为预测结果较差,当pi≥50%时,认为预测结果不可接受,根据该规则对训练的700个结果和预测的280个结果做出分类,可得到表1.

表1 PM2.5预测值可接受度

根据我国制定的《空气质量标准》中,PM2.5质量浓度ρ/(g·m-3)与AQI各等级的对应关系,将ρ<50空气等级为优的等级序列号设为1;50≤ρ<100空气等级为良的等级序列号设为2;100≤ρ<150空气等级为一般的等级序列号设为3;150≤ρ<200空气等级为轻度污染的等级序列号设为4;200≤ρ<300空气等级为重度污染的等级序列号设为5;ρ≥300空气等级为严重污染的等级序列号设为6,得到预测结果如图4~5所示.

图4 训练集空气质量等级预测

图5 测试集空气质量等级预测

从图4~5中可以发现,在空气质量等级预测中,实测结果与预测结果基本相同,只有少数点出现1个等级的误差,没有出现2个等级及以上的误差.对所有数据进行统计分析发现,对训练数据进行空气质量等级预测时,预测数量700,正确数量588,正确率84%;对测试数据进行空气质量等级预测时,预测数量280,正确数量227,正确率81%.

3.4 不同方法在PM2.5预测中的对比

目前,已有学者已将神经网络引入到了预测领域中[13-15],但多采用的是BP神经网络及其变形,且BP网络在训练过程中极易陷入局部最优[16].为了对比T-S模糊神经网络与BP神经网络在PM2.5预测中的精确度及空气质量预测的准确率,利用BP神经网络对相同数据再次进行训练和预测.BP神经网络采用6-9-1的网络结构,隐含层传递函数采用logsig,输出层传递函数选择purelin,训练函数选择traingdx,阈值和权值学习函数采用learngd,训练样本及测试样本的归一化方法与T-S模糊神经网络相同,网络迭代200次,得到结果如表2所示.

表2 T-S与BP神经网络预测对比

从表2可以得到,在训练数据预测中,T-S模糊神经网络的平均相对误差、最大相对误差分别低于BP神经网络5.8%、36.8%,正确率高于BP神经网络9%;在测试数据预测中,T-S模糊神经网络的平均相对误差、最大相对误差分别低于BP神经网络7.6%、34.5%,正确率高于BP神经网络8%.因此,T-S模糊神经网络在PM2.5预测中总体性能要优于BP神经网络.

4结论

PM2.5是一种成分复杂的空气污染物,受到CO、NO2、SO2以及降雨、风速、温度等各类因素的影响,是一种非线性的复杂变量,传统的线性预测模型,难以得到满意的预测结果.

本文从非线性的角度出发,提出了基于T-S模糊神经网络的对PM2.5进行预测的方法,该方法不仅具有良好的模糊知识表达能力,还具有神经网络的自我学习能力,对于非线性问题能够进行很好的处理.将T-S模糊神经网络和BP神经网络的预测结果进行对比分析,结果表明,T-S模糊神经网络的空气质量等级预测准确率及PM2.5质量浓度预测精确度均要高于BP神经网络.

由于数据获取渠道有限,该模型预测结果仍存在少量误差,这是由于实际数据中包含的特征信息不够充分.若能将季节、气候、风向等实时气象数据纳入特征范围内,增加输入数据维数,不断获取更长时间的历史数据,扩大训练样本及测试样本数据量,预测的精度及准确率还有进一步提高的可能.综上所述,T-S模糊神经网络在PM2.5预测方面具有良好的前景.

参考文献

[1] 杨新兴,冯丽华,尉鹏.大气颗粒物PM2.5及其危害[J].前沿科学,2012,6(1):22-31.

[2] 李伟,姜志平,李俊坡,等.PM2.5相关因素分析及其演变预测[J].现代电子技术,2014,37(18):63-66.

[3] F C T,K R S,N V,et al. Indoor/outdoor PM10 and PM2.5 in Bangkok,Thailand[J].Journal of Exposure Analysis & Environmental Epidemiology,2015,26(1):112-115.

[4] Kim T,Valdés J B.Nonlinear model for drought forecasting based on a conjunction of wavelet transforms and neural networks[J].American Society of Civil Engineers,2014,8(6):319-328.

[5] Pérez P,Trier A,Reyes J.Prediction of PM2.5 concentrations several hours in advance using neural networks in Santiago,Chile[J].Atmospheric Environment,2000,34(8):1 189-1 196.

[6] 程春英,尹学博.雾霾之PM2.5的来源、成分、形成及危害[J].大学化学,2014,29(5):1-6.

[7] Abu Allaban M,Lowenthal D H,Gertler A W,et al.Sources of PM10 and PM2.5 in Cairo 17s ambient air[J].Environmental Monitoring & Assessment,2007,133(1-3):417-425.

[8] 邢宗义,胡维礼,贾利民.基于T-S模型的模糊预测控制研究[J].控制与决策,2005,20(5):495-499.

[9] 汪新波,粟晓玲.基于T-S模糊神经网络的民勤地下水水质综合评价[J].干旱地区农业研究,2013,31(1):188-192.

[10] Liang X,Zhang J,Wei L I,et al.T-S fuzzy neural network control for autonomous underwater vehicles[J].Electric Machines & Control,2010,14(7):99-104.

[11] 吴忠强,许世范,岳东.非线性系统的T-S模糊建模与控制[J].系统仿真学报,2002,14(2):253-256.

[12] 柳小桐.BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123.

[13] 杨娟丽,徐梅,王福林,等.基于BP神经网络的时间序列预测问题研究[J].数学的实践与认识,2013,43(4):158-164.

[14] 祝翠玲,蒋志方,王强.基于B-P神经网络的环境空气质量预测模型[J].计算机工程与应用,2007,43(22):223-227.

[15] 王芳,程水源,李明君,等.遗传算法优化神经网络用于大气污染预报[J].北京工业大学学报,2009,35(9):1 230-1 233.

[16] 孙一兵.浅议BP网络的优缺点及改进[J].科技创新导报,2009(24):18.

The prediction of mass concentration of PM2.5

based on T-S fuzzy neural network

YANG Yun, FU Yan-li

(College of Electrical and Information Engineering, Shaanxi University of Science & Technology, Xi′an 710021, China)

Abstract:According to the prediction of concentration of PM2.5 in air,a prediction method based on T-S fuzzy neural network is proposed in this paper.Using the monitoring data of Baoji monitoring station as study object,a PM2.5/hour concentration prediction model is established.T-S fuzzey neural network combing the fuzzy knowledge representation ability of system and the self-learning ability of neural network,for the kind of nonlinear problem as PM2.5 prediction has the very good treatment effect.Comparison and analysis the predicted results of T-S fuzzy neural network and BP neural network, the results show that the prediction result of T-S fuzzy neural network has higher accuracy and precision.

Key words:PM2.5 prediction; T-S FNN; back propagation neural network

作者简介:杨云(1965-),女,山东青岛人,教授,博士,研究方向:嵌入式应用、材料计算机应用

基金项目:陕西省科技厅科学技术研究发展计划项目(2014K15-03-06); 西安市科技计划项目(NC1403(2),NC1319(1))

*收稿日期:2015-10-13

中图分类号:TP391

文献标志码:A

*文章编号:1000-5811(2015)06-0162-05

猜你喜欢

空气质量空气神经网络
[呼吸的空气]Die Luft zum Atmen让我们把它推迟到明日
神经网络抑制无线通信干扰探究
我要买空气
那些你意想不到的神回复
“空气质量发布”APP上线
车内空气质量标准进展
重视车内空气质量工作 制造更环保、更清洁、更健康的汽车
开展“大气污染执法年”行动 加快推动空气质量改善
早晨的空气真的好吗
基于神经网络的拉矫机控制模型建立