APP下载

基于时间序列分析的鹤壁市AQI预测模型

2022-04-29牛艳飞

中阿科技论坛(中英文) 2022年4期
关键词:鹤壁市参数估计残差

牛艳飞

(鹤壁职业技术学院,河南 鹤壁 458000)

随着工业化的不断发展,各种空气污染问题日益凸显,比如,雾霾、全球变暖以及空气中的光化学污染等问题已经成为全球关注的热点。为了预防和治理城市空气污染问题,人们需要了解空气污染的原因并掌握其变化趋势。因此,准确预测空气质量具有一定的现实意义。

在时间序列分析中,最常用于拟合平稳序列的模型是ARMA模型。ARMA模型对时间序列的自相关结构进行描述时,使用的是有限参数线性模型,它的拟合精度能达到实际工程的要求,并且由其可推导出适用的线性预报理论。利用ARMA模型描述的时间序列预报理论在经济、环境工程等领域均有着重要的理论意义[1]。目前,很多学者基于时间序列分析法对空气质量指数进行研究,比如王建书[2]、王赛兰[3]和张欢[4]等。本文将利用时间序列分析结合鹤壁市2021年6月1日—2021年12月31日的AQI数据建立新的预测模型。并运用该模型对鹤壁市未来10天的空气指数进行预测。希望可以对市民出行活动给出参考意见,并且可以提高市民环境保护意识。

本文建模思路:首先,对数据进行处理,检验是否为平稳序列;其次,根据系数相关图确定拟合模型及其阶数;最后,可以根据AIC和SC准则判断模型的优劣,以此确定最优模型,根据模型画出预测图并得出预测结果,以此来进一步判断模型的好坏,并根据预测结果给出市民出行活动的参考意见。

1 理论基础

时间序列模型预测方法的基本思想:通过研究现象的历史数据来找出其中所蕴含的变化规律,进而通过这种规律来预测未来的数据。ARMA模型有三种基本类型:自回归(AR:Auto-Regressive)模型、移动平均(MA:Moving-Average)模型以及混合(ARMA:Auto-Regressive Moving-Average)模型[5]。

其中,AR(p)模型的预测方式是通过过去的观测值和现在的干扰值的线性组合进行预测;MA(q)模型则通过过去的干扰值和现在的干扰值的线性组合进行预测;ARMA(p,q)模型是AR(p)模型和MA(q)模型的组合形式。三个模型的具体公式如下所示[5]:

AR(p)模型的公式为(1)式:

2 实例分析

2.1 数据来源

以2021年6月1日-2021年12月31日的鹤壁市AQI数据作为样本,其中每天的AQI数据来源于中国空气质量在线监测平台。基于上述数据运用时间序列分析法及Eviews软件进行分析并建立预测模型。

2.2 平稳性检验及模型定阶

为了建立合适的预测模型,首先需要检验数据的平稳性。画出AQI原始数据的时间序列图,如图2.1所示,并使用单位根检(ADF:Augmented Dickey-Fuller test)法,给出ADF检验结果如表2.1所示。

图2.1 AQI时间序列图

表2.1 ADF检验结果

根据图2.1可知数据具有一定的平稳性。根据表2.1可知单位根统计量为-7.007 610,小于-3.461 030和-2.573 985,所以拒绝原假设。综合判定,该数据为平稳序列,并且大部分数据处在50~100之间。

我们可以根据自相关系数和偏相关系数来确定模型的阶数,鹤壁市AQI数据的系数相关图,如图2.2所示。

图2.2 鹤壁市AQI数据的系数相关图

根据图2.2,自相关和偏自相关均没有明显的截尾性,所以考虑ARMA模型。自相关在六步之后落入两倍误差范围之内,所以q可能取6;偏自相关系数在k=2和k=4处靠近边缘,所以p可能取2或者4;我们可以初步考虑用ARMA(2,6),ARMA(4,6)这两个模型来进行拟合。

图2.2 ARMA(2,2)模型参数估计结果

2.3 模型的参数估计

2.3.1 ARMA(2,2)模型的参数估计及检验

对ARMA(2,6)模型进行参数估计,通过在参数估计过程中不断剔除不显著的项来调整模型阶数,最终确定模型为ARMA(2,2)模型,参数估计结果如表2.2所示,并画出残差图,如图2.3所示。

图2.3 ARMA(2,2)残差图

根据图2.3可知P值均大于0.05,该模型通过白噪声检验。因此,参数估计过程平稳,此模型合理。模型的表达式:

2.3.2 ARMA(4,6)模型的参数估计及检验

用ARMA(4,6)模型对时间序列Xt进行参数估计,逐步剔除不显著的移动平均项和滞后项,最终确定为ARMA(4,6)模型,参数估计所得结果见表2.3。

表2.3 ARMA(4,6)模型参数估计结果

对该模型做残差检验,残差检验图如图2.4所示。

图2.4 ARMA(4,6)残差图

由图2.4可知P值均大于0.05,该模型通过白噪声检验。因此,参数估计过程平稳,此模型合理。模型的表达式:

2.3.3 两个模型的对比分析

根据表2.2和 表2.6可 知ARMA(2,2) 模型及ARMA(4,6)两个模型的AIC和SC值,具体如表2.4所示。

表2.4 两个模型AIC和SC值

根据表2.4可知 ARMA(4,6)模型比ARMA(2,2)模型的AIC值及SC值小,并且ARMA(4,6)模型也并不复杂,所以ARMA(4,6)模型较优。

2.4 ARMA(4,6)模型的拟合效果

ARMA(4,6)模型拟合效果图如图2.5所示。

图2.5 模型拟合效果图

2.5 ARMA(4,6)模型的预测

ARMA(4,6)模型动态预测图及相关参数如图2.6所示,静态预测图及相关参数如图2.7所示。

图2.6 ARMA(4,6)模型动态预测图及相关参数

图2.7 ARMA(4,6)模型静态预测图及相关参数

从动态预测图中可以看出它的预测值接近一条直线,所以预测结果并不理想。而从静态预测效果图(图2.8)中可以看出预测值和真实值非常接近,所以选择静态预测对此模型进行预测。

图2.8 静态预测效果图

对鹤壁市2022年1月1日—2022年1月10日共10天的AQI数据进行预测,预测结果如表2.5所示。

表2.5 AQI预测值

AQI值的高低代表着空气质量的好坏,根据国家生态环境部对空气质量的等级划分,将AQI从0—500分为六个等级[6],具体等级划分如表2.6所示。

由表2.5可知,鹤壁市未来10天的空气质量指数预测值均在100上下范围内,又通过对照空气质量级别表2.6可知,鹤壁市未来10天的空气质量大部分属于空气质量三级,为轻度污染,对绝大多数市民的日常出行没有太大的影响。

表2.6 空气质量级别表

3 结语

本文基于鹤壁市2021年6月1日—2021年12月31日的AQI数据,运用时间序列分析法建立多个模型,对比分析得出较优的ARMA (4,6)预测模型,通过模型预测结果显示,鹤壁市未来十天的空气质量为三至四级,空气质量指数级别较低,相对于前几年,空气质量有所下降,需要引起人们的重视。与实际数据对比发现,时间序列分析法具有短期预测较为准确的特点。如果一次性预测多天AQI数据,会发现最后几天的预测效果较差。因此,可以通过持续更新数据,以确保预测值的准确性。时间序列分析法还可以对城市的空气湿度、降水量等多个指标进行预测。对一个城市多个指标规律的预测及掌握,可以让我们更加全面地预测一个城市未来一段时间内的空气质量变化。

猜你喜欢

鹤壁市参数估计残差
基于残差-注意力和LSTM的心律失常心拍分类方法研究
基于双向GRU与残差拟合的车辆跟驰建模
基于新型DFrFT的LFM信号参数估计算法
翰墨传情 共克时艰
翰墨传情 共克时艰
基于参数组合估计的多元控制图的优化研究
挥毫泼墨
一种GTD模型参数估计的改进2D-TLS-ESPRIT算法
基于残差学习的自适应无人机目标跟踪算法
基于深度卷积的残差三生网络研究与应用