基于ARIMA模型在短期内对上证指数分析

2020-10-11张强电子科技大学成都学院文理学院

营销界 2020年20期

张强（电子科技大学成都学院文理学院）

■引言

(p,d,q)模型[1-2]利用所预测对象建立的随机数学模型,通过自随机相关的分析建立和描述所预测对象的随机数据序列，经过统计检验,拟合的效果,可有效地结合随机数据序列的历史数据对未来的值进行自相关分析和未来值的预测。ARIMA模型的识别是从已知模型中选择一个与给定时间序列[3]过程相吻合的模型。在实践中，仅仅通过观察时间序列很难确定它属于哪个模型，因此模型的识别显得尤为重要。

■模型的分析与建立

本文选取了2010年12月至2019年4月的上证指数月度收盘价格作为时间序列研究的一个稳定性样本。我们首先明确上证指数的月度收盘价的时间稳定性,进而直接得出时间序列中确定因素是否已经存在上涨趋势，判断其时间序列模型是否为时间序列模型,从而采用适当的时间分析方法在序列中进行时间确定性因素分析及时间序列模型的建立。这里我们记LY为上证指数收盘价的时间序列。

（一）平稳性检验

对2010年12月以来的月度时间序列的数据进行取对数的处理发现LY序列之间有截距项和对数的上升趋势。该时间序列中包含稳定的时间移动趋势和不稳定的截距项。由eviews软件[4]处理数据得出时间序列p值为0.4880，表示了对原始时间序列分析过程是一个包括截距项和原始时间序列趋势项的非平稳单位根的过程。

（二）序列模型

想要将序列转换成白噪声序列，我们通过原始序列的一阶差分来消除这种趋势。从图1中自相关（AC）和偏自相关（PAC）可以看出，AC拖尾，PAC截尾，说明可以建立ARIMA模型进行预测分析。我们将一阶差分后的时间序列记为DLY，一阶差分后的DLY序列无季节性变动，所以d=1。

由图1得P=0，DLY的时间序列是一个随机序列，即白噪声过程，因此得到的DLY是一个平稳的时间序列。

（三）模型建立

数据经过差分后我们发现:无论是AC还是PAC的函数图，都为截尾的状态。同样说明了该函数的序列为平稳的时间序列，p和q的每一个函数值通过取值公式组合为p=1,q=0；p=0,q=1；p=1,q=1。

根据综上所得到的p、d、q的具体数值，进而得到以下三种模型，即：

模型 1：ARIMA(1,1,0);模型 2：ARIMA(1,1,1);模型 3：ARIMA(0,1,1)。

通过AIC数值大小、残差检验方法检验这三个模型，得到他们都通过残差检验但是AIC值最小，由此得到最优预测模型。

（四）参数估计

我们又通过比较AIC的值来判断ARIMA(1,1,0)模型是否合适以及拟合优度。由Eviews9的回归估计可以得到图2，由图2可以看到AIC数值较小，说明拟合效果较好。

由此，我们得到最终的时间序列预测ARIMA(1,1,0)模型表达式如下：

上式中：LY为上证指数收盘价的时间序列，εt是白噪声序列，L是延迟算子。图中R2=0.90010，这表明该模型的拟合优度达到了90%，模型的误差为0.067485，所以模型预测精度较高。综上所述，该模型与上证综合指数相吻合。

（五）模型的诊断及预测总模型

从图2中的结果还可以看出，所有的P值都大于0.05，通过残差检验。模型所得残差为白噪声序列，可以说明该模型满足残差独立同分布，模型的拟合程度较好。

我们通过Q检验发现，所有Q统计的P值都大于0.05，认为该ARIMA(1,1,0)模型得到的残差序列满足独立同分布的前提，同样表明该模型拟合良好。

■模型应用

我们选取2010至2019年利用ARIMA(1,1,0)模型得到上证指数预测数据（YF）和由Eviews9得出上证指数数据（Y）的图形如图3所示：

我们发现预测数据的走势与原序列数据的走势是相似的,反映了原始序列的趋势和数据的大小。我们提取其中10组实际值与预测值的数据，前5对数据(2011M02至2011M06)记为为1号组，后5对数据(2018M12至2019M04)记为2号组，分别利用计算均方误差。计算结果为：1号组的均方差为12.1330；2号组的均方差为12.7448。均方差数值并不大，因此我们建立的ARIMA（1,1,0）模型适用于短期内对上证指数预测。