APP下载

基于ARIMA模型的上证指数分析与预测的实证研究

2019-06-24张颖超孙英隽

经济研究导刊 2019年11期
关键词:ARIMA模型时间序列上证指数

张颖超 孙英隽

摘 要:近年来,我国资本市场快速发展,其中股票市场吸引了大量的资金。而股价作为反映企业经济实力、发展水平的重要指标,受到了人们越来越多的关注。上证指数作为一个综合反映股市变动情况的指标,有利于市场参与者对市场进行分析。因此,选取2016年2月1日至2018年10月16日的上证指数收盘价作为研究数据,建立ARIMA模型,对未来的上证指数进行预测和分析,以期为广大投资者提供投资指标,为企业政策决定者提供可靠的依据。

关键词:ARIMA模型;预测;时间序列;上证指数

中图分类号:F830.91      文献标志码:A      文章编号:1673-291X(2019)11-0131-05

引言

早在数百年前,随着股份公司这种企业组织形态在资本主义国家诞生,股票就随之诞生。随着我国资本市场的快速发展,股票市场吸引到大量的资金,受到人们越来越多的关注。上证指数由上海证券交易所编制,以上海证券交易所挂牌上市的全部股票为计算范围,综合反映了上海证券交易市场的总体走势,能够在一定程度上反映国家的经济发展水平、企业的经济实力,以及广大个人投资者的收入水平,是一个全面的、综合的重要经济衡量指标。因此,通过对上证指数的短期预测可以为大量投资者提供投资指标,给企业政策决定者可信的依据。

然而,股票市场风云莫测、起起伏伏、波动巨大,很难对其长期走势进行长期精准的预测。目前,预测股票价格走势的方法多种多样,但是均存在对股票价格的波动拟合效果较差、预测精度有限等问题。由于时间序列模型具有应用范围广、限制要求低、短期预测准确率高等优点,因此时间序列模型已经成为金融预测领域较流行的预测模型之一。本文选取2016年2月1日至2018年10月16日的上证指数数据,经过反复测试,建立ARIMA(4,1,4)模型,对未来进行短期预测。结果表明,该模型能够在短期内比较精确地预测未来的上证指数。

一、文献综述

(一)国内研究现状及成果

自20世纪90年代我国的上海证券交易所和深圳证券交易所相继成立以来,我国的股票市场处于快速发展的阶段,但仍旧落后于西方的发达资本主义国家,有着许多尚未解决的问题,吸引了众多研究者对股市进行研究。

孙碧波、方健雯(2004)以技术分析获利能力为研究视角,对中国证券市场弱态有效性进行检验、分析,以上证指数作为样本数据进行实证分析。研究得出,投资者可以通过技术分析的方法来获取长期稳定的投资收益,并排除了异步交易、交易成本和时变的均衡期望回报这三种导致超额利润的可能,最终得出中国的股票市场还没有达到弱态有效性。贺本岚(2008)在研究中选取了八年的上证指数数据,运用时间序列中常见的两种模型对数据进行建模、分析及预测。研究认为,条件异方差模型可以更好地描述股票的波动性。成城(2014)在研究上证指数波动率特征的时候,选用GARCH模型和EGARCH模型对波动率进行量化分析,选取1997—2013年间的数据进行实证分析,观察到了序列尖峰厚尾和聚类特征,并且证明了利用GARCH族模型及其拓展形式对收益率序列波动率建模的可行性。王慧星、林嘉喜(2017)选取了上证50指数作为研究对象,根据数据的特性建立时间序列模型对数据进行定量分析,并对指数的未来走势进行预测,能够较好地模拟市场走势的小样本投资组合。

(二)国外研究现状及成果

对于许多高度发达的资本主义国家来说,已经构建了较为成熟的理论和体系,吸引了更多的研究学者投入其中。

J.H.Stock(1996)研究了时间序列的经济预测。时间序列预测可以利用历史经验规律,以对经济过程的理论理解为指导,做出未来的预测。经济预测广泛用于各种活动,包括制定货币和财政政策、国家和地方预算、财务管理和金融工程。经济预测的关键要素包括:选择适合当前问题的预测模型,评估和传递与预测相关的不确定性,并防范模型的不稳定性。Michael et al.(2004)研究了非线性时间序列模型的金融预测,讨论了经济和金融时间序列非线性预测模型的估计、评估和选择的最新技术,回顾了理论和经验问题,包括预测密度、区间和点评价与模型选择、损失函数、数据挖掘和聚合。研究认为,虽然支持使用非线性模型构建预测的证据相当稀疏,但还是有理由乐观的。Lam等人(2013)的研究针对大同煤矿公司的短期股价趋势预测,提出了一种神经网络方法。选取2011年6月至2012年10月收集的每日库存记录用于模型建设,研究结果表明,该模型可以预测股票价格的走势,并利用反向传播网络预测股票价格趋势,并说明其作为金融交易员决策支持系统的潜力。

二、ARIMA模型介绍

ARIMA模型是由博克思·詹金斯于70年代初提出的一种著名的时间序列预测方法。ARIMA(p,d,q)又称为差分自回归移动平均模型。模型通过d阶差分可由非平稳的时间序列得到稳定的时间序列,通过计算能够描述序列特征的统计量来确定ARMA模型的阶数。其中,AR是自回归,P为自回归项;MA为移动平均,q为移动平均项数,d为时间序列成为平稳时所做的差分次数。

ARIMA模型的基本思想是将研究对象根据时间推移而生成的原始数据看做一个随机序列。用建立的数学模型,在对该随机序列自相关分析的基础上来近似描述这个随机序列。该模型通过检验,证明模型拟合效果较好之后,就可以通过该随机序列的过去值和现在值来对未来值进行预测模拟。由于ARIMA模型在经济预测过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对于经济运行短期趋势的预测准确率较高,是近年来应用比较广泛的方法之一,所以本文选用该模型对上证指数进行分析和预测。

三、实证研究

(一)数据采集

本文选取的数据的时间跨度为2016年2月1日至2018年10月16日,除去节假日的所有每日收盘的上证指数作为本次研究的样本数据,共有657条数据。数据来源于搜狐证券。本文将依据这些样本数据对未来数据进行短期预测,以期为投资者们提供投资指标,也為政策的决定者提供可信的依据。

(二)平稳性检验

由于股市波动较大,各类股票价格在股市里起起伏伏,以上海证券综合指数作为反映股票市场走势的参考指标,可以预测股市的走向,易于投资者们了解和研究,所以选择为样本数据的上证指数,通常波动幅度较大,是一个非平稳的时间序列。将原始序列记为X,通过统计软件做出原始数据的序列图,可以看出在2016—2017年间上证指数有一个很明显的上升趋势,而在2017—2018年间上证指数急速下降,从某种程度上表现出了股市的繁荣与衰落,跌宕起伏,所以该序列不平稳,需要进行平稳化处理。

平稳化处理一般有两种方法,一是取对数,二是进行差分,在本次研究中,选择通过差分进行平稳化处理。一阶差分后,得到序列DX,即:

DX=Xt-Xt-1    t=3,4,…,n

用统计软件做出一阶差分后的时序图(如图1所示),可以从图中看出新的序列在零的上下波动,从而初步判断一阶差分后的序列是平稳时间序列。

通过一阶差分后序列图,可以对序列进行初步的判断。然而,为了更进一步地确实序列的平稳性,需要进行单位根检验。如果存在单位根,则无法通过检验,不能进一步建立模型。单位根检验结果(如图2所示)。可以从图2中看出,t统计量的值为-25.48792,而在1%、5%、10%这三个显著水平下,单位根检验的临界值分别为-3.440105、-2.865735、-2.569062,均大于t检验的统计量,p值接近于0,所以拒绝原假设,该序列不存在单位根,是平稳时间序列。

至此,我们对本文的数据进行了基本的分析,并且对该非平稳时间序列进行了平稳化的处理。下面我们进行模型的构建与具体分析。

(三)模型的构建

综上分析,本文的单序列数据经过一阶差分后得到平稳的时间序列,所以我们选择ARIMA(p、d、q)模型对数据进行建模分析。首先需要对模型进行定阶,通过上述的平稳化处理,经过一阶差分后由原始的不平稳的时间序列可以得到平稳时间序列,由此可以确定d=1。

观察ACF图和PACF图(图3可知),偏自相关系数和自相关系数都是4阶截尾,可以看出初步估计p=4,q=4,通过反复测试,根据信息最少化原则,选择AIC最小的对模型进行定阶,最终可以得出当p=4,q=4时,AIC的值最小,为9.556 882,所以可以建立ARIMA(4,1,4)模型,以此模型进行参数估计,得出结果(如图4所示)。

基于时间序列ARIMA(4,1,4)模型对数据进行拟合,通过调整参数,使其通过显著性检验,参数估计结果如图4所示,可以看出除了常数项,其他项的参数估计P值小于0.01,在1%的显著水平下都是显著的,可以得到模型:

(四)模型检验

为了进一步确立模型建立的合理性,我们需要通过残差序列来进一步进行白噪声检验,检测ARIMA(4,1,4)模型是否已经完全提取出了数据的所有有用信息,残差序列是否是由不相关的随机变量构成的序列。我们采用统计软件来进行检验分析。观察模型ARIMA(4,1,4)的残差的自相关图和偏自相关图,如图5所示。

观察图5中显示的残差相关图可以看出,ARIMA(4,1,4)模型的残差序列的自相关和偏相关落在两倍标准差内,p值都大于0.05,说明ARIMA(4,1,4)模型产生的随机误差项是一个白噪声序列,表明我们所创立的ARIMA(4,1,4)模型顺利通过了检验,模型是有效的。

(五)模型预测

创立模型就是为了对未来某个时点的数据进行预测分析,所以我们采用已经拟合好的ARIMA(4,1,4)模型来进行数据预测。由于我们所采集的是2016年2月1日至2018年10月16日的数据集,所以基于这些数据,笔者将对2018年10月9—16日之间的交易进行模拟预测,得到下面的静态图和预测结果值(见图6和表1)。

从图6和表1所呈现的状况看,拟合的效果非常好,与实际值高度吻合,具有较好的预测效果,这也表明未来趋势的演变方向和发展预期,对实盘操作显著具有实际的指导意义。并且为了进一步验证模型的实际意义,我们将预测值和实际值进行比较,得出误差率小于10%。从预测结果来看,前两天的误差比不到5‰,精确度非常高,之后两天的误差比也在5%以内。但随着时间的推移,预测10月16日的上证指数与真实值之间的误差比达到了6.5%,说明该模型在短期内能够对上证指数有一个较好的预测,但不适用于长期预测。

四、结论

本文以2016年2月1日至2018年10月16日我国上证指数时间序列作为研究对象,在此基础上,运用成熟的时间序列建模技术构建了该样本期间ARIMA(4,1,4)模型,对我国上证指数进行了拟合和预测,并对模型拟合效果和预测准确度进行了检验,效果均良好。

由于股票市场的波动性,使得股票市场充满了不确定性,对股票价格预测是一个充满挑战性的问题。但时间序列预测理论一直被认为是对股价变化进行统计预测的有效手段,因为时间序列预测理论具有很好的短期预测效果。目前,用于预测时间序列趋势的方法相对来说较多,如灰色预测、指数平滑、门限自回归等方法,每个方法都有一定的预测优势,但同样存在一定的不足之处,因为每一个方法在创立之初都是为了解决特定问题。本文所采用的ARIMA模型在经济领域相对来说是效果较佳的一种预测方法。从最后的预测结果与实际发生值之间进行对比发现,在未来4个交易日的预测较好,表明该模型在股票短期预测中能得到较好的结果。

另外,股票市场的实际波动比较大,受很多的影响因素干扰,如市场风险、政治风险、技术风险等。单纯仅靠一个模型去做预测是不够的,甚至有时候用同一指标的不同时间段的数据进行预测都会得出不同的预测结果,因此,需要结合其他方法与经济事实进行综合判斷。

参考文献:

[1]  J.H.Stock.Time series:Economic Forecasting,1996:15721-15724.

[2]  Michael P.Clements et al.Forecasting economic and financial time series with non-linear models.International Journal of Forecasting,2004,(20):169-183.

[3]  Cao Wen,Han Ying,Lam Sarah S,IIE Annual Conference.Proceedings,Short-Term Stock Price Trend Prediction of an Emerging Market Using Neural Networks,2013.

[4]  孫碧波,方健雯.对中国证券市场弱态有效性的检验——基于技术分析获利能力的实证研究[J].上海财经大学学报,2004,(6).

[5]  贺本岚.股票价格预测的最优选择模型[J].统计与决策,2008,(6).

[6]  成城.基于GARCH模型的上证指数波动率特征分析[D].济南:山东大学,2014.

[7]  王惠星,林嘉喜.基于ARIMA模型的上证50指数的分析及预测[J].时代金融,2017,(24).

[8]  徐珍,李星野.小波ARMA模型和ARIMA模型对上证指数的预测效果探究[J].现代商业,2012,(30).

[9]  吴小强,吕文龙.股票价格指数的趋势预测——基于上证指数数据的时间序列分析[J].金融经济,2012,(20).

[10]  刘云.ARIMA对我国上证指数的预测研究[J].现代商贸工业,2012,(16).

[11]  高铁梅.计量经济分析方法与建模Eviews应用及实例[M].北京:清华大学出版社,2006.

Abstract:In recent years,Chinaundefineds capital market has developed rapidly.The stock market has attracted a lot of capital.The stock price,as an important index reflecting the economic strength and development level of enterprises,has been paid more and more attention.As a comprehensive index to reflect the changes in the stock market,the Shanghai stock market index is conducive to market participants to analyze the market.Therefore,selecting the closing price of the Shanghai Stock Exchange Index from February 1,2016 to October 16,2018 as the research data,establishing a ARIMA model to forecast and analyze the future Shanghai Stock Exchange Index,with a view to providing investment indicators for the vast number of investors,To provide a reliable basis for the decision-making of enterprise policy.

Key words:ARIMA model;prediction;time series;Shanghai stock index

猜你喜欢

ARIMA模型时间序列上证指数
国际油价对股票市场的影响研究
上证指数VaR和CVaR的比较研究及实证分析
上证指数VaR和CVaR的比较研究及实证分析
基于时间序列模型的中国出口总额分析及预测
基于R软件的金融时间序列的预测分析
基于Eviews上证综合指数预测
基于时间序列的我国人均GDP分析与预测
基于线性散列索引的时间序列查询方法研究
基于ARIMA模型的沪铜期货价格预测研究
融资融券对我国上证指数波动影响的实证分析