APP下载

几种异质自回归实现波动率模型的有效性

2017-01-23芮明娣

价值工程 2016年35期
关键词:波动约束损失

芮明娣

摘要:本文对 HAR-RV-CJ 模型了进一步的改进,提出的假定模型回归系数为1的整合的IHAR-RV-CJ模型,实证对比了HAR模型,含跳的HAR-J和HAR-CJ模型在系数通过合理的约束为整1后以及原始模型对中国股市波动率的刻画和预测问题。实证结果显示, 在四种损失函数综合对比下,IHAR模型同样适用于刻画对中国股市波动率,相对于原始模型提高了模型的预测精度,且我们所构建的IHAR-RV-CJ模型预测的有效性要高于IHAR-RV-J模型。

Abstract: This paper further improves the HAR-RV-CJ model, puts forward the integrated IHAR-RV-CJ model which the assumed model regression coefficient is 1. The empirical comparison of the HAR model is carried out. The jumpy HAR-J and HAR-CJ models are compared when the coefficients are reasonably constrained to be 1. The description and prediction of the volatility of Chinese stock market by the original model are put forward. The empirical results show that the IHAR model also can be used to describe the volatility of Chinese stock market with the comprehensive comparison of the four kinds of loss functions. Compared with the original model, the prediction accuracy of the model is improved, and the validity of IHAR-RV-CJ model is higher than that of IHAR-RV-J model.

关键词:integrated HAR;HAR-RV-J;HAR-RV-CJ

Key words: integrated HAR;HAR-RV-J;HAR-RV-CJ

中图分类号:F224 文献标识码:A 文章编号:1006-4311(2016)35-0183-04

1 引言和文献综述

金融市场的快速发展,新的、复杂的金融工具不断更新,对金融时间序列波动率的理论和经验知识的需要日渐增长。金融计量学,特别是金融波动率的建模在当前资产定价和风险管理理论上扮演了重要的角色。一般来说,由于市场真实潜在的波动率是不可观测的,这是使用波动率建模的一个固有难题,在现代金融研究中具有一定的挑战性。

Engle(1982)的自回归条件异方差模型(ARCH),Bollerslev(1986)的广义自回归条件异方差模型(GARCH),以及Taylor(1986)的随机波动率模型(SV)是早期预测波动率的主要模型,为了更好地描述波动率的典型事实,学者们研究了众多有关GARCH和SV模型,并且提出了相对应的拓展模型,例如EGARCH,GJR-GARCH,APARCH,FIAPARCH,HYGARCH指数加权移动平均模型(EWMA),以及McAleer(2005)关于近期一系列单变量和多变量条件随机波动率模型等。必须要指出的是,不管是早期的GARCH和SV模型,还是拓展模型都是基于低频数据去表征和预测未来条件波动率。

2004年,Corsi基于Muller的异质市场假说理论提出了在无市场摩擦且无跳跃扩散过程假设下的异质自回归实现波动率HAR-RV(Heterogeneous Autoregressive-Realized Volatility)模型,并通过外汇市场的实证研究证明该模型能较好地刻画已实现波动率的长记忆特征,并具有良好的预测能力。HAR-RV模型的提出为已实现波动率的特征刻画及预测研究开辟了一个新的领域,许多学者在Corsi(2004)的研究基础上进行后续研究,提出了一系列扩展模型,并进行了大量实证研究。Anderson,Bollerslev and Diebold(2005)将已实现波动率分解成连续和跳跃两种不同的成分,并提出了模型,实证研究表明,相较于HAR-RV模型,该模型可显著提高对波动率的预测精度。Corsi et al.(2010)基于的跳跃项进行修正,提出了HAR-RV-TCJ模型,实证得到了比HAR-RV-CJ更好的预测精度。

自Corsi(2004)提出HAR-RV模型以来,通过对 HAR-RV模型改进提出新的波动率模型的研究越来越多,其中 Anderson 等(2007)提出的 HAR-CJ模型已被证实对金融市场波动率具有不错的度量和预测能力。Cho和Shin(2016)提出了一个新的战略约束:系数和为1的HAR模型,称这个模型为“integrated HAR”,即IHAR模型。Cho和Shin(2016)通过蒙特卡洛证明IHAR模型在预测方面较HAR模型更有优势,且表现了更明显的长记忆性,并且实证结果证明这种带系数约束的HAR模型比原始的HAR模型的预测精度要高。对于对波动率的度量和预测来说,精度越高越有利于金融风险度量、金融资产定价、金融衍生品定价等金融实务问题的分析。本文结合IHAR模型的改进技巧,对HAR-RV-CJ模型做进一步的改进,验证这种约束对HAR-RV-CJ模型的金融市场波动率的度量和预测能力的提高是否同样有效,并实证研究HAR模型,含跳的HAR-J和HAR-CJ模型在系数通过合理的约束为整1后的模型对中国股市波动率预测的精准性。

2 模型的定义

2.1 HAR模型

从近期的已实现波动率模型的研究文献中发现,异质自回归模型(HAR-RV)(Corsi,2009)是最受欢迎的模型之一。尽管它的结构简单,由三个滞后的日,周,月已实现波动率构成,却能有效地描述长记性等已实现波动率的典型特征,并且具有很高的预测精度。它的标准形式为:

随后Anderson 等(2007)考虑到市场中微观结构噪声,在HAR-RV模型基础之上直接加入了跳跃性变量,由上一节所示。提出了带跳的HAR-RV-J模型,它的形式为:

然而这种跳不明显,对模型的预测精度影响不大,Corsi等(2009)基于Huang 和Chen(2005)显著跳的检验(公式如上),提出了修正的跳的HAR-RV-CJ模型HAR-RV-CJ,它的一般形式为:

2.2 Integrated HAR模型

Cho and Shin(2016)基于Corsi(2009)的HAR-RV模型提出了一个新的预测已实现波动率的方法,就是在HAR基础上加一个约束项,令HAR模型的滞后项系数和为1,得到了一个新的模型,称为整合的HAR模型(integrated HAR,IHAR),它的形式为

此处变量的含义同2.1中变量的含义一致。

为了验证这种约束对其他HAR类模型,尤其是含跳的模型的预测精度的影响以及这种IHAR模型对中国股市的适用性,本文在前4个模型的基础之上,再提出两种这种带有系数约束的,HAR-RV-和HAR-RV-CJ模型,它们分别重新参数化可以表示为:

考虑到已实现波动率序列的异方差性,这里考虑残差序列εt+1为GARCH(1.1)来估计。

3 波动率预测和有效性检验的方法

3.1 波动率预测方法

对上面讨论的6种异质自回归模型采用了基于滚动时间窗(Rolling time windows)预测方法的“样本外预测能力检验”(Tests for out-of-sample predicting ability)。具体步骤如下:

其中L1和L2分别是平均平方误差(Mean squared error,MSE)和平均绝对误差(Mean absolute error,MAE)。L3和L4分别是异方差调整的MSE和MAE(Heteroskedastic adjusted MSE and MAE)。这4种损失函数是近期文献中使用较多的几种形式,如Liu 和 Wan(2012)等都采用了这4种损失函数。

需要说明的是,如果在一次实证研究中采用某一种损失函数Li作为评判标准,得到模型A比模型B的损失函数值小的话,由此我们只能判断,在这样一个特定的数据样本,采用这一特定的损失函数Li时,模型A比模型B的预测精度要高。所以可以明显看出,这一结果是不稳健的,是无法推广到其他类似数据样本或者损失函数上的。

为了比较各个HAR模型和IHAR模型的预测精度,综合使用上述损失函数,本文采用Cho和Shin(2016)用过的损失函数值有效性对比来更直观地观察加约束后的HAR模型与原始模型预测精度的优劣。

对于每个HAR模型和IHAR模型,我们首先计算各个波动率预测模型的h=1,5,22,244个向前预测值得损失函数值,然后计算相对有效性,相对有效性公式可以表示为(以损失函数MAE为例):

(MAE)相对有效性=HAR模型h个预测值的损失值/IHAR模型h个预测值的损失值

一般来说,损失函数的值越小,表明预测的越准确,即预测精度越高,所以,这里的相对有效性大于1,则表明IHAR类模型的预测效果较优。

4 实证分析

4.1 数据说明

本文研究的数据样本为上证综指(SSEC)从2006.1.4-2015.12.31的日内五分钟高频交易数据,共包含2429个交易日,交易时段为9:30-11:30,13:00-15:00,每个交易日观测48个5分钟交易数据,共计116592个观测值。定义5分钟上证指数价格为Pi,t,i=1,2,...,48,t=1,2,...,2429。Pi,t表示第t个交易日的第i个观测值。因此,每日收盘价格可表示为P48,t,则5分钟高频收益可表示为

Ri,t=100(log(Pi,t)-log(Pi-1,t))

每日收益可表示为Rt=100(log(P48,t)-log(P48,t-1))。

4.2 模型的估计

根据Andersen and Bollerslev(1998)的定义,对第t天的实现波动率的计算表示为第t天内的高频收益平方和,所以上证指数的已实现波动率可表示为由计算出来的RV,J和CJ值估计出6个模型的参数,结果如表2所示。

由表2可以看出,系数约束的IHAR,IHAR-J和IHAR-CJ模型相对于原始模型的参数估计结果的标准差相差不大,但是都有不同程度的变小,这证明参数估计的结果可信度较高,IHAR-J和IHAR-CJ模型是可行的。 另外,系数约束的模型的βd和βw项估计大小基本相同,而βm在IHAR和IHAR-J模型中都显著变大了,这证明长期项的波动率的影响加大了。

4.3 有效性分析

表3是HAR,HAR-J和HAR-CJ模型相对于对应的系数约束的整合的模型的有效性对比结果。依据损失函数值越小,预测精度越高的原理,若结果大于1表示系数约束的整合模型的有效性越好,即预测效果越好。

由表3可以看出,所有的值都大于1,这表示IHAR类模型的预测准确性更高。可见在中国股票市场中,系数通过约束后的模型预测精度都明显比原始的预测精度要高,且Cho和Shin(2016)已经通过实证证明,S&P500指数,NASDAQ指数及两种外币汇率波动率的IHAR模型的预测精度要优于HAR模型,通过本文对中国上证指数的实证研究可以得出,这种IAHR模型对中国股市同样适用。但究竟哪种模型更好呢?因此接下来将比较IHAR,HAR-J和IHAR-CJ三种模型的预测优劣,同样通过对比损失函数值,观察有效性值。见表4。

由表4的第二,三列可以看出IHAR模型比IHAR-J模型和IHAR-CJ模型的预测准确性更好,虽然第三列的HMAE损失函数下的有效性小于1,但也几乎接近于1了,综合看来还是IHAR模型预测更准确。从第四列可以看出,除去MSE损失函数下IHAR-J相对于IHAR-CJ的有效性小于1,但其他三个都大于1,所以可以认为IHAR-CJ模型的预测准确性更高。这表明在中国股票市场中,结合IHAR模型的改进技巧,对HAR-RV-CJ模型做进一步的改进得到的IHAR-CJ模型优于IHAR-J模型。

5 结论及展望

本文把由Cho和Shin(2016)提出的假定模型回归系数为1的这种约束应用到了HAR-RV-J和HAR-RV-CJ模型中,并以中国股票市场最具代表性的股价指数-上证综指的五分钟高频(High-frequency)数据样本为例,估计了以HAR-RV、HAR-RV-J和HAR-RV-CJ模型为代表的异质自回归类模型,以及加了系数约束的IHAR-RV、IHAR-RV-J和IHAR-RV-CJ模型。并考察了这6个模型对中国股票市场波动性预测的准确度,在四种损失函数综合对比下,发现IHAR模型对于中国股市同样适用,且在所有的模型中IHAR模型对中国股市市场的预测精度最高。含跳的HAR-J和HAR-CJ模型在系数通过合理的约束为整1后,HAR-RV-J和HAR-RV-CJ模型的预测精度都有所提高,对中国股票市场而言,IHAR-RV-CJ模型预测的有效性要高于IHAR-RV-J模型。

本文的研究和实证结果对于研究我国金融市场的定价、资产配置、以及风险管理具有非常重要的理论价值,未来还会致力于寻找更适合刻画中国金融市场的模型。

参考文献:

[1]Andersen, T. G., Bollerslev, T., & Diebold, F. X. Roughing it up: Including jump components in the measurement,modeling and forecasting of return volatility.The Review of Economics and Statistics.2005,89: 701-720.

[2]Bollerslev T. Generalized autoregressive conditional heteroskedasticity[J]. Journal of Econometrics, 1986, 31: 307- 327.

[3]Corsi,F.,A simple long memory model of realized volatility.Manuscript,University of Southern Switzerland.2004.

[4]Corsi,F.,A simple approximate long-memory model of realized volatility. Journal of Financial Econometrics .2009,7:174-196.

[5]Corsi,F.,Pirino,D.,&Reno,R.,Threshold bipower variation and tye impact of jumps on volatility forecasting.Journal of Econometrics,2010,159(2):276-288.

[6]Engle,R.F.,Autoregressive conditional heteroskedasticity with estimates of the variance of United Kingdom inflation.Econometric.1982,50:987-1007.

[7]Hansen P R, Lunde A. Consistent ranking of volatility models[J]. Journal of Econometrics, 2006,131:97- 121.

[8]Huang,X.,Tauchen,G.,The relative contribution of jumps to total price variance.J.Financ.Econ.2005,3(4):456-499.

[9]Li Liu, Wan Jieqiu,A study of Shanghai fuel oil futures price volatility based on high frequency data:Long-range dependence,modeling and forecasting.Economic Modelling. 2012,29:2245-2253.

[10]McAleer, M., Medeiros, M.C., A multiple regime smooth transition heterogeneous autoregressive model for long memory and asymmetries. Journal of Econometrics .2008,147 (1):104-119.

[11]Soojin Cho, Dong Wan Shin,An integrated heteroscedastic autoregressive model for forecasting realized volatilities.Journal of the Korean Statistical Society.2016.

[12]Taylor, Stephen J. Modeling Financial Time Series, John Wiley and Sons,Chichesters,1986.

猜你喜欢

波动约束损失
“碳中和”约束下的路径选择
胖胖损失了多少元
约束离散KP方程族的完全Virasoro对称
羊肉价回稳 后期不会大幅波动
微风里优美地波动
2019年国内外油价或将波动加剧
玉米抽穗前倒伏怎么办?怎么减少损失?
干湿法SO2排放波动对比及分析
一般自由碰撞的最大动能损失
损失