APP下载

基于大数据的股票量化投资策略研究

2020-04-14韩艳培对外经济贸易大学

新商务周刊 2020年2期
关键词:方差波动动态

文/韩艳培,对外经济贸易大学

1 研究背景与研究意义

1.1 研究背景

早在20 世纪70 年代量化投资概念就已经出现,关于量化投资理论的研究和应用在近50 年里取得了较大的进步,据统计,美国华尔街超过70%的对冲基金采用量化投资策略进行投资。随着我国资本市场尤其是证券金融市场的发展和完善,我国各类投资机构结合量化投资策略进行的投资活动开始活跃起来。在我国率先使用量化投资策略进行投资的主要是结合各种ETF 进行的套利操作,但由于当时国内投资数据较少,对信息技术的应用还不充分,因此并没有十分突出的量化投资策略出现。但随着大数据、云计算以及外国各种投资策略的引进,我国在量化投资领域的研究和应用水平正迅速提高,并在各个投资领域逐渐得到了大规模的应用。

1.2 研究意义

从国内外对量化投资研究结果和实践结果来看,使用量化投资策略的投资基金大部分都获得了较为持续稳定的回报。其中最有名的是詹姆斯·西蒙斯,其于1989 年创立的Medallion 量化基金几十年的收益率远远高于道琼斯工业指数。可见使用量化策略进行投资的确是一种有效的投资策略。虽然基于大数据的量化投资的研究和应用并没有太悠久的历史,但其基本的策略思路与传统的投资策略基本相同,同样需要对指数以及投资标的的相关数据进行分析。通过对个股基本面和技术面的研究,结合宏观经济形势和相关政策可以找到获得超额收益的投资途径。传统的投资分析方法主要依靠投资者的主观判断和个人经验,而量化投资则是对投资者投资理念的定性研究和分析,从而设计出一个令人满意的投资模型。量化投资的投资优势主要有以下四点。

系统性:量化投资模型设计之初就是从多层次、多角度分析各类数据得出的,通过对这些数据的分析和整合发现投资领域的套利机会,从而捕捉更多的投资机会。量化投资分析的数据不仅包括宏观经济周期数据,还包括个股基本财务数据和历史交易等数据。

纪律性:量化策略具体操作由系统自动完成,不依赖人的主观判断,因此不会因为市场大幅波动而产生情绪变化,能够克服投资中人性的贪婪和恐惧等弱点。

分散化:量化投资的另外一个特点是不把鸡蛋放在一个篮子里,其投资策略往往会选出一系列的投资组合,组合中往往有一定的对冲成分用于对冲和分析风险。量化投资追求的是在降低投资风险的同时实现稳定收益而不是简单地押注一只或几只股票。

及时性:量化投资模型有计算机执行,会根据市场行情数据计算调整投资策略,其对于市场热点变化和大资金流动十分敏感,因此可往往能够在市场波动的瞬间抓住投资机会。但由于量化投资则自身资产规模的限制,其调仓周期也可能因为规模较大而延长,虽然量化投资模型具有较大的及时性,但实际量化投资的执行依然可能滞后于市场的实际波动。

综上所述,通过研究量化投资可以让投资者在实际的股票交易中找到较为稳定的获取超额收益的投资策略。并且,对于传统投资者而言,研究量化投资策略不仅有助于其获得较高的投资收益,也更方便其理解机构的投资策略,从而为投资者的投资决策提供更好的参考。

2 量化模型建立及投资策略

2.1 动量因子

导出一个测量一段时间内隐式随机值模型动量变动,考虑单一随机过程,即:

式中,μ是收益率的平均值,P 是价格,dz 遵循Wiener 过程,σ是收益率的波动率。令X=lnP(t),得出:

进而得出:

将式(1)带入式(3),得:

式(4)离散化,得:

根据式(5),结合已知的数据,可得隐含随机值的求取公式:

然后得出看涨动量因子模型:

2.2 多维风险因子

传统的投资风险评估方法主要基于股价出现波动变化,对流动性风险的度量以及对波动风险的度量。尽可能使投资策略在综合风险较小时盈利可能性较大时运行,从而表现出看涨或看跌的向量特征。主要考虑以下三个随机过程:

其中,Ψ为方差均值,LQ 表示流动性,σv是股价方差之标准差,这里把流动性定义为V/[(H-L)×107],其中,H 和L 分别表示股价的最高价和最低价,V 表示个股成交量,k 表示标的个股的流动性均值,σLQ表示流动性标准差。dU、dQ 和dW 均为维纳过程。

由伊藤引理得:

将以上等式带入,得到多维风险的偏微分方程:

进而得出式(14)的积分为:

N()10是基于10 天滚动均值和方差的正态分布的累积分布函数,得出看跌多维风险因子模型:

2.3 方差比因子

假设股票价格波动随机,q 天内其股票收益率是单日收益率方差的q 倍。得到改进的因子模型:

其中,q 等于29,Var51为46 日的滚动方差。并且在看跌动态模型中,φ*=φ。

2.4 效率因子

计算股价位移与距离的比值用于表示一定时间内股价的走势

当η→1 时,表示股价趋势性较强,当η→0 时,表示股价的随机性较强。其中,看跌动态模型中的η*为4 日滚动计算的效率因子。

2.5 正负反馈因子

假设在模拟股票交易市场中,其价格变化特征是非线性的,由此建立一个因子模型:

可以得出看跌动态模型中反馈因子为:

通过模型整合,得到指数平滑模型。

看涨动态模型为:

看跌动态模型为:

模型中,其系数λ和λ*并不符合取值范围的情况,也有可能会出现,因此,在本文中设定其指数的初始值为0,且阈值小于等于1,以尽可能地避免指数平滑模型失去意义。

3 数据描述

本文采用2004.3.8-2014.7.1 间沪深 300 指数数据用于模型验证。数据来源于 wind 数据库金融终端。定义收益率为:Rt=1nPt-1nPt-1。根据ADF 检验的结果,得出结论样本的收益率为平稳序列,其显著拒绝了被检验序列存在单位根的原假设。根据ARCH-LM 检验,可以得出这一结论,即其股票交易的收益率的波动率,呈现较为显著集聚效应。另外,为了进一步保障收益,可以对动态模型进行数据整合检测,尤其是结合历史数据检测,我们先将买卖双方的交易成本设置为0.25%,并设置了150 个滑动点。交易遵循T+1 规则。当买卖后出现连续信号时,只有第一信号才是买卖决策的判定依据。

以模型交易后验数据来看,可知引入上述的动态模型,能够在很大程度上提高其高盈利的成功率,同时进一步降低交易频率,并减少交易成本,从而充分保障其盈利状况。从平均收益的角度来看,该策略最大回撤相对较小,风险控制能力较好,相比于沪深300 指数能实现较高的超额盈利。动态模型的最大持仓周期达到99 天,表明了该模型能够实现对趋势的长期跟踪。通过比较样本期内样本的波动和买卖区间的标准差,不难发现买入区间的标准差最小,说明该模型能够较好地抵抗波动风险,模型策略性能较好。

猜你喜欢

方差波动动态
国内动态
国内动态
国内动态
概率与统计(2)——离散型随机变量的期望与方差
2021年麦市大幅波动概率不大
供需略微宽松 价格波动缩窄
动态
11月汇市:波动率降低 缺乏方向
方差生活秀
揭秘平均数和方差的变化规律