APP下载

基于Logistic回归的股价上涨概率预测研究

2020-04-17王文轩蔡伟宏

中国市场 2020年6期
关键词:股票价格

王文轩 蔡伟宏

[摘  要]将Logistic回归应用在多因子模型时,模型可利用反映股票涨跌信息的因子与股票收益率的历史数据实现Logistic回归对未来股价上涨概率的预测。实证分析结果显示,2012—2018年间运用Logistic回归筛选出的大概率上涨的股票组合可获得较高的平均收益率、胜率和夏普比率,Logistic回归在沪深市场上可成功发挥其对股价上涨概率的预测功能。

[关键词]Logistic回归;多因子选股;股票价格

1  引言

作为证券投资学中的重点研究问题,股票价格预测对帮助投资者做出理性投资决策及推动我国金融市场稳定发展有着重要意义。21世纪初,Logistic回归模型在统计学和金融学领域的应用逐渐被引起重视,如Hulisi and Ramazan(2009)发现Logistic回归可用于判别股票价格有无人为干预;张德鸿(2016)提出以通货膨胀指数等作为宏观经济指标,运用Logistic回归模型可预警系统性金融危机;邵志高(2017)探究了以收入异动预测未来股票高收益概率的Logistic回归模型应用方法。利用Logistic回归的预测功能,文章提出基于Logistic回归的多因子选股模型在沪深市场上的应用方法,并利用历史数据回测验证其有效性。

2  模型构建

套利定价理论作为线性多因子模型的理论基础,假设风险资产均衡收益与多个因素之间呈线性映射关系。若使风险资产均衡收益与多个因子之间呈现“Sigmoid”函数的非线性映射关系,便可得到基于Logistic回归的多因子选股模型。

Logistic回归模型属于广义线性回归模型,与其他广义线性回归模型不同的是,Logistic回归模型的因变量是二分类或多分类的。文章实证研究使用季度数据,当个股i次季度收益率大于沪深300指数次季度收益率时,记响应变量=1;当个股i次季度收益率小于沪深300指数次季度收益率时,记响应变量=0。由于因变量在每次观测中服从两点分布,我们便构造了=1和=0的二分变量矩阵。设概率函数表示在一次试验中事件发生的概率(),即次季度个股i收益率大于次季度沪深300指数收益率事件发生的概率,构造Logistic回归方程:

3  实证分析

3.1 样本数据处理

文章选取2012年第一季度至2018年第二季度,共计26个季度的市盈率(PE)、營业收入增长率(ir_MBR)、净资产收益率增长率(ir_ROE)、净利润增长率(ir_NP)和资产负债率(DA)作为反映股票涨跌信息的因子,选取沪深300指数收益率作为业绩基准,并采用沪深300指数成分股的个股的指标作为模型构建的指标。为使模型具备对次季度收益率的预测作用,样本数据中季度收益率数据要比因子指标数据滞后一期,即研究当期成分股收益率与上期成分股因子指标的相关性关系,样本数据来源为RESSET锐思数据库。

剔除数据缺失严重及2012年之后上市的股票,剔除ST股票,进行股票样本处理后,本文将从含有259只股票的股票池样本数据中选取股票构建投资组合。

3.2 模型应用

根据条件概率结果,通过Logistic回归求得中的各个自变量的回归系数,然后将各季度每支个股的因子值代入概率公式,即可求得每支个股次季度跑赢沪深300指数的概率。

3.3 策略回测

经过ROC曲线检验,上述回归均有较好的拟合优度。将2012年第一季度至2018年第二季度的每个成分股的解释变量代入公式,即可得到各季度中各股票的个股次季度收益率大于沪深300指数季度收益率事件发生的概率。通过对每个季度成分股的次季度收益率跑赢沪深300指数次季度收益率的概率值由高至低进行降序排序,选取概率最高的10只股票在下个季度初等权重买入,构建投资组合。因为构建模型时所用的季度收益率滞后于因子指标一个季度,所以回测时间段为2012年第二季度初至2018年第三季度末。

本文在模型回测时将收益率数据分为两组:Logistic预测组和被动指数组。在Logistic预测组中,在2012年第一季度末第一次买入投资组合,至2018年第二季度末最后一次买入投资组合,权重配比方法为等权重地在26个季度中不间断投资;在被动指数组中,被动地投资沪深300指数基金,不进行选股。

相对于被动指数组的策略收益波动率12.84%,Logistic预测组的策略收益波动率高达19.56%,表明基于Logistic回归的多因子选股策略需要承担的风险相对较大,收益不如被动指数组稳定。虽然Logistic预测组的收益波动较大,但是其胜率在两组中表现较好,达到了80.77%,说明大部分季度中Logistic预测组都成功构建了正收益的投资组合。Logistic预测组的平均季度收益率11.35%大于被動指数组的平均季度收益率2.09%,Logistic预测组能得到相对沪深300指数较高的平均收益。最后,Logistic预测组28.57%的收益回撤比率和0.58的夏普比率远高于被动指数组,表明Logistic预测组在承担每单位风险的同时可以取得较高的股价上涨带来的收益。

4  结论

文章提出了Logistic回归在多因子模型中发挥其股价上涨概率预测功能的应用方法。利用Logistic回归能够起到预测作用的特性,文章通过对次季度259只成分股个股收益率大于次季度沪深300指数收益率的概率排序,构建了每个季度的投资组合。实证结果表明,应用Logistic回归模型的预测功能进行回归法量化选股时,虽然在投资过程中收益率波动较大,但是相对地可以获得在承担每单位风险下的较高的超额收益,Logistic回归在沪深市场上可成功发挥其对股价上涨概率的预测功能。

参考文献:

[1]张德鸿.基于Logistic回归的系统性金融风险研究[J].重庆理工大学学报,2016(3):137-146.

[2]邵志高.基于二元logistic回归模型的收入异动影响未来股票收益研究[J].湖南科技大学学报,2017(5):103-111.

[3]刘辉,黄建山.中国A股市场股票收益率风险因素分析:基于Fama-French三因素模型[J].当代经济科学,2013,35(4):27-31,125.

[4]HAN J, MORAG C.The influence of the sigmoid function parameters on the speed of backpropagation learning[J].Lecture Notes in Computer Science,1995:195-201.

[5]HULISI, RAMAZAN. Detecting stock-price manipulation in an emerging market: the case of Turkey[J].Expert systems with applications,2009,36(9):11944-11949.

[6]FAMAAND M. Risk, return, and equilibrium:empirical tests[J]. Journal of Political Economy,1973(81):607-636.

[作者简介]王文轩(1997—),男,黑龙江哈尔滨人,本科,研究方向:金融市场;蔡伟宏(1975—),男,福建福清人,博士,副教授,研究方向:金融市场。

猜你喜欢

股票价格
基于GARCH族模型的重庆啤酒股票价格波动研究
论股票价格准确性的社会效益
我国股票价格指数与“克强指数”的关系研究
基于多元回归与技术分析的组合股票价格预测