APP下载

基于岭回归的有色金属行业股票价格影响因素分析
——以洛阳钼业为例

2022-12-16李伯超

中国商论 2022年23期
关键词:共线性股票价格因变量

李伯超

(伯明翰大学数学学院 英国伯明翰)

有色金属是我国工业发展的重要材料,无论是在国防军工产业还是在现代工业和新型农业领域,都具有战略意义,有色金属上市公司的价值评估变得愈加重要。后疫情时代,经济全球化浪潮的席卷之下,有色金属公司的市值剧烈波动,同时有色金属原材料及相应金融衍生品的价格变化幅度较大,也加剧了有色金属公司价值估计结果的不准确性。在实际估值分析时,张谊然(2013)基于岭回归设计并建立了回归模型,通过引入今日股票的开盘价、最高价、最低价来对收盘价格进行预测。万丽颖(2016)详细阐述了岭回归模型预测过程,对如何选取岭参数提供了理论支撑。韩鸣、宋淑鸿(2020)通过岭回归模型将影响估计结果的影响因子进行分析、筛选,通过再次整合回归模型,使回归模型具有更好的预测效果。

本文的研究目的是通过建立岭回归股票价格预测模型、价格影响因素模型筛选出对股票价格产生影响的财务指标。

1 岭回归分析法

1.1 岭回归分析与普通最小二乘估计

在使用普通最小二乘估计时,当自变量之间存在多重共线性时,估计结果的方差偏大。股票价值分析时,由于自变量往往从财务指标中选取,财务指标之间大多存在多重共线性,严重影响估计结果的准确程度。

假设存在线性回归y=β0+β1x1+β2x2+β3x3+e,其中随机误差项e符合正态分布,随机生成参数β0= 0.439,β1=0.382,β2= 0.766,β3= 0.795,自变量x1~x3,符合正态分布的误差项ei,计算得出相应的因变量yi。

当相关系数和随机误差项未知时,本文通过最小二乘法可以估计出参数β0~β3,通过数据统计计算得出β0=-0.6243,β1=-2.1158,β2=4.8097,β3=2.7520,与随机生成的原始数据相差甚远。通过分析我们可以计算出该线性模型的相关系数为0.3833,可以得出结论:多重共线性使模型估计结果出现误差。

1.2 多重共线性的判断

方差膨胀因子是用来衡量所选变量和其他变量之间多重共线性关系的指标。公式为:

其中,VIFi代表所选取的第i个变量的方差膨胀因子;代表第i个变量与其他变量之间的相关系数。

当方差膨胀因子超过10时,本文认为该变量存在多重共线性的问题,方差膨胀因子越大,多重共线性越严重。

1.3 岭回归分析基本原理

岭回归分析是一种改良版的最小二乘分析方法。从一般形式的线性回归方程组角度进行分析,通过Xβ=Y可以得到β=(X'X)-1X'Y,其中X'是X的转置矩阵。在进行最小二乘估计时,一般假设X矩阵为满秩,即 |X'X|≠ 0;当|X'X|=0时,通过最小二乘估计的待解矩阵β就会产生较大误差。

由于多重共线性存在,导致X矩阵不为满秩,即|X'X|=0,因此本文通过构建X'X+KI矩阵来达到减小误差的目的,其中I为单位矩阵,k> 0。经过整理后的岭回归估计为:

其中,k为岭回归参数。

从最小二乘法的矩阵形式来看,岭回归与最小二乘法的区别在于将估计系数向零收缩。给定响应向量y∈Rn预测矩阵y∈Rn*p,定义岭回归系数

在构建新的矩阵之后,需要对岭回归参数进行分析,在对k值进行选取时,一般采取岭迹法。岭迹法是一种通过分析k与β(k)之间的关系,选取合适岭回归参数的方法。β值随着k值的变化而变化,选取k值时,要注意选取β值稳定时的k值。

2 岭回归价格影响因素模型

构建价格影响因素模型可以分析不同财务指标对价格的影响,筛选出有效变量,剔除影响模型准确度的变量。以洛阳钼业公司近十年的财务指标为影响因素的选取范围,选取了流动比率x1、速动比率x2、现金比率x3、营运资金与借款比x4、资产负债率x5等13个指标作为变量进行研究(数据来源:国泰安数据库)。

2.1 价格影响模型实验分析

本文通过使用各个因变量建立回归方程,再对方程中的预测变量进行多重共线性分析,从而计算得出各个因变量的方差膨胀因子,得到绝大部分自变量方差膨胀因子大于10,超过半数自变量方差膨胀因子大于100,由此可以判断因变量之间存在严重的多重共线性。为了消除多重共线性的影响,本文使用岭回归对数据进行分析。岭回归分析需要确定岭回归参数k,对回归方程进行岭回归分析,绘制出体现岭回归系数变化的岭迹图(见图1)。

图1 岭迹图

由图1k值变化趋势可以看出:在(0.3,0.5)区间内,k值变化逐渐趋于平稳,从图1得出:当k=0.4时,β值变化趋于稳定;从数据中可以看出,当k值较小时,β值变化较大;当k=1.0时,自变量x6、x8、x9、x10、x11、x12、x13的k值趋近于0,表示此类变量在对预测模型结果方面属于无效变量,因此将此类变量筛除,以提高预测的有效性、准确性。

将筛除无效变量后得到的数据按0.8∶0.2的比例分成训练集和测试集,将训练集数据构建模型。在分析自变量时,由于选取分析数据属于时序数据,不同自变量对因变量产生了共同作用,因此必须考虑多元回归交叉项的影响。对x1、x2、x3、x4、x5进行相关性检验来确定各个因变量之间的相关性,在此仅考虑二阶多元回归交叉项,绘制出直观表现各个自变量间关系数的图像,如图2所示。

图2 各个因变量间相关性

由图2可知,绝大多数二阶多元回归交叉项都具有高度相关性,相关系数超过了0.8,结合时序数据特点,可以确定多元回归交叉项会对预测结果产生重要影响,此时回归方程为:

通过select函数重新确定本模型k= 0.001984597,下一步将k= 0.001984597重新代入岭回归模型,此时得出模型公式为:

2.2 价格影响模型拟合评估

在构建岭回归模型后,将测试集数据代入模型进行拟合评估。此时,我们选定k= 0.001984597,将拟合结果与实际结果转换为矩阵格式,形成两组数据进行显著性分析,我们采用独立样本的t检验法得到结果:p值为0.3365,置信区间为(-1.9207094,0.7113052),说明在α= 0.05条件下,拟合结果与实际结果并没有显著性差异。

从其他统计量来看,平均绝对误差MAE=0.691095,均方根误差RMSE=0.916156均处于较低水平,从另一方面证明了两组数据没有显著性差异。

2.3 价格影响模型结果与实际意义分析

模型筛选出的影响因子x1、x2、x3、x4、x5分别表示不同的实际意义:

流动比率是唯一对模型结果产生负向影响的一阶影响因素,代表着公司偿债和变现能力。洛阳钼业公司流动比率与股票价格成负相关,究其原因还要结合速动比率进行分析。速动比率与股票价格成正相关,对应财报会计科目为银行存款,库存现金等极易变现并可直接进行偿债的资产。结合有色金属行业特点与洛阳钼业公司财务报表能够分析出以洛阳钼业为代表的有色金属企业拥有大量存货及非流动资产,囤有大量的金属原材料,建设巨大规模的国内外金属冶炼工厂,非流动资产占据大部分的企业总资产。

现金比率、营运资金与借款比、资产负债率与股票价格成正相关,这三者同样说明了银行存款、库存现金等极易变现的资产对股票价格产生了积极影响。

二阶多元回归交叉项主要说明了一阶变量在对股票价格产生影响的同时,也在产生互相影响。例如,现金比率、营运资金与借款比两个一阶变量都与股票价格成正相关,但两者的二阶变量x3、x4与股票价格成负相关。这表示x3、x4共同作为自变量进行分析时,相互间产生了相关性,从而对因变量的预测产生了一定程度的影响。二阶多元回归交叉项的主要作用是修正自变量间相关性对股票价格的影响,并没有深远的实际意义。

3 价格影响模型应用分析

岭回归股票价格影响因素模型可应用于不同社会领域:

(1)从金融投资者角度出发,岭回归股票价格影响因素模型在分析企业财务报表时提供量化数据指标,从统计学方面分析不同财务指标对股票价格产生的影响。投资者通过财务指标变化能够初步预测股票价格变化趋势,有利于提前规避风险及进行金融衍生品的套期保值。

(2)从有色金属行业经营者角度来看,岭回归股票价格影响因素模型分析结果所包含的现实意义能够帮助经营者做出更为合理的决策,有利于调整企业资产负债结构,提高企业价值,吸引更多投资。在对冲风险方面,从模型分析结果来看,非流动资产会对股票价格产生负面影响,而原材料又是非流动资产的主要组成部分,经营者可以通过购买期货、期权合约来减少原材料存量。第一,能够通过减少非流动资产影响股票价格。第二,能够释放被大量存货占据的现金流,提高现金比率,还可以利用衍生品市场进行风险规避,合理买卖期货、期权合约能够套期保值甚至投机获利。

(3)从国家管理层面考虑,岭回归股票价格影响因素模型有利于市场监督部门对行业进行监察管理。模型分析高度依赖企业财务报表数据,数据真实性将直接影响模型预测的结果,可以利用模型预测结果与报表数据进行显著性检验,从统计学角度分析财务造假的可能。

猜你喜欢

共线性股票价格因变量
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
南瓜SWEET蛋白家族的全基因组鉴定与进化分析
银行不良贷款额影响因素分析
不完全多重共线性定义存在的问题及其修正建议
我国寿险需求影响因素的岭回归分析
偏最小二乘回归方法
谈谈如何讲解多元复合函数的求导法则
精心设计课堂 走进学生胸膛
上市公司财务指标与股票价格的相关性实证分析
人民币汇率与上证指数互动的实证研究