APP下载

全国研究生招生人数影响因素的多元线性回归

2019-11-04杨天贞

理科爱好者(教育教学版) 2019年4期
关键词:回归分析优化

【摘 要】随着科技的发展,越来越多的人渴望得到更高的学位,同时也对高校招生人数的确定是否具有科学性产生了一定的疑惑,本文通过收集整理数据,选取对研究生招生人数造成影响的因素,利用R进行多元回归分析,求出回归方程,进行统计检验(包括回歸方程的显著性检验,回归系数的显著性检验)以及残差的检验,然后进行估计和预测。最终得到最优的回归方程。以此对高校招生计划的制定给予参考。

【关键词】R软件;研究生招生人数;回归分析;优化

【中图分类号】G642  【文献标识码】A  【文章编号】1671-8437(2019)22-0008-02

1   引言

随着科学发展观的推动,为满足全国人民对高等教育的渴望,我国高等教育实现了跨越式发展。越来越多的毕业生甚至是已经从业的人选择继续深造来增加自己在就业市场中的被选择机会。近几年研究生的报考人数更是急剧增长,相应地很多高校亦是响应国家需要而实行扩招,但是高校教育资源有限,所以合理科学的预测招生人数,不仅可以为高校招生计划的制定给予一定的参考,还可以逐步实现按市场经济规律合理配置和优化教育资源。

2   模型的设定及检验

2.1  数据来源及指标设计

所有的数据均来自中国统计年鉴1997-2017年的数据,选取高校研究生招生人数(Y)为因变量,然后在社会现状和许多学者的讨论选取GDP()、高校数量

()、高校教师数量()、国家财政性教育经费

()、农村居民家庭人均纯收入()、城镇居民家庭人均可支配收入()六个指标能够影响招生人数的确定。我们不排除其他有价值变量存在的可能性。

2.2  估计模型及分析

利用函数m( )对Y、、、、、

、做回归分析,得到全回归方程:,由于自变量和因变量都是有单位的,不能由偏回归系数的大小直接说明对因变量线性影响的大小,故需要先将变量标准化后计算标准化偏回归系数以解释因变量对自变量的

影响[1-2]。通过R软件得到模型的多重测定系数R2=0.987值很接近1,多重测定系数的结果表明约有98.7%的招生人数变化可以用模型解释,所以其模型拟合度较好[3]。

由F检验结果可得,模型的F值为157,P<0.0001,故模型有意义。由t检验结果可见(见表1),回归系数只有x4的P值=0.09<0.1,其它变量均不显著,且国家财政性教育经费和农村居民家庭人均纯收入所对应的偏回归系数都为负,这与理论现实是不相符的[4]。出现这种结果的原因可能是这些解释变量之间存在高度的共线性。由R软件中函数vif( )得到各个变量的都远远超过10,说明各变量间存在多重共线性。

2.3  模型的优化

R软件中用函数step()对模型进行逐步回归选择AIC最小的最佳模型,得到的回归方程为:。

2.4  残差检验

用R软件中t.test()函数对模型的残差值进行零均值检验,P=1,由此可知均值为0,用qqplot()绘图检验残差正态性,由图可知,所有的点基本都分布在直线周围并且均落在置信区间内,故残差服从正态分布。用函数durbinWatsonTest()做Durbin-Watson检验。DW=1.245,P值=0.006显著,说明误差项之间存在自相关性。对此,我们采用迭代法对残差的自相关进行处理,消除自相关。通过R根据迭代原理编程得到新的模型,回归方程为:。

再次做DW检验,DW=1.768,P值=0.166不显著说明无自相关性。统计检验结果(表2)显示,留存自变量对因变量影响显著且多重测定系数达到0.968。然后用函数ncvTest()再对新模型进行残差的方差齐性检验,P值=0.2512不显著,说明不存在异方差。最后将为,为,为,为,为,为,将原始数据变量回代如以上方程中,得到无自相关性的最方程:。

3   结束语

经检验,建立的模型具有一定的可靠性和实用性,为最优拟合模型。由模型表明:全国研究生招生人数与GDP、国家财政内教育经费以及城镇和农村家庭的平均收入有着密切关系。招生人数对GDP依存度为负,这反映了随着对高学历人才的需求,使得招生人数占GDP比重出现逐年下滑的趋势;剩余变量对招生人数的影响都需要经过一个滞后期才能显现出来。

【参考文献】

[1]王斌会.多元统计分析及R语言建模[M].暨南大学出版社,2010.

[2]Myers R ,麦尔斯, Myers.经典和现代回归分析及其应用[M].北京:高等教育出版社,2005.

[3]何晓群.实用回归分析[M].北京:高等教育出版社,2008.

[4]彭怀祖.高校招生人数影响因素分析及应用[J].教育与经济, 2008(2).

【作者简介】

杨天贞(1993~),女,回族,河南商丘人,研究方向:教育统计。

猜你喜欢

回归分析优化
优化问题设计
营商环境五方面持续优化
优化英语课堂教学策略的探索
促进学生认识发展 优化初中化学复习
中国经济发展状况与大学生就业情况的相关性研究
城乡居民医疗费用的相关性与回归分析
基于变形监测的金安桥水电站坝体稳定性分析
森林碳汇影响因素的计量模型研究
河北省城镇居民人均可支配收入与消费统计分析
河南省经济增长质量与创新能力关系的实证分析