APP下载

应用多元线性回归模型的铁路客运量预测

2018-10-17赵亚军胡章浩

关键词:客运量西宁市因变量

彭 辉,赵亚军,胡章浩

(长安大学 公路学院, 西安 710064)

铁路客运量是衡量地区铁路客运发展水平的重要指标,西宁作为青海省省会,在省内城市中人口数量居首,是西部地区重要的旅游城市。随着西宁市的经济发展、人民生活水平的提高及旅游人数的逐年增加,人们的出行需求日益增大,同时,铁路客运与公路、航空、水运等客运方式的市场竞争日趋激烈,此外,在其他地区还有着铁路客运基础设施体量与铁路客运量规模不符,从而造成铁路设施功能发挥不足的现象[1-2]。因此,选取西宁市全市人口总数、历年生产总值及接待游客总量作为研究因素,针对各因素对既有线铁路客运量的不同影响程度做系统分析,预测结果对有关部门制定相关客运策略具有重要意义。本文通过建立西宁铁路客运量多元线性回归模型,利用Eviews软件进行预测,并对模型预测精度进行检验。

1 多元线性回归模型

1.1 基本模型概述

在许多学术及现实问题研究中,某个因变量的变化一般受到多个因素的影响,这种情况下就需要将多个影响因素作为自变量来解释因变量的变化情况,这种问题就称为多元回归问题,当多个自变量和需要研究的因变量之间存在某种线性关系时,此回归分析问题就变成多元线性回归。

多元线性回归分析通用模型:设影响因变量Y的自变量个数为n个,记作X1,X2,…,Xn,多元线性回归模型指所有自变量对Y的影响是线性的,则模型关系式为:

Y=β0+β1X1+β2X2+…+βnXn+ε

(1)

其中:Y为因变量;β0为常数项;β1,β2,…,βn为回归系数;X1,X2,…,Xn为自变量,可得到精确值的解释变量;ε为随机扰动项;n为解释变量个数。当n=1时,式(1)为一元线性回归;当n≥2时,式(1)为多元线性回归[3]。

多元线性回归模型中,各个自变量对因变量的解释显著性不同,因此需要判断所有自变量综合起来对因变量联合影响的总显著性,即回归方程的显著性。在得到回归模型后,要对模型进行各类检验以验证模型是否可用,常用的检验方法有拟合度检验、回归系数显著性检验、回归方程显著性检验[4-5,6]。

1.2 回归方程的检验

根据所建立的基本多元线性回归模型,在已经得到回归系数的情况下,还需对整个回归方程进行显著性检验。通常对所建立的回归方程进行显著性检验时采用F检验,F检验一般过程见表1。

表1 F检验的步骤

2 铁路客运量的多元回归模型建立

为了更加全面系统地反映西宁铁路客运量的情况,本文选取西宁市既有线铁路客运量作为因变量,选择国内生产总值、居民人均可支配收入、全市总人口数、接待游客总量、旅行社数量等作为自变量,分析西宁铁路客运量的影响因素。

通过相关系数检验发现:国内生产总值与居民人均可支配收入、接待游客总量与旅行社数量存在很高的相关性,所以选取国内生产总值、接待游客总量、全市总人口数等作为自变量分析影响因变量的主要影响因素[7-8],所选取的原始数据满足线性回归条件,可作为建立模型的基本参数。

2.1 样本选取

本文以2004—2016年西宁市铁路客运量、全市总人口数、生产总值及接待游客总量为样本基础数据,依据3项指标历年的统计数据,采用多元线性回归模型,分析铁路客运量变化规律,预测未来相关发展趋势,表2为西宁市近年来各变量有关数据,数据来源于历年《西宁统计年鉴》。

表2 2004—2016年西宁市各相关变量统计数据

2.2 模型建立与求解

铁路客运量因其系统性而受到多种因素的影响和制约,本文选取较为重要的3项影响因素(人口总数、生产总值、游客总量)作为解释变量进行回归分析,对因变量和自变量进行统计描述分析得出西宁铁路客运量与人口总数、生产总值、游客总量之间有着不同程度的相关关系。为进一步更加深入分析变量间的影响关系,将利用Eviews统计软件对模型进行求解并检验。建立西宁铁路客运量多元线性回归预测模型[9]:

Y=β0+β1X1+β2X2+β3X3+ε

(2)

式(2)中各个符号含义见表3。

根据以上分析,依据样本数据和基本模型,采用Eviews统计软件求解多元线性回归分析模型,并进行最小二乘法回归分析,得到的分析结果见表4。

表4中:X1表示总人口数;X2代表生产总值;X3代表游客总量根据表4软件分析结果。可以得出铁路客运量、总人口数、生产总值以及游客数量的多元回归模型:

Y=821.763 2-3.632 738X1-

0.271 564X2+0.569 589X3

t= (0.466 059) (-0.423 517)

(-0.940 071) (2.808 934)

表3 模型符号及其含义

表4 分析结果

2.3 模型检验

1) 经济意义检验

通过上述多元线性回归模型的建立与求解可以得到:在其他情况不变的情况下,总人口数增加1个单位,西宁铁路客运量将减少3.632 738个单位;在其他条件不变的情况下,生产总值每增加1个单位,铁路客运量将减少0.271 564单位;在其他条件不变的情况下,接待游客总量每增加1个单位,铁路客运量将增加0.569 589个单位。也即:铁路客运量与接待游客总量成正相关关系,与总人口数、生产总值成负相关关系[6]。

2) 统计检验

从Eviews统计软件得到的回归估计结果可以看出:所建立的模型拟合度很高,可决系数为 0.924 981,表明西宁铁路客运量的92.498 1%可以由总人口数、生产总值和接待游客总数量来解释。

F统计量的值为36.989 97,Prob统计量的值为0.000 022,表明模型呈现显著的线性回归趋势。

总人口数、生产总值和接待游客总数量的t统计量的值分别为-0.423 517、-0.940 071和2.808 934。查表可知,总人口数、生产总值和接待游客总数量对西宁铁路客运量均有显著的影响。

3 模型应用与分析

西宁铁路线路分为既有线路和高铁线路,由于高铁线路客运量数据暂未获取,因此本文只针对西宁市既有线铁路客运量做短期预测。

根据2017年西宁国民经济和社会发展统计公报显示:2017年总人口为235.50万人,全年生产总值为1 284.91亿元,游客接待总量为 2 138.29万人次,结合得到的铁路客运量计算式,计算得到西宁既有线铁路客运量为835.26万人次,而2017年全年实际铁路客运量为825.91万人[10],统计所得铁路客运量与模型计算出的客运量相差较小,所建立的模型预测效果良好,模型可用。

4 结束语

本文以西宁市各项统计数据为基础,依据多元线性回归分析方法建立模型,利用Eviews统计软件平台,预测西宁既有线铁路客运量,并进行模型检验,发现在影响西宁铁路客运量的几项影响因素中,西宁市历年游客总量对铁路客运量有明显的正相关关系,而人口总数及生产总值对铁路客运量有明显的负相关关系。经检验,模型精度符合要求,本文建立的模型可用以预测未来年西宁市铁路客运量。

作为西部地区著名的旅游型城市,西宁地处高原地带,气候变化较大,因此西宁市的旅游业发展的季节性差异较大,适游期主要集中在5—8月,9—4月因受到自然资源类旅游活动的限制,旅游人数会大幅下降,因此西宁市游客数量高峰月出现在5—8月,约占全年游客总量的60%以上,总体上,在旺季旅游日均客流量大约是淡季时的3倍。因此,根据所建立的模型,在分时段预测西宁铁路客运量时,应着重考虑旅游的季节性因素带来的误差。

影响铁路客运量的因素较多,本文选取的影响因素是根据西宁市是旅游型城市这一特征,有针对性地选择上述3个变量作为因变量,3项变量对西宁铁路客运量均有着不同程度的影响,尤其是旅游客流量影响更为显著。由于各变量间并不相互独立,因此各因变量之间也存在着或强或弱的相关影响,这对模型的精确度有影响,在后续预测模型研究中,应多加考虑各因变量之间的相互影响关系。

猜你喜欢

客运量西宁市因变量
西宁市人民政府大事记 2022年6月
西宁市人民政府人事任免 2022年6月
西宁市人民政府大事记 2022年7月
西宁市人民政府人事任免 2022年7月
调整有限因变量混合模型在药物经济学健康效用量表映射中的运用
2018年北京市城市公共交通运行特征分析
2018年北京市城际交通运行特征分析
2018年北京市轨道交通运行特征分析
适应性回归分析(Ⅳ)
——与非适应性回归分析的比较
偏最小二乘回归方法