APP下载

基于 ARIMA模型的中国人口自然增长率预测

2017-06-06胡明形

市场研究 2017年5期
关键词:阶数增长率差分

◇李 频 胡明形

基于 ARIMA模型的中国人口自然增长率预测

◇李 频 胡明形

影响我国经济社会发展的关键因素之一是人口问题。21世纪以来,我国人口增长率一直处于较低的水平,人口增长趋势发生了较大变化。且近年来,我国的人口发展出现了如人口老龄化等新特点,人口发展面临着前所未有的复杂局面。由此,准确判断我国未来人口发展趋势具有重要的战略意义。本文利用我国1949~2013年的人口自然增长率数据,建立ARIMA(2,1,0)模型,并利用已知的2014年人口自然增长率数据进行预测检验,发现效果较好,故进一步给出2015~2018年的人口自然增长率预测数据,得出我国人口自然增长率将稳定在4.8%~5%之间,短期之内不会有太大波动。

人口自然增长率;ARIMA模型;预测;时间序列

一、引言

我国作为世界上人口最多的发展中国家,人口众多、资源相对不足、环境承载力较弱是我国现阶段的基本国情,短时间内难以改变(景倩,2008)。人口问题一直是制约我国发展的关键因素之一(朱艳伟,张永利,2010)。改革开放以来,人口发展态势受到国家控制人口增长政策的影响,人口增长趋势发生了巨大变化。20世纪90年代初开始,我国迅速增长的人口数量已经过渡到了一个低生育水平的时期,低生育水平在21世纪之后表现得尤为突出。在这一低生育水平的时期,人口增长放缓(王光召,安和平,2014)。近年来,我国的人口发展出现了一些新的特点,例如老龄化进程加速、乡村人口城镇化等因素。目前我国正处于全面建设小康社会的快速转型期,人口发展面临着前所未有的复杂局面,人口安全面临的风险依然存在(冯守平,2008)。由此,准确判断我国未来一段时间的人口发展趋势具有极其重要的战略意义(王玉春,2008)。

对我国未来人口增长进行预测的文献和方法有很多,如带扰动的人口增长模型、多项式拟合法、Leslie矩阵迭代、Logistic阻滞增长模型等,不一而足。

在运用时间序列方法对我国人口增长进行分析预测的文献中,熊建平等(2005)利用高阶线性AR方程对人口进行预测,但所用数据仅限于辽宁省。此外,利用时间序列的ARIMA模型对预测我国人口增长率的文献还不是很多。由此,本文根据我国人口增长率的历史数据,建立ARIMA(p,d,q)模型,在此基础上对我国人口增长做出预测和分析。

二、ARIMA模型的基本理论

一般情况,一个变量会受到其过去及过去到现在的各种因素的影响。由此建立的模型如下所示:

其中,xt为零均值平稳时间序列,p和q分别为该模型的自回归阶数和移动平均阶数;p和q之和为不为零的未知参数;εt为独立的误差项。假如该模型的特征根都在单位圆外,我们称之为ARMA(p,q)模型,但其不足在于仅仅能够应用在平稳序列,而一般常见的时间序列都是非平稳,因此必须通过差分,把其转换成平稳序列,这样才能应用ARMA模型,故笔者引入ARIMA模型。ARMA模型是特殊的ARIMA模型,即为差分阶数为0的ARIMA模型。

ARIMA模型包含自回归阶数(p)、差分阶数(d)和移动平均阶数(q)这三个参数,因此又被称为带差分的自回归移动平均模型。模型的一般形式为ARIMA(p,d,q)。对于非平稳的时间序列模型,在建模过程中,我们需要将其差分d次,将其转化为平稳序列,再用ARMA(p,q)进行拟合。此时,我们将原时间序列所拟合的模型称为ARIMA(p,d,q)模型(王燕,2012)。

三、我国人口自然增长率的实证分析

1.模型的建立

本文所利用的数据选自中国国家统计局(http://data.stats. gov.cn/),指标为人口自然增长率。样本区间为1949年到2013年,共65个数据,由此观察序列R的自相关图和偏自相关图,如附图所示。

附图 1949~2013年我国人口自然增长率序列自相关和偏自相关图“r”的趋势和相关分析

从附图中的自相关图可以看出,其自相关系数衰减到0的速度非常缓慢,所以断定该序列不平稳。

为使序列平稳,本文对序列进行差分处理,消除序列的趋势性。通过作R的一阶差分序列图发现,对原始数据进行一阶差分以后基本消除了长期趋势的影响,序列平稳化,同时运用ADF检验对上述经过一阶差分后的数据进行平稳性检验,检验结果见表1。

表1 我国人口自然增长率一阶差分序列单位根检验结果表

从检验结果可以看出,三种类型的单位根检验对应的p值均非常接近0,小于1%的显著性水平,因此拒绝“序列存在一个单位根”的原假设,说明此时序列是平稳序列。在序列平稳的基础上,观察其白噪声检验结果,如表2所示。

表2 我国人口自然增长率一阶差分序列白噪声检验结果表

其卡方统计量对应的p值均显著小于规定的显著性水平0.05,拒绝“一阶差分平稳序列是白噪声”的原假设,说明一阶差分处理后的平稳序列仍有可以提取的信息,可以进一步识别拟合模型。通过以上一系列的预处理,笔者尝试建立ARIMA(p,1,q)模型。

由上可知ARIMA(p,1,q)模型通过了平稳性检验,因此该序列的差分阶数d为1,进一步推断p和q。p和q可以通过样本的自相关系数和偏自相关系数的观察得到。假若偏自相关系数呈现出p阶截尾而自相关系数呈现出拖尾的特征,可采用AR(p)模型;假若自相关系数表现出q阶截尾,而偏自相关系数拖尾,则采用MA(q)模型;但是,若自相关函数和偏自相关函数均表现出拖尾的特征,则采用ARIMA(p,1,q)模型。笔者发现,其偏自相关系数呈现出显著的二阶截尾的特征,而其自相关系数呈现出拖尾的特征,由此初步确定该差分序列为AR(2)模型。

在经验识别的基础上,利用SAS软件尝试对模型进行拟合。

如果模型中的每一项系数都通过t检验,则就选该模型作为最后的模型来建模;不然,就将模型里未通过t检验的各项剔除再来建模,直到最终模型里的每一项系数都通过t检验。AIC准则是一种适用面非常广泛的统计模型选择准则,简称最小信息准则。BIC准则或SBC准则是对AIC准则的修正,将未知参数个数的惩罚参数由2变成了样本容量的对数函数。王燕(2012)建立的每一个模型都会给出一个AIC参数和BIC参数,选择每一项系数都通过t检验且AIC参数和BIC参数最小的模型作为原序列预测的相对最优模型。

运行SAS中的MINIC程序,得到p从0到5和q从0到5共计36个模型的BIC参数,详见表3。

表3 不同拟合模型的最小信息原则(BIC)参数结果汇总表

根据BIC最小信息准则,AR(5)模型最优,因此,拟合AR(5)模型,检验其每一项的系数能否通过t检验。

查看SAS程序运行结果可知,AR(5)模型的AIC参数为347.869,SBC参数为360.8223,而常数项和部分系数没有通过t检验,见表4。

表4 AR(5)模型参数检验结果表

去掉常数项,再次拟合模型。去掉常数项的AR(5)模型,其AIC参数为346.1266,SBC参数为356.921,前两项系数通过了t检验,而后三位系数没有通过t检验,同样去掉后三项,尝试拟合没有常数项的AR(2)模型。去掉常数项的AR(2)模型,其AIC参数为343.5249,SBC参数为347.8427,在三个模型中两个参数均为最小,且两个系数都通过了t检验,见表5。

表5 无常数项AR(2)模型参数检验结果表

结合上文经验识别的模型和模型拟合结果,笔者可以判断最优预测模型为ARIMA(2,1,0)。

因此本文选用的人口增长预测模型为ARIMA(2,1,0),由上文可知,其系数均已通过t检验。根据SAS给出的估计结果,较优的模型ARIMA最终表达式为:

2.模型的诊断与检验

当模型的未知参数被估计出之后,还应进一步对其残差序列进行白噪声检验。

残差序列的检验结果见表6。

表6 残差的白噪声检验结果表

从表6残差的自相关检查可以看出,从滞后6阶到滞后24阶,残差卡方检验对应的 p值分别为0.2621,0.3309,0.6992,0.9065,均显著大于0.05,可以判断该残差序列为白噪声,故所建立的模型ARIMA(2,1,0)对原序列的信息提取充分,检验通过。

3.模型的应用

对ARIMA(2,1,0)进行预测效果检验。利用SAS的Forecast程序预测2014年的人口自然增长率,求得P2014=4.83%,而2014年的实际人口自然增长率为5.21%,误差为(5.21%-4.83%)/5.21%=7.29%,不超过10%,可认为预测效果较好,可以用该模型对未来几年的人口自然增长率进行预测。预测结果如表7所示。

表7 我国人口自然增长率预测结果汇总表

即预测的2015年的人口自然增长率为4.80%,2016年4.83%,2017年4.86%,2018年4.86%。

从以上预测的数据可以看出,我国的人口自然增长率将稳定在4.8%~5%之间,短期之内不会有太大波动。

需要强调的是,由于影响我国人口自然增长率的因素很多,包括政策和各种宏观经济因素,而ARIMA模型仅仅依据人口自然增长率自身时间序列进行预测,因此所假设的模型是考虑到其他影响因素变化不大的前提下进行的短期预测,但是其较长时期预测能力则会随着其他因素,尤其是政策因素和宏观经济因素的变化而下降。这也是ARIMA模型通常只能用来做短期预测的原因。

四、结论

本文利用时间序列相关理论,对1949~2013年我国人口自然增长率建立了AR(2,1,0)模型,通过检验证明该模型能在一定程度上判断我国未来人口的发展趋势,并对我国2015~2018年的人口自然增长率进行了预测。

通过预测的数据,笔者判断未来2年我国人口自然增长率将稳定在4.8%左右,不会有太大的波动。但由于影响人口自然增长率的因素还有很多,包括政策因素和宏观经济因素等等。本文建立的ARIMA模型仅讨论我国人口自然增长率自身的时间序列变化来探究其在未来一段时间内的发展趋势。且当政策因素和宏观经济因素发生变化时,ARIMA模型的预测功能会大大下降。如我国于2015年10月开始推出全面二孩政策,生育政策的改变势必在一定程度上影响人口自然增长率。此时,本文所建立ARIMA模型所预测的人口自然增长率的准确程度会受到一定的影响。

尽管如此,后续的研究可以通过实行二孩政策之后的人口自然增长率与本模型预测出的人口自然增长率进行对比,探究二孩政策对我国人口自然增长率的影响。因此,本文所建立的对人口自然增长率进行预测的ARIMA模型仍具有较强的实际意义,且还有一定的研究空间。

[1]冯守平.中国人口增长预测模型[J].安徽科技学院学报,2008 (06).

[2]景倩.中国人口增长趋势预测模型[J].今日南国(理论创新版),2008(03).

[3]王光召,安和平.低生育背景下中国人口惯性与人口增长峰值预测[J].宁夏大学学报(人文社会科学版),2014(03).

[4]王燕.应用时间序列分析[M].中国人民大学出版社,2012.

[5]王玉春.中国人口增长预测[J].甘肃联合大学学报(自然科学版),2008(05).

[6]熊建平,吴建华,万国金.AR模型在人口增长预测中的应用[J].计算机与现代化,2005(10).

[7]朱艳伟,张永利.中国人口增长预测模型及其改进[J].统计与决策,2010(16).

(作者单位:北京林业大学经济管理学院)

10.13999/j.cnki.scyj.2017.05.011

猜你喜欢

阶数增长率差分
2020年河北省固定资产投资增长率
数列与差分
确定有限级数解的阶数上界的一种n阶展开方法
2019年河北省固定资产投资增长率
复变函数中孤立奇点的判别
国内生产总值及其增长率
货币供应量同比增长率
基于差分隐私的大数据隐私保护
一种新的多址信道有效阶数估计算法*
关于动态电路阶数的讨论