APP下载

基于线性时间准确划分方法的CPI指数变点分析

2016-05-30晏振田茂再

现代管理科学 2016年3期
关键词:经济形势时间序列

晏振 田茂再

摘要:居民消费价格指数反映了居民家庭购买消费商品及服务的价格水平的变动情况,影响着政府制定货币、财政、消费、价格等政策,同时,也直接反映了居民的生活水平及其评价。文章根据一种基于线性时间准确划分方法的变点分析理论对我国居民消费价格指数进行实证分析,利用BIC准则判断序列变点个数,并估计变点位置。最后,讨论了全国居民消费价格指数变点发生的影响因素及波动特征。

关键词:CPI指数;变点分析;BIC准则;时间序列;经济形势

一、 引言

居民消费价格指数(Consumer Price Index,CPI),是一个用来反映居民家庭购买的消费商品和服务价格水平变化情况的宏观经济指标。它主要是度量消费商品和服务项目的价格水平随时间的变动情况。物价是广大人民最为关心的问题之一。一方面它与居民的生活密切相关,在整个国民经济价格体系中占据重要的地位。另一方面它也是政府监控价格整体水平、进行经济分析和决策以及国民经济核算的一个重要衡量指标。

随着我国经济改革开放的不断推进,影响日常生活物价波动的因素越来越复杂。造成物价波动的原因,不仅是由于存在货币超发或紧缩、生产成本升高、供需不平衡等因素,也与国际市场价格变化、游资投机和炒作等经济行为有关,而且国际因素对我国CPI指数的影响程度也越来越深。然而,频繁的物价波动非常不利于经济的健康发展。既然CPI指数影响着政府制定财政、货币、消费、价格等众多相关政策,同时又反映居民的生活水平及其评价。所以,准确地分析CPI指数的变化规律,具有十分重要的理论价值和现实意义。国内很多学者对我国的CPI指数进行了研究分析。陈娟和余灼萍(2004)对我国CPI的年度数据建立了模型,并进行了一步预测。谢佳利等人(2008)利用时间序列模型对CPI指数变化进行建模研究,该时间序列模型较优地反映了CPI变化规律且相对误差控制在1%之内,能够得到准确的预测。朱厚岩等人(2013)运用ARCH模型分析了我国居民消费价格指数的变化规律,探究我国CPI指数变动的影响因素,并进行了动态预测;结果发现CPI指数同比增长率(SCPI)与其滞后一期有着极强的线性相关关系。陈镇坤、刘金山(2015)运用贝叶斯方法对CPI经济时间序列进行建模分析,该方法利用经济领域的专家学者提供的先验预测信息,可以更好地结合模型的预测信息和专家的先验信息进行推断,从而获得更加合理的CPI预测值。

物价的频繁变动,不仅会影响居民的日常生活,更不利于国家经济的健康发展。分析CPI的波动情况,掌握其变化规律及波动特征,对于政府更好地掌握物价的波动周期和经济政策的调控力度,确保物价稳定等方面都具有重要的指导作用。变点分析统计学前沿研究的热点问题,属于统计学中一个较新的领域,对我们了解事物变化规律、制定相关对策有着重要意义。因此,本文计划利用变点理论对我国CPI指数进行分析,研究CPI的变化及其影响。孙军等人(2001)研究了经济序列中的变点贝叶斯分析问题。谭常春(2007)研究了变点问题在经济、金融中的应用。钟颖、田茂再(2008)讨论了稀有事件变点问题的贝叶斯分析方法。王维国等人(2010)讨论了我国GDP时间序列的变点问题,采用贝叶斯因子对GDP变点个数进行判断,结果发现变点与经济发展阶段基本吻合。刘伟棠(2015)利用多变点理论对我国CPI指数变点进行了检验,利用动态规划原理得到最优分段及变点的估计,讨论了CPI指数发生的影响因素及波动特征。上述的这些方法在研究过程中都会遇到一些计算复杂或估计准确度不高的问题。Killick等人(2012)提出了一种基于时间线性组合的准确划分方法来进行变点判断。准确划分方法主要是通过最小化一个损失函数来获取最优变点个数和位置,该方法计算简便并且准确,特别是在大数据情形下具有很大的计算优势。因此,本文利用这一方法对我国2000年~2014年CPI月度指数进行建模,进行变点分析。

二、 模型与方法

变点问题一直以来是统计中的一个热门课题。变点问题最初是从工业上质量控制中提出来的,人们从生产线上抽检生产产品来检测产品的质量是否发生显著变化。所谓变点,从统计学意义上来说,即是“数据中的某个或某些量起突然改变数据结构的点”。具体是指,对于一个随机变量序列{Y(t),t∈T},如果存在某一个时间点,使得序列中在这个时间点前的数据服从一种概率分布f(Y),而在这个时间点后的数据服从另一种概率分布g(Y)(或分布相同而参数不同),则称该时间点为这个随机序列中的一个变点。所以,一个变点分析问题具体包含有两个方面的内容:一是确定是否存在变点;二是估计未知变点的确切位置。在应用方面,变点问题不但在工业自动质量控制中有大量的实际应用,现在已经发展到在许多领域都有应用,如经济、金融、医学和气象学等方面都有很多的应用背景。

假设有序列{y1,…,yn},序列具有m个变点,m是未知数,这m个变点相对应的位置为{?子1,…,?子m},则?子j,j=1,…,m满足1?燮?子j?燮n-1,且?子j是整数。假设?子0=0,?子m+1=n,且?子j<?子k,当j对于序列{y1,…,yn}的变点分析则可以通过最小化下式得到,■R(y?子j-1+1,…,y?子j)+?茁f(m)(1)

其中,R(·)是一个损失函数,?茁f(m)是惩罚项。通常,损失函数具体可以选择负对数似然函数、平方损失或者累积和函数。惩罚项一般选用变点数的线性组合,即?茁f(m)=?茁m。惩罚因子?茁的确定则与选取的准则有关,如在AIC信息准则下,?茁=2;在BIC信息准则下,?茁=log(n)。

针对(1)的最小化问题,很多研究工作者进行了相关的研究工作。Scott和Knott(1974)提出了二元分段方法,该方法的优点是计算便捷,只需要O(nlogn)的复杂度,但缺点是每次只能识别一个变点;Auger和Lawrence(1989)提出了区间近邻方法,该方法利用动态规划思想对所有区间进行搜索,但计算较为复杂;Jackson等人(2005)提出了最优划分法。最优划分方法在计算复杂度上优于区间近邻方法,但远没有达到二元分段方法的简便,尤其是在数据量较大的情况下,计算依旧复杂。Killick等人(2012)在最优划分法的基础上提出了一种线性时间准确划分方法(Pruned Exact Linear Time,PELT),在一定条件下,该方法的计算复杂度只需要O(n),能够更准确有效地判断序列中存在的多个变点以及变点位置,计算简单有效。

三、 中国CPI指数的变点分析

1. 数据描述与分析。在本节中,我们将PELT变点分析方法应用于我国CPI指数的分析,通过寻找序列的变点,对CPI的波动特征进行分析。我们选取了我国2000年1月~2014年12月CPI指数(上年同月=100),共有n=180个数据。数据来源于国家统计局数据中心。令yt表示第t月的CPI指数。我们首先观察指数序列的时间变化趋势。图1给出了CPI指数随时间变化的走势图。

从图1可以看出,2000年~2014年我国CPI指数存在明显的波动,同时又具有一定的周期规律性。我们利用PELT变点分析方法进行分析。根据(1)式建立模型,其中R(y?子j-1+1,…,y?子j)选用负的对数似然函数,惩罚准则选用BIC准则,即?茁f(m)=log(n)m。具体计算利用R软件中的changepoint包进行计算。

经过计算,一共得到了9个变点,BIC=10.38。图2给出了这9变点的位置图。图2中“+”标记的即是变点位置。具体时间点为2003年10月、2005年3月、2006年11月、2007年6月、2008年7月、2008年11月、2009年11月、2010年9月、2012年1月。这9个变点把CPI指数序列分成了10段。

2. 变点原因分析。根据上一小节的变点分析结果,所得的9个变点将2000年~2014年划分成了10个时间段。我们发现,这些变点往往是与当时的经济形式或经济政策密切相关联的,每一段时间往往对应其波动周期。

2000年~2003年期间,由于受到1998年亚洲金融危机的影响,我国经济尚未恢复过来,我国物价总体处于一个较低的稳定水平,CPI 保持低水平涨幅运行,在2003年10以前,同比增长率最高仅为1.7%。从2003年开始,我国CPI整体水平由负转正,主要是2002年下半年开始,我国经济逐渐从1998年亚洲金融危机中复苏及世界经济形势好转。从2003年11月份起到2004年底,CPI同比增长率均在2%以上。这说明变点在2003年10月前后,经济形势好转,CPI结构发生了变化,也就是说2003年10月是一个变点位置。

2003年10月~2005年3月,CPI同比增长最高达到5.3%,最低为1.8%,在2004年下半年,我国CPI虽然保持较高的整体水平,但相比而言出现下降趋势,直至2005年后开始进入较低CPI水平。因此,这一轮的上涨是我国2000年以来第一次较大上涨周期。而2005年下半年与2006上半年,CPI则保持在平均1.3%左右的稳定同比增长水平。由此可见,在2005年初CPI指数前后结构发生变化,即存在变点,时间点具体为2005年3月。

2006年开始,我国房地产快速增长,房价的增长直接带动了我国其他产业价格的快速上涨,同时也带动了整个国内市场商品价格的全面增长。此外,受到我国废除农业税的影响,废止农业税条例的决定极大地促进了农业的发展,进一步促进了经济的发展。2006年11月至2007年6月期间,CPI指数从之前的平稳增长开始进入快速增长阶段,平均涨幅为3.26%。因此,在2006年10月前后,CPI指数发生了结构变化。而在2007年下半年和2008年上半年,随着我国经济的快速发展,到了一个高位运行的状态,同时国际热钱的涌入,使得CPI指数处于高位运行状态,CPI指数涨幅均高于5%,最高达到8.5%。因此,2007年6月为一个变点,在这个时间点前后,CPI指数的增长速度极为不同。而这一轮的增长是我国CPI指数近年来的第二轮上涨

2008年开始,在全球金融危机和国际原油价格大幅度下降的影响下,我国经济环境开始恶化,CPI指数也随之下降。但是由于北京奥运会的召开,我国消费能力和水平还在提高,物价水平和CPI指数并没有严重下滑。因此,2008年7月~2008年11月期间,CPI指数整体涨幅还维持在5%左右水平。我们称这段时间为“北京奥运周期”。而在这段时间前后,CPI指数结构则发生了变化,从较高增幅急剧进入负增长状态。因此,我们可以发现短时间内出现2008年7月和11月两个变点。

进入2009年,由于受全球金融危机的影响,我国CPI指数开始出现了负增长。但是在2010年,物价指数又开始上升。一是在金融危机后,国家出台了多样刺激经济政策,货币政策从紧缩转为宽松,过量的广义货币供应量导致了市场价格上涨;二是受市场上的游资包括外部资金的炒作影响,CPI开始回升。这也是我国2000年以来CPI第三次上涨阶段。因此,2009年底是CPI指数结构变化时间点,具体表现在2009年11月左右。在经过2010年的经济恢复以后,从2010年底开始,CPI指数快速上涨。2010年10月~2011年12月,CPI指数涨幅平均水平达到5.27%。因此,可以认为2010年9月,CPI指数结构前后发生变化。

2012年开始,全国CPI指数开始下降,主要原因是我国货币政策的收缩力度明显加大,国际市场大宗商品价格的下跌和人民币持续升值。这一周期,CPI指数又回到了一个较低涨幅的水平,整体水平维持在2%左右。因此,可以看出2012年1月是一个结构发生变化的时间点。而结合当前的经济形势,这一周期已经持续了三年多的时间,并有可能持续。

四、 结论

本文利用变点分析理论对我国CPI指数进行分析,根据变点可以知道,我国CPI指数的波动特征和变化周期。总体上,自2000年以来,我国CPI共有三个上涨周期和三个下降周期,每次上升必然伴随着下次的下降。每次上涨的周期大约持续23个月左右,而每次下降的周期则持续20个月左右,下降周期一般短于上涨周期。通过变点分析我们发现,CPI指数结构的变化主要集中发生在2004年~2012年间,每一个变化周期基本都是一年左右。这主要是由于这一时间内我国经济形势多变,同时,也可以看出我国政府宏观调控的能力,能够根据多变的经济现状及时做出调整政策。此外,通过变点的分析,我们还发现了CPI周期出现了如北京奥运周期这样的特殊周期。这些都能够对将来的经济发展,经济规划提供参考价值。因此,对我国居民消费价格指数的动态变化进行研究分析,掌握其变化特征和规律,有助于预测CPI走势以及预判突发事件对CPI的影响和对经济形势的影响。

参考文献:

[1] Auger,I.E.and C.E.Lawrence.Algorithms for the optimal identification of segment neighborhoods[J].Bulletin of Mathematical Biology,1989,51(1):39-54.

[2] Jackson,B.,J.D.Sargle, D.Barnes,S.Arabhi, A.Alt, P.Gioumousis, E.Gwin, P.Sangtr- akulcharoen,L.Tan, and T.T.Tsai.An algorithm for optimal partitioning of data on an interval[R].IEEE,Signal Processing Letters 2005,(12):105-108.

[3] R.Killick, P.Fearnhead, I.A.Eckley.Optimal Detection of Changepoints With a Linear Computational Cost[J].Journal of the American Statistical Association,2012,(107):1590-1598.

[4] 陈娟,余灼萍.我国居民消费价格指数的短期预测[J].统计与决策,2004,(4):40-41.

[5] 陈镇坤,刘金山.基于MCMC的贝叶斯时间序列CPI预测模型[J].统计与决策,2015,(3):65-67.

[6] 刘伟棠.基于多变点理论对全国居民消费价格指数的波动分析[J].商,2015,(10):179-180.

[7] 孙军,姜诗意,李宏纲.经济序列变点的Bayes分析[J].统计研究,2001,(8):27-31.

[8] 王维国,王霞,颜敏.时间序列多个突变点的贝叶斯推断——对我国GDP序列的实证分析[J].数学的实践与认识,2010,9(9):45-53.

[9] 谢佳利,杨善朝,梁鑫.我国CPI时间序列预测模型的比较及实证检验[J].统计与决策,2008,(9):4-6.

[10] 钟颖,田茂再.稀有事件变点问题的Bayes分析[J].统计与决策,2008,(3):38-39.

[11] 朱厚岩,梁青青,刘振中.基于ARCH模型的我国CPI变动影响因素分析及其动态预测[J].现代管理科学, 2013,(1):38-41.

基金项目:国家自然科学基金(项目号:11261009);北京市社会科学基金重大项目(项目号:15ZDA17);国家社会科学基金重点项目(项目号:13AZD064);中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目“大数据统计学基础理论的发展研究”(项目号:15XNL008)。

作者简介:田茂再(1969-),男,土家族,湖南省凤凰县人,中国人民大学统计学院教授、博士生导师,研究方向为数理统计;晏振(1985-),男,汉族,广西壮族自治区玉林市人,中国人民大学统计学院博士生,研究方向为数理统计。

收稿日期:2016-01-16。

猜你喜欢

经济形势时间序列
浅谈做好煤炭企业困难时期稳定工作的思考
上证综指收益率的影响因素分析
基于指数平滑的电站设备故障时间序列预测研究
基于时间序列的我国人均GDP分析与预测
论我国房地产经济的可持续发展
国际金融经济形势及其对我国经济的影响分析
基于线性散列索引的时间序列查询方法研究
改革、创新是中国当前突破经济发展瓶颈的关键抉择
基于组合模型的能源需求预测