APP下载

基于自回归积分滑动平均模型对中药材三七价格预测的讨论

2016-05-14王诺程蒙臧春鑫杨光

中国中药杂志 2016年8期
关键词:三七

王诺 程蒙 臧春鑫 杨光

[摘要]该文在分析三七价格波动的基础上,以2004年1月—2015年8月近10年120头三七的价格数据为基础,采用自回归滑动平均模型[ARIMA(p,d,q)],对2015年9月—2016年8月120头三七的价格进行预测。在确定模型形式的过程中,对价格数据进行平稳性检验,以确定模型的p,通过自相关函数和篇相关函数识别模型的p和q,根据确定的模型形式,对模型进行检验,确定预测误差最小的模型。该文采用ARIMA(2,1,3)模型预测三七未来一年的价格,供种植三七的药农、以三七为原材料的药企等参考。

[关键词]三七;自回归积分滑动平均模型;单位跟检验;价格预测

[Abstract]Based on the analysis of price fluctuations on Notoginseng Radix et Rhizoma, this paper takes advantage of the price data of Notoginseng Radix et Rhizoma which specification is 120 from January 2004 to August 2015, using autoregressive integrated moving average model [ARIMA (p, d, q)] forecasting the price of Notoginseng Radix et Rhizoma from September 2015 to August 2016 In the process of determining the form of model, the stability test used to determine the model of p, and the autocorrelation function and particles autocorrelation functions to identify the p and q of model According to test the model, the forecast minimum error model was identified In this paper, ARIMA (2,1,3) model was used to predict next year′s price of Notoginseng Radix et Rhizoma, for providing information for Notoginseng Radix et Rhizoma growers, pharmaceutical companies

[Key words]Notoginseng Radix et Rhizoma; ARIMA model; unit test; price forecast

doi:10.4268/cjcmm20160832

本文以自回归积分滑动平均模型(ARIMA)为基础,预测三七未来一年的价格趋势。很多学者在宏观经济指标、金属商品价格预测以及农畜产品价格预测方面,都尝试利用ARIMA模型,得出了有效并适用的结论。国内外学者采用ARIMA模型所做的研究可以分类3类,分别是:使用ARMIA模型对价格指数、GDP增长和汇率变动等宏观经济指标进行预测;利用ARIMA模型在大宗金属商品上进行价格预测;用于预测农产品、畜产品的价格。基于三七的农副产品属性,采用ARIMA模型对其价格进行预测,在理论上是可行的。考虑到三七价格的剧烈波动,对三七种植户、药企、消费者造成极为不利影响,本文旨在通过对三七价格的预测,为三七种植户、药企提供参考,为未来的种植或生产提供价格信号。

近年来中药材价格呈现普遍上涨的态势,三七作为中药材中的大宗品种,自2009年以来,其价格也随着中药材整体价格上涨且表现出典型的剧烈波动的特征。2009年10月—2015年8月期间,60头和80头三七的价格走势见图1(三七价格资料来源于文山三七产业局)。2种规格的三七价格都经历了类似的波动,走势基本一致。以60头三七的价格为例,从2009年10月—2013年6月,其价格从148元/kg涨至838元/kg,平均涨幅为466%。而从2013年6月开始,60头三七的价格呈现断崖式下跌,到2015年8月价格下降到140元/公斤左右。三七价格的剧烈波动可见一斑。

价格波动严重干扰了市场的稳定,给种植三七的药农、以三七为主要原料的药企以及最终的消费者都带了来极大的不确定性和负面影响。对药农来说,由于三七本身就具有较长的生长周期等属性,容易造成价格信号所反映的需求与种植的供给信息错位,再加之价格的剧烈波动,使得药农极易盲目做出错误的种植决策,利益无法保证。对药企来说,三七价格的上涨,直接增加了制药企业的生产成本,造成利润下降,出现赔本销售或者停产。

另外,当药材的价格高于药品的售价时,就出现“药材倒挂”现象,面对这种情况,药企一般面临2种选择,即压缩成本或退出生产。压缩成本通常是降低原材料质量,如原用野生药材生产的药品采用人工栽培的药材代替、用道地药材生产的药品采用非道地药材等。三七不同规格、等级之间的价格差别巨大,对以三七为原料生产的药品而言,三七价格的剧烈波动很容易导致药企以次充好。因此,对消费者而言,价格波动导致药品质量下降,低价药品退出流通市场,只能购买价格更高的替代药品,一方面吃药的质量下降,另一方面医疗费用却上升了。

本文选取了回归滑动平均模型(ARIMA模型)对三七进行价格预测,期望能够对稳定市场价格起到一定作用。通过对三七价格的预测,当预测价格过高时,指导药农的种植及企业的生产,避免价格上涨时药农跟风种植,企业由于成本问题,以次充好或退出市场;价格过低时,避免药农都不种植三七,出现供不应求。同时对三七价格的预警在一定程度上能遏制投机行为,避免三七再一次沦为投机品,起到稳定市场的作用。由于ARIMA模型广泛用于农产品的价格预测中,由于三七具有农副产品的特性,因此采用该模型理论上是可行的。同时,云南文山三七产业局对三七历年的价格有较为详细的统计,因此,使得该预测具有实际操作的可性性。

1三七价格上涨及波动的定性分析

供给与需求的博弈是导致三七价格上涨级波动的主要原因,具体分别由需求拉动、成本推动以及投机行为引起的。

11需求拉动三七价格上涨

三七是治疗心血管疾病药物的主要成分,其指向性明显,具有其他药物无法替代的功效。老年人是心脑血管疾病的高发群体,因此随着我国老龄化程度的不断加深,对以三七为原料的治疗心脑血管疾病药物的需求也呈递增态势。特别是2010年新出台的《基本药物目录》中,将过去不在《目录》中的三七总皂苷、三七血栓通、复方丹参片和复方丹参地丸等药品都收录其中,极大刺激了市场的需求。因此,在需求拉动下,三七价格不断地上涨。

12成本推动推动三七价格上涨

随着种子种苗价格、劳动力成本、土地成本、交通成本等的不断上升,使得中药材种植成本也逐年推高,这也造成了三七价格的上涨。自2009年10月以来,三七种苗从过去的01元/株,涨到到2013年的1元/株;三七种子的价格也从2009年10月之前的几十元/kg,涨到到2009—2014年最高时,达到1 000元/kg。另外,七的种植对地理位置、光、热、水、土、气候等条件要求较高,我国适合种植三七的地区有限,随着三七价格上涨,药农跟风种植三七,对土地需求增加,而适宜种植三七的土地有限,导致地租上涨,三七种植成本进一步增加。

13投机因素加剧三七价格的上涨及波动

中药材具有投机品特性,社会资本热钱参与三七炒作,助推了价格的上涨。随着房地产市场的不景气,大量资本进入中药材市场,由于三七为三年生植物,产地非常固定。绝大部分三七的产地为云南,因此,一旦投机资本控制云南地区的三七价格,就等于控制了全国的三七市场价格。三七作为治疗心脑血管疾病药物的主要原材料,其市场需求也比较稳定,因此,投机资本是导致三七价格波动极大的偏离价值曲线的重要因素。

2009—2014年,三七价格的波动路径基本上可以表示为:投机资本进入市场—三七价格开始上涨—新的《基药目录》出台—三七价格剧烈增长—药农扩大种植面积—投机资本推出市场—价格下跌。由于三七的生长周期长达3年,当市场上价格出现下跌时,再减少三七的种植面积已经来不及了,当年产的三七3年前就已经种植在地里,这种供给和需求的不对称进一步加剧了三七价格的波动。

2样本数据描述

从三七的种植地域性和销售市场性考虑,主要集中在云南地区,而其中的文山三七交易市场,是全国最主要的交易市场,因此本文选取云南文山三七交易市场的价格数据,数据来源为文山三七产业局。

由于中药材的规格品种复杂,因此,本文选取规格为60,80,120头的三七是相对交易量较大的品种,分析其从2009年10月—2015年8月的价格的月度数据。通过这3个品种的关联性中,可以分析出其他三七规格品种的价格走势,见图2。

2009年10月—2014年11月,60头、80头与120头三七的价格变动趋势完全相同。以120头三七价格为例,2004—2009年价格比较平稳,但2009年开始剧烈波动,年底的120头三七价格就已经是年初的5倍;经历了2010年短暂下跌后,就开始持续上涨,一直到2013年6月达到最高点,随后价格迅速下跌。

3计算

常见的价格预测有2种方法:一种是基本因素分析法,即通过供求分析和其他相关因素来分析和预测市场价格走势;另一种是技术分析法,通过假定市场有效,利用价格历史数据进行趋势分析。

基本因素分析法在实际生活中运用较多,但需要对相关信息的全面及时获取,这并不现实。因此在实际运用中,并不能够准确定各因素对价格的影响程度,只能用来做定性分析。因此,在这里选择技术分析法,通过自回归移动平均模型(ARMA)来进行预测,这种方法仅考虑单个变量,不以经济理论为依据,试图找出单变量自身历史走势的规律,进而运用这个规律外推以实现预测,其缺点在于对数据质量要求较高,且方法比较复杂。

31ARIMA模型

ARMA模型由美国统计学家 G E P Box和英国统计学家G M Jenkins创立,亦称BJ方法,是一种常用的随机时序模型。ARMA模型(Auto Regressive and Moving Average Model,自回归移动平均模型)是由AR(Auto Regressive Model,自回归模型)模型与MA(Moving Average Model,移动平均模型)模型自然扩展而来,AR模型与MA模型均是其特例。ARMA模型是根据时间序列本身的数字特征,来寻找变量当期值与其若干滞后期值及误差项之间的关系,并在此基础上对后期数据进行预测,是时间序列分析的常用模型。由于ARMA模型是以AR模型和MA模型为基础“混合”构成,包含了自回归和移动平均2种成分,所以它的阶是二维的。

yt=c+Ф1yt1+Ф2yt2+...+Фpytp+εt+θ1εt1+θ2εt2+...+θqεtq

其中p代表自回归成分的阶数,q代表移动平均成分的阶数,记做ARMA(p,q),即时间序列yt是由它的前p期值及当前和前q期的随机误差项的线性函数,Ф1,Ф2,...Фp是自回归系数,也称记忆函数,描述了ytj(j=1,2,...,p)对/的影响程度,θ1,θ2,...,θp为移动平均系数,εt是随机干扰误差项。

32数据要求与建模步骤

ARIMA(p,d,q)模型要求数据是平稳的时间序列,因此首先需对原序列进行平稳性检验,若序列是非平稳的,则对其进行差分变换,使其满足平稳性条件,所以首先采用ADF单位根检验方法(Augemented DickeyFuller test)对数据进行平稳性检验。

在建立ARIMA(p,d,q)模型之前,需要对模型进行识别,确认模型的形式。d表示的是对原序列进行差分的阶数,用平稳性检确定,通过然后绘制自相函数ACF和偏相关函数PACF图,确定AR和MA的滞后阶数p,q,建立ARIMA(p,d,q)模型。模型建立后估计模型的参数,根据滞后多项式根的倒数判断模型是否平稳,以及模型的拟合效果和合理性。为检验模型的估计结果是否满足随机性要求,需要对ARIMA(p,d,q)模型进行残差序列相关性检验。最后利用所建立的模型进行预测,从而评价模型的好坏。本文所有的建模步骤均是在计量经济分析软件Eviews70中完成,具体建模步骤见图3。

33ARIMA模型在三七预测中的应用

本文的三七价格预测中,根据文山三七产业局提供的资料,选取的是2004年1月—2015年8月规格为120头的三七价格,建立命名为PRICE的时间序列。

331平稳性检验首先,通过绘制水平序列的自相关函数图,对水平序列的平稳性进行检验。偏相关函数是截尾的,而自相关函数则是随着滞后阶数的增加缓慢下降为0,在滞后28期后仍未下降至0,表示水平序列是非平稳的,见图4。

其次,通过确定单阶整数,对原时间序列进行

图3基于ARIMA模型预测的一般步骤

Fig3The prediction steps based on ARIMA model

图4水平序列自相关函数图

Fig4The autocorrelation function of level sequence diagram

单位根检验,进一步检验水平序列的平稳性。本文采用ADF单位根检验方法,通过绘制原时间序列的散点图对单位根检验的形式做出初步判断。PRICE时间序列的水平变量存在截距项,但没有时间趋势,即检验形式为包含截距项不含时间趋势,见图5。

图5变量price的水平变量时间序列

Fig5Time series graph of level variable

第三,对初步判定的形式进行显著性检验,根据AIC信息准则自动选择滞后阶数。对水平序列进行ADF单位根检验,从单位根检验的结果来看,在1%,5%,10%的显著性水平下,t值均小于三者水平的绝对值,所以接受原假设,水平序列为非平稳序列,具有单位根。因此,ADF单位根检验结果与水平序列自相关函数的检验结果一致。

最后,由于水平序列是非平稳的,因此对原时间序列进行一阶差分,对PRICE进行一阶差分的时间序列,进行一阶差分后变量呈周期性变动,既不含含截距项也不含时间趋势,见图6。然后对其进行ADF单位根检验,T统计量的绝对值大于1%水平的绝对值,所以在1%的显著性水平下拒绝原假设,即PRICE的一阶差分序列不具有单位根,是平稳序列。

图6变量price的一阶差分时间序列

Fig6The firstorder differential time sequence diagram of variable price

332ARIMA(p,d,q)模型的识别ARIMA(p,d,q)模型的识别是通过确定p,d,q 3个参数,使得模型最优。在d的识别中,由于d是对序列进行平稳性检验,PRICE序列经过一阶差分后通过了平稳性检验,因此d为1。

在p, q的识别中,借助自相关函数ACF图和偏相关函数PACF图对p和q进行初步的判断。AR(p)模型,其PACF应该在p期之后突然降为零,而对于MA(q)模型,因为其可以转化为AR(∞)形式,所以对应的PACF应该呈现逐渐衰减向零趋近的态势。同理,MA(q)模型,其ACF应该在q期之后突然变为0;而对于AR(p)模型,因为可以转化成MA (∞)形式,所以其ACF应该呈现逐渐衰减向零趋近的态势。图7为PRICE一阶差分序列ACF和PACF图。偏相关函数是滞后3期截尾,自相关函数滞后3期截尾,因此初步判定模型可设定为ARIMA(3,1,3),ARIMA(3,1,2),ARIMA(3,1,1),ARIMA(2,1,3),ARIMA(2,1,2),ARIMA(2,1,1),ARIMA(1,1,3),ARIMA(1,1,2),ARIMA(1,1,1)这9种形式,见图7。

333模型识别及模型诊断检验识别ARIMA模型的形式后,对ARIMA(2,1,3)模型进行参数估计。模型估计结果的拟合优度R2=0217 836,2=0187 982,F统计量=7296 803,其相应的P为0,说明模型整体上是显著的,且模型的拟合效果也比较好。

ARIMA(2,1,3)模型参数估计后,检验模型的正确性。回归结果残差序列相关性是很重要的一项指标,因此对估计模型进行残差序列相关性检验,残差序列不相关称为白噪声。残差序列的白噪声检验通常用的是Q统计量,检验的原假设是残差序列±st不存在自相关。模型残差序列相关图和Q统计量见图8。从图中可以看到,残差序列的样本自相关函数都在95%的置信区间内,从滞后1阶至28阶的自相关函数相应的概率值远大于检验水平005,因此不能拒绝原假设,即认为模型ARIMA(2,1,3)估计结果的残差序列不存在自相关。

334模型预测根据上述分析,所建立的ARIMA(2,1,3)模型是合适的,因此可以用其对三七的价格进行预测。作者对2015年9月—2015年12月对价格用动态方法预测,动态预测是根据选择的一定的估计区间,进行多步向前预测。动态预测结果见图9,红色虚线是2倍标准差置信区间。由于是对2015年9月—2015年12价格一阶差分进行预测,因此需要将预测的一阶差分序列转化为水平序列。

a一价差分的预测值;b预测值加1倍标准差;c预测值减1倍标准差。

图9模型预测的2015年9月—2016年8月三七一阶差分的价格

Fig9The prediction Notoginseng Radix et Rhizome price of firstorder difference from September 2015 to August 2016

2015年9月—2016年8月 ,三七的价格波动幅度小于2009年10月—2014年11月的三七价格的平均波动幅度,以前年份相比,未来三七价格呈现小幅下降趋势见图9。同时,2015年9月—2016年8月,12个月份的三七价格在122~125元/kg波动,基本保持平稳,见表2。

本文借助自回归积分滑动平均模型的动态预测方法,通过三七价格本身的自回归过程和移动平均过程,对三七未来一年的价格进行预测。由于使用ARIMA模型与测时不必考虑其他因素的影响,而仅从水平序列本身出发,建立相应的模型进行预测,这就从根本上避免了寻找主要因素即识别主要因素和次要因素的困难,而对于经济现象的时间序列又主要呈现出短期相关性,因此对时间序列的短期预测效果较好,随着预测期增加,模型预测的相对误差也在变大。

4三七价格变动规律及预测结果准确性讨论

由于三七疗效的指向性较强,市场需求波动较小,在没有其他因素的影响下三七价格比较稳定。当存在外力因素影响三七的供给或需求时,由于其生长周期为3年,导致三七的供给与需求存定一定的时滞性,其价格波动周期一般为3年,价格从波峰到波谷的时间为6年。

很多学者在宏观经济指标、金属商品价格预测以及农畜产品价格预测方面,都尝试利用ARIMA模型,得出了有效并适用的结论。

使用ARMIA模型对价格指数、GDP增长和汇率变动等宏观经济指标进行预测。Rahul Ranjan等(2012)认为物价指数在政府评估宏观经济形势中有非常重要的作用,在深了了解各种预测方法、技术在实践中的应用后,Rahul Ranjan根据1991年1月—2012年1月的物价指数月度数据,建立 ARIMA(2,1,1)模型,预测印度2012年2月—2013年1月这12个月的物价指数,研究结果表明,预测的物价指数与实际物价指数之间的误差非常小,预测的最大误差为53%,物价指数的预测值遵循实际价格指数的趋势线[1]。熊志冰(2011)在深入分析ARIMA模型与神经网络NN模型的基础上,建立了ARIMA融合NN的人民币汇率时间序列预测模型,将汇率时间序列的数据结构分解成线性自相关主题和非线性残差部分,对这两部分分别采用部同的估计方法。研究结果表明人民币汇率市场并部符合有效市场假设可以通过模型对汇率未来走势做出较为准确预测[2]。龚国勇(2008)在分析了1979年—2006年深圳国内生产总值的基础上,对深圳以GDP为样本的时间序列建立ARIMA(2,1,1)模型,预测深圳短期内的国内生产总值,预测结果为2007年深圳的GDP为6 57856亿元,深圳市2007年的实际GDP为6 850亿元,模型的预测误差为413%在可以接受的误差范围内,模型预测效果较好[3]。

利用ARIMA模型在大宗金属商品上进行价格预测,显示是有效的。王雪飞,刘志伟以中国钢铁市场的价格为研究对象,利用我国8种主要钢材品种2004年1月—2010年11月的价格数据,建立ARIMA模型,预测我国2010年12月—2011年3月这4个月钢材的价格,通过对模型的检验和预测结果的比较,预测的最大误差为2787%,模型是有效设定的,2010年12月大部分的钢材价格会有一次上涨,而到2011年则呈现小幅下降的趋势 [4]。许志平,罗明志在分析了影响黄金价格的因素后,以伦敦现货黄金月度价格为依据,建立ARIMA模型,预测并分析短期内黄金的价格走势,为我国调整外汇储备结果,增加黄金储备提供政策依据[5]。

在农产品、畜产品的价格预测中,适用性比较好。Manish Shukla等为了研究ARIMA模型在蔬菜批发市场上的适用性,利用在印度艾哈迈巴德批发市场上的销售数据,建立ARIMA模型。结果表明ARIMA模型可以用于预测绝对百分比误差在30%内的市场需求,在需求和价格都极不稳定的蔬菜批发市场这个误差范围是可以接受的,因此ARIMA模型可以有助于农民和批发商做出有效决策[6]。吴敬婷在畜产品价格的预测中比较自回归移动平均发与季节自回归移动平法,发现当用季节ARIMA得不到最优的预测模型时,可以使用非季节ARIMA模型来代替,弥补季节ARIMA的不足之处,但整体来看,季节ARIMA模型能更准确的预测未来畜产品的价格走势,2012年1月份和2月份的猪肉价格走势为先是一小段时间价格上升,然后持续下降,当价格下降到最低谷后再持续上升到2011年12月份的价格水平,而2012年1—2月实际猪肉价格正好反映出这种价格的波动趋势[7]。

由于ARIMA模型在价格预测方面的有效性,特别是在农畜产品价格预测中的应用,考虑到三七的农副产品属性,笔者认为采用ARIMA模型对三七价格进行预测在一定误差范围内是有效的。

5建议

投机资本的进入在一定程度上活跃了三七交易市场,促进了资源的优化配置,但也造成三七产业的大起大落。鉴于中药材生长的道地性,云南地区中药材产量丰富,更是三七的主要产地,因此建议考虑建立中药材平准基金等储备机制建设,防范恶意囤货,减少市场投机,让中药材由投机品回归商品属性;对于价格信号失灵、信息不对称造成的价格上涨,应加快中药材期货交易市场和电子信息平台的建设,发挥期货市场的价格发现和引导作用,促进三七种植户及时了解是市场行情,避免跟风种植,提高对市场的判断力。

重视对三七,以及其他大宗中药材价格的研究,对综合指数及其他分类指数的研究工作需要逐步深入,进行预测模型和预警机制的研究,不仅能够应对中药材价格的市场波动,而且对广大药农、药企起到切实的指导作用。

重视中药资源信息化的工作,是解决中药资源市场严重信息不对称,从根本上缓解价格信号失灵的有效举措。国家已经开始加大投入,进行中药资源动态检测体系。但是,在互联网和大数据的背景下,需要在互联网思维下重新定义信息化,重新思考中药资源信息化的概念、内容和实现路径。将“中药资源信息化”升级为“互联网+中药资源”,通过数据化重新用互联网概念定义中药资源信息化,通过数据化更加有效配置中药资源市场的资源,解决信息不对称的深层问题。

[参考文献]

[1]Rahul Ranjan, Priyanka Varma, Abhishek Kumar Chintu Forecasting India′s food price index using ARIMA model[J] Int J Appl Financ Manag Perspect, 2012, 1(1):1.

[2]熊志斌 ARIMA融合神经网络人民币汇率预测模型研究[J] 数量经济技术经济研究, 2011 (6):64.

[3]龚国 ARIMA模型在深圳GDP预测中的应用[J] 数学的实践与认识, 2008, 38(4):53.

[4]王雪飞, 刘志伟 基于ARIMA模型的中国钢材市场价格预测[J] 中国城市经济, 2011 (1):20.

[5]许志平, 罗明志 基于ARIMA模型的黄金价格短期分析预测[J] 财经科学, 2011(274):26.

[6]Manish Shukla, Sanjay Jharkharia Applicability of ARIMA models in wholesale vegetable market: an investigation[C] Malaysia:2011 International Conference on Industrial Engineering and Operations Management Kuala Lumpur, 2011:1125

[7]吴敬婷 基于ARIMA模型的畜产品价格预测系统的研究[D]. 哈尔滨:东北农业大学,2012

[责任编辑孔晶晶]

猜你喜欢

三七
三七茜草宫内缓释硅橡胶棒的制备及体外释放性能的初步评价
药用植物DNA标记辅助育种(一):三七抗病品种选育研究
三七的化学成分和药理作用研究
超声辅助提取结合高效液相色谱
三七的炮制研究与规范