APP下载

基于组合模型的云南省卷烟需求预测与结果评价研究

2019-03-11赵旻张丹枫曾中良谢东风李青徐路宁

中国烟草学报 2019年1期
关键词:置信度精准度宏观经济

赵旻,张丹枫,曾中良,谢东风,李青,徐路宁

1 云南省烟草专卖局(公司),信息中心,云南省昆明 650000;

2 云南省烟草专卖局(公司),卷烟销售管理处,云南省昆明 650000;

3 北京中软国际信息技术有限公司,互联网ITS集团MSO中心,北京海淀 100000

目前关于卷烟需求预测的研究成果有很多。文献[1]利用1997-2002年中国烟草行业和相关经济学指标,从宏观层面构建了我国卷烟消费需求的数学模型,认为居民消费支出、卷烟价格、地区差异、经济增长、产业升级、城乡居民消费差异和卷烟平均消费倾向等因素对我国卷烟需求具有显著影响。文献[2]以2008-2012年云南省宏观经济数据和销售数据为基础,通过脉冲响应函数得到宏观经济对卷烟市场运行的影响具有一定的滞后效应;方差分解分析结果显示在短期和中期投资对卷烟市场拉动的效果最为显著,消费对卷烟市场拉动的效果最不显著。文献[3]基于2007-2013云南省宏观经济数据和销售数据,分析城镇农村市场差异,明确了对农村城镇市场分别进行预测分析的思路,提出了销售额数据按照不同CPI还原的思路,降低数据受价格指数变动影响程度;并运用PCA主成分分析,对销售数据基于宏观经济数据的表达式进行了解读。但现有的卷烟需求预测研究存在一些不足,首先,都是运用当期的宏观经济指标预测当期的卷烟销量,实际可操作性较差,不能满足烟草行业的预测需求;其次,文献中均未基于预测实际情况,开展模型的稳定性评价研究。

本文构建了一种适合云南烟草行业需求预测的方法体系,并对需求预测模型进行了动态评判。

1 需求预测思路

由于各品类季节性差异大,销售曲线完全不同,可以按品类单独构建预测模型来预测其销量。

本文运用IBM SPSS Modeler为分析工具,以云南省2009-2016年的宏观经济数据和卷烟销量数据为基础,构建组合预测模型预测云南省卷烟销量。在数据处理阶段,运用居民消费价格指数(CPI)对宏观数据和销量数据进行处理[3];在指标选择上,运用时差相关分析法和简单相关分析法分析宏观经济指标与卷烟销量的相关关系,选择了科学的模型指标,在预测时间点运用宏观经济数据进行回归;在模型构建上,通过构建组合预测模型[4][5][6](ARIMA模型[7]和回归模型[8])预测卷烟销量;在对模型稳定性评价上,通过计算模型的预测精度、置信度等对模型进行实时评价,构建了新的评价体系,确保预测模型科学可信。

2 预测过程

以对云南省卷烟总量预测为例,对宏观经济指标选择、模型构建、模型评价等过程进行分析及说明。

2.1 数据获取及预处理

图1 需求预测路径Fig.1 The route of demand forecast

宏观经济领域的经济活动会在一定程度上影响和反映卷烟需求市场波动状况。通过查阅文献资料,结合数据可得性,选定规模以上工业增加值、固定资产投资、社会消费品零售总额、进出口贸易总额、地区生产总值、第一产业增加值、第二产业增加值、第三产业增加值、农林牧渔服务业总产值、城镇常住居民人均可支配收入、城镇居民人均消费支出、农村居民人均现金收入、居民消费价格指数(CPI)、第三产业占GDP比值等指标进入备选指标库。

考虑到宏观数据的情况,采用季度数据进行预测,2009年1季度到2016年3季度共31个样本。CPI反映居民家庭购买消费商品及服务价格水平的变动情况。本文利用居民消费价格指数(CPI)对本研究中涉及货币的数据进行价格可比调整,逐期缩减至基期,折算CPI原始值。现有CPI数据共有城镇CPI、农村CPI、综合CPI、烟酒食品CPI等若干细分类。本文选择2010年1月为基期,所有月份CPI均先逐年同比到2010年同月,再环比折回2010年1月。

2.1.1 原始的CPI计算原理

现将原始CPI同除以100,即得到:

2.1.2 将所有的CPI1换算成2010年对应月份为基期的同比CPI2。

如:求2008年9月同比2010年9月的CPI1,即:

2.1.3 以2010年对应月份为基期的同比CPI2,换算成以2010年1月为基期的CPI3。

如:求CPI3(2007.3/2010.1)

2.1.4 2010年各月环比的求解

由:环比的增长率=当期消费价格/上一期消费价格-1

则有:环比CPI=1+环比增长率

已知CPI综合2012年各月的环比,及2012年对应2011年各月同比消费价格指数,求2011年各月环比,配合2011年对应2010年各月同比CPI,进而求得2010年各月的环比 CPI。

2.1.5 对应分析周期处理数据周期

CPI综合用于GDP、社会零售品总额、固定资产投资经济指标换算,CPI烟酒用于销售额换算。各类型的CPI算法相同,均为折算到同一个基期。

2.2 指标体系构建

2.2.1 指标选择方法

本文运用时差相关分析和相关分析法来对指标进行筛选,再将与卷烟销量有较强相关关系的宏观经济指标纳入回归模型对卷烟需求进行预测,同时考虑到宏观经济指标公布的滞后性以及经济指标本身反映经济活动的滞后性,引入滞后期概念,运用先行宏观经济数据预测当期销量。

● 时差相关分析

时差相关分析是利用时差相关系数验证经济时间序列先行、一致、滞后关系的一种常用方法。选定应变基准指标,使被选自变指标超前或滞后基准指标若干期,计算它们的相关系数,最大的相关系数对应的移动月数为该应变指标延迟数。即:设基准指标为Y,被选指标为X,然后计算Y和X的时滞为k的时间序列之间的相关系数kr(k=0,±1,±2,…),能使相关系数最大的时滞k,即为该指标的先行或滞后月份。

式中k表示超前或滞后期,k取负值时表示超前,取正数时表示滞后,k被称为时差或延迟数。一般来讲,最大的时差相关系数最好大于0.5,这样说明时滞性比较明显,否则说明入选的指标的时滞意义不明显。

● 相关分析

相关分析是变量之间相关程度的指标。相关系数的取值在-1到1之间。

2.2.2 指标筛选结果

以卷烟销量为基准指标,以宏观经济指标为备选指标进行时差相关分析。通过时差相关分析结果发现规模以上工业增加值、进出口贸易总额、农村居民人均现金收入和第三产业占GDP比重4个指标先行1-4期与卷烟销量的相关系数都小于0.5,说明这六个指标与卷烟销量的相关性较低,对预测卷烟销量的贡献较小,从备选指标库删除。

表1 时差相关分析结果Tab.1 The result of time difference correlation analysis

再通过宏观经济指标间的相关性分析,将高度相关的几个指标用一个指标来替代,用此指标反映这一类指标对卷烟销量的影响,即通过主成分分析,避免较多指标的搜集工作,提高工作效率。

下表是地区生产总值与其他宏观经济指标间的相关系数,地区生产总值与第一产业总值、第二产业总值、第三产业总值的相关系数均高于0.9,且这四个指标均反映生产总值数据,反映的经济因素相似,故用地区生产总值替代这一类指标。从备选指标库删除第一产业总值、第二产业总值、第三产业总值。

表2 第一产业总值与其他各宏观经济指标相关系数表Tab.2 The correlation coefficient between total production value of the primary industry and other macroeconomic indicators

综上,云南卷烟销量预测的宏观经济指标池保留固定资产投资、社会消费品零售总额、地区生产总值、农林牧渔服务业总产值、城镇常住居民人均可支配收入、城镇居民人均消费支出、期末常住人口。

2.3 预测模型构建

2.3.1 预测模型方法[5][6][7][8][9][10]

运用筛选后的宏观经济指标和卷烟销量分别建立回归预测模型和时间序列预测模型对不同品类的卷烟市场需求进行预测,再进行预测结果拟合。

● 时间序列模型

ARIMA模型[7]是现代时间序列预测的一种常用方法(又叫博克思-詹金斯法),即求和自回归移动平均模型,预测模型为:

其中q为滑动平均模型的阶数,Yt为时间序列在t期的观测值,et是时间序列模型在期的误差或偏差,et-q是时间序列模型在t -q期的误差或偏差,φ1,φ2,...,φp是滑动平均模型的参数。

● 回归预测模型

本文主要运用多元线性回归[8]进行市场预测,了解两个或多个变量间是否相关、相关方向与强度,并通过处理多变量间相关关系形成一个统计预测模型以观察特定变量预测销量销售额数据。

● 最小二乘法确定组合预测模型权重[9]

得到时间序列及回归预测模型预测结果后,构造二次规划的模型,其

约束条件为

其中i为预测模型的种类,k为用来预测的模型的总数,Yt为实际值(或观测值),为预测值,构造式的广义拉格朗日函数在极值点应满足,分别对ω、λ求偏导得方程组,通过解这个的方程组,即可以得到各权重系数ωi。

运用矩阵计算简化模型计算。设在某个时刻t的观察值(实际值)为Yt,设第i种预测方法的组合系数或权重为ωi,取权向量,且满足

于是组合预测模型写成向量形式为

我们运用k种预测方法,对n个数值进行预测得到n×k矩阵的预测矩阵为

则上式可写为 AW = Y

运用矩阵的运算ATAW=ATY

则运用矩阵的计算可以求出权向量W。

2.3.2 预测模型及结果

运用云南省2009年1季度至2016年3季度的宏观经济数据和卷烟销量数据,通过构建组合预测模型,预测云南省2016年4季度及2017年1季度的卷烟总需求量。

对卷烟销量的历史数据进行时间序列预测,记一阶差分调整后的销量序列为,建立ARIMA(1,1,1)模型:

模型调整后的R2为0.89,拟合度较高。

本文运用先行两期的宏观经济指标数据对当期卷烟需求进行预测,运用逐步回归法最终进入回归模型的指标有国内生产总值(GDP)、社会消费品零售总额(consume)、城镇居民人均可支配收入(income)三个指标,记回归预测值为,建立回归模型:

模型调整后的R2为0.93,拟合效果较好。

运用最小二乘法计算两个预测模型的权重,运用最小二乘法计算两个预测模型的权重,根据前面的定义可知

从而:

最终得到2016年4季度及2017年1季度的预测结果如下表所示,从表中可知,跟实际销量相比预测结果的误差均在3%以下,预测结果可信。

表3 云南省总量预测结果Tab.3 The forecast result of Yunnan cigarette demand

图2 云南省一类烟销量预测拟合效果Fig.2 Fitting result of thefirst class cigarette sales forecast of Yunnan

同理,分别构建云南省一类烟、二类烟、三类烟的预测模型,得到各品类卷烟的拟合效果如下三图所示:

图3 云南省二类烟销量预测拟合效果Fig.3 Fitting result of the second class cigarette sales forecast of Yunnan

图4 云南省三类烟销量预测拟合效果Fig.4 Fitting result of the third class cigarette sales forecast of Yunnan

2.4 模型评价

2.4.1 模型评价方法

通过查找相关文献[11]发现,对模型稳定性评价研究较少。本文创新性的以历史建模预测误差为基础,计算不同误差值的置信度,根据可接受的置信度范围对模型稳定性进行判定,确保模型科学可靠。

评价标准及计算步骤如下:

1.根据业务需要设定预测精准度及预测精准度置信度,本文设定预测精准度=90%,置信度=88%

2.计算预测模型的预测精准度。

3.计算预测精准度的置信度。

4.根据设定的预测精准度和置信度对模型稳定性进行评价,若模型未达到设定标准,则重新建模进行预测。

2.4.2 模型评估结果

2010年1季度至2016年3季度云南省预测模型的拟合误差如下图,组合预测模型的预测误差波动相对比较稳定,虽然不能保证每个时点的预测精度最低,但用组合模型对所有时点的预测是最优的,预测结果也更加贴近实际结果。基于组合预测模型的预测误差,计算其不同预测精准度下的置信度。鉴于不同地区的销量变化趋势不同,构建的预测模型不同,需针对不同的情况设定不同的评价标准。

本文确定三类评价标准:

A级:模型预测精准度90%以上,置信度90%以上,共有4个地市(含云南省)满足;

图5 云南省总量预测模型误差比较图Fig.5 Comparison diagram of prediction error among three methods

B级:不满足A级标准,但模型预测精准度85%以上,置信度88%以上,共有12个地市满足;

C级:不满足A、B级标准,模型预测精准度85%以上,置信度88%以下,共有1个。

云南省总量预测模型预测精准度为90%时,置信度92.85%;预测精准度85%时,置信度100%。根据设定的评判标准,则可将云南省总量预测模型评为A级,此预测模型稳定性较好,预测结果科学可信。

针对A级预测结果的地市,预测结果可直接运用,针对B级预测结果的地州,进行进一步的观测与数据追踪,针对C级预测结果地州,需逐个具体进行分析,对基础数据、业务开展情况、模型科学性进行进一步验证。

3 结论

本文以云南省宏观经济数据和销量数据为基础,构建了一套合理的适合烟草行业需求预测的方法,并通过实际验证得到云南需求预测结果误差在3%以内,模型稳定性评价为A级。本文的创新之处有以下几点:一是鉴于宏观经济数据公布的滞后性,并考虑到卷烟行业需求预测的实际需求,在验证可行的情况下,在模型构建阶段,运用先行两期的宏观经济指标来预测当期的卷烟需求量,预测结果科学有效。二是在组合预测模型的权重计算上,运用最小二乘法计算回归预测模型和时间序列预测模型的权重,确保组合预测模型结果的科学性。三是在对模型稳定性评价上,以建模预测结果的平均相对误差及置信度为基础,研究出了一套适合云南卷烟需求预测的模型评判标准,并运用判定标准对模型的稳定性进行判定,确保模型科学可靠。

猜你喜欢

置信度精准度宏观经济
基于数据置信度衰减的多传感器区间估计融合方法
一种基于定位置信度预测的二阶段目标检测方法
即时经济:一场实时革命将颠覆宏观经济实践 精读
硼铝复合材料硼含量置信度临界安全分析研究
主要宏观经济指标及债券指标统计表
让党建活动更加有“味”——礼泉县增强“两新”党建精准度
全球宏观经济短期内的两条主线
从G20视角看国际宏观经济政策协调
基于高精度差分法的线性常微分方程边值问题研究
正负关联规则两级置信度阈值设置方法