APP下载

基于ARIMA的小批量物料生产需求预测模型研究

2023-09-18高龙

现代信息科技 2023年15期
关键词:需求预测

高龙

摘  要:在多品种小批量的物料生产中,企业往往无法事先确定物料的生产需求,导致出现过度生产或供应不足的局面。文中以某电子企业小批量物料需求历史数据为基础,采用优劣解距离法(TOPSIS)从中选择一种值得重点关注的物料作为研究对象,通过建立ARIMA时间序列模型对未来短期内该物料的生产需求量进行预测。经验证,该模型对预测短期内企业物料生产需求具有一定的指导性和参考价值,可以为企业物料生产计划的制定提供决策依据。

关键词:需求预测;小批量物料;TOPSIS;ARIMA

中图分类号:TP311;TP39 文献标识码:A 文章编号:2096-4706(2023)15-0097-05

Research on the Small Batch Material Production Demand Prediction Model Based on ARIMA

GAO Long

(Lanzhou Petrochemical University of Vocational Technology, Lanzhou  730060, China)

Abstract: In the production of multiple-variety and small-batch materials, enterprises often cannot determine the production demand of materials in advance, leading to overproduction or insufficient supply. Based on the historical data of small batch material demand in a certain electronic enterprise, the TOPSIS method is used to select a material that deserves special attention as the research object. By establishing an ARIMA time series model, the production demand for this material in the short term in the future is predicted. After verification, this model has certain guidance and reference value for predicting the short-term material production demand of enterprises, and can provide decision-making basis for the formulation of enterprise material production plans.

Keywords: demand prediction; small-batch material; TOPSIS; ARIMA

0  引  言

隨着市场竞争的加剧,企业竞争越来越强调基于客户需求的竞争,生产类型也从大量流水生产转为多品种小批量的模式。而多品种小批量的生产方式强调根据客户需求进行生产,避免过度生产和库存积压,从而降低库存成本,提高产品市场竞争力。但在多品种小批量的物料生产中,由于物料实际需求变化多样,企业往往无法事先确定物料的实际需求量,导致不能合理地安排物料生产[1]。因此通过分析企业已有的小批量物料生产需求历史时序数据,建立需求预测模型,帮助企业有效掌控物料生产规模,合理制定生产计划就显得十分必要了。目前国内外对于基于时间序列数据的需求预测研究已经有了较为详细的理论体系,但围绕企业小批量物料生产需求预测的研究偏少,本文以某电子企业小批量物料需求历史数据为研究数据,应用优劣解距离法(Technique for Order Preference by Similarity to an Ideal Solution, TOPSIS)从中选择一种物料作为研究对象,利用时间序列的特点,建立基于时间序列的差分整合移动平均自回归模型(Autoregressive Integrated Moving Average Model, ARIMA),以周为单位对小批量物料生产的需求进行预测。实验结果表明,利用ARIMA模型预测短期内企业小批量物料生产需求具有一定的指导性和参考价值。

1  研究物料的选择

1.1  数据处理与特征构建

原始数据集包含22 453条时间为2019年1月2日到2022年5月21日期间的物料需求信息数据,共有284种物料,数据集中每种物料的基本信息格式及示例如表1所示。

分析原始数据可以发现,小批量物料的生产需求往往具有周期性、变动性和复杂性,同一周期内,不同品种的物料需求不一样,不同周期间,相同品种的物料需求也不一样。在生产实际中,很多物料需求的发生频次只有一两次,如果工厂对每个物料都做一遍需求分析预测,不仅会浪费很多时间而且也不现实。因此,通过对原始数据提供的284种物料需求的历史数据进行分析,本文从中选择1种应当重点关注的物料作为研究对象,并以周为基本时间单位,预测物料的周需求量。将原始数据中第1次出现的时间(2019年1月2日)所在的周设定为第1周,以后的每周从周一开始至周日结束,例如,2019年1月7日至13日为第2周,以此类推,共计177周次。以编码为6004020918的物料为例,处理后的数据如表2所示。

要从284种物料中选出最值得重点关注的1种,就需要考虑每种物料的需求周数、需求发生频次、需求量、销售单价、销售总价等因素进行综合评价选择。因此需要进一步做数据处理,构建上述5种特征并聚合数据,结果如表3所示。

原始数据中的284种物料的需求周数,在需求周内的需求发生总频次、总需求量、销售单价均值和销售总价均值如上表所示,此数据表构成了一个284×5的矩阵X,基于X构建TOPSIS综合评价模型,对284种物料进行综合得分指数排序,选择得分指数最高的物料。

1.2  TOPSIS模型

TOPSIS法是一种组内综合评价方法,基本过程为基于归一化后的原始数据矩阵X,度量各评价对象与正理想解和负理想解间的距离,获得各评价对象与正理想解的相对接近程度,以此作为评价优劣的依据[2]。TOPSIS算法流程[3]如算法1所示。

算法1:

输入:原始数据集X = {x1,x2,…,xn};各指标权重w = {w1,w2,…,wn}

输出:各数据样本的TOPSIS评价结果

1)对原始数据集X中的指标属性同向化,得到X′

2)构造向量归一化后的标准化矩阵Z = {z1,z2,…,zn}

3)for Z的每一列Zi do

4)负理想解Z -的第i维度←Zi元素最小值

5)正理想解Z +的第i维度←Zi元素最大值

6)end for

7)for zi ∈ Z do

8)zi与正理想解的接近程度

11)end for

12)根据Ci大小排序

按照TOPSIS模型建立步骤,首先对284种物料按照需求周数、需求发生总频次、总需求量、销售单价均值和销售总价均值5个指标组成的原始矩阵X284×5做同向化处理,由于构建的5个指标均为极大型指标,所以此步骤可省略。对矩阵X284×5进行标准化处理以消除不同量纲之间的影响,将标准化后的矩阵记为Z,标准化处理按式(1)进行:

式(1)中,Zij为第i种物料的第j个指标归一化后的值。

正理想解Z +和负理想解Z -分别由Z中每列元素的最大值和最小值构成,经过算法1中的步骤2)~6)的求解,得到284种物料中正理想解和负理想解,如表4所示。

算法1中,TOPSIS在计算各评价对象与Z +和Z -的接近程度时,需要确定每个指标的权重wj,wj的确定往往由决策者给出或基于信息论的熵值法,本文采用后者。熵值法通过各指标值的变异程度来确定指标权数,仅依赖于数据本身的离散程度。指标的离散程度越大则熵值越大,表明指标值提供的信息量越多,则该指标的权重也应越大[4]。计算过程如算法2所示。

算法2:

输入:原始数据集X = {x1,x2,…,xn}

输出:各指标的熵权系数

1)对原始数据矩阵X同向化,得到X′

2)通过正向化矩阵X′计算概率矩阵P,

按照算法2求得物料的周数、需求发生总频次、总需求量、销售单价均值及销售总价均值的熵权系数,如表5所示。

计算出正负理想解和物料各指标的熵权系数后,按照算法1步骤8)~12)计算可得284种物料的综合得分指数,排序后选出的物料编码为6004020503。

2  ARIMA算法原理

ARIMA模型,即差分整合移动平均自回归模型,其分为自回归模型(Autoregressive model, AR)、移动平均模型(Moving Average model, MA)和自回归移动平均模型(Autoregressive Moving Average model, ARMA)。

AR模型表现为观测值Xt与其滞后p阶观测值的线性组合加上随机误差项,即:

Xt = φ1 Xt-1 + φ2 Xt-2 + … + φp Xt-p + αt       (2)

式(2)中,Xt为零均值平稳序列,αt为随机误差项,φ为模型回归系数。AR模型通常简记为AR( p)。

MA模型表现为观测值Xt与先前t-1、t-2、…、t-q个时刻进入系统的q个随机误差项αt、αt-1、…、αt-q的线性组合,即:

Xt = αt - θ1αt-1 - θ2αt-2 - … - θqαt-q         (3)

式(3)中,θ为模型回归系数。MA模型简记为MA(q)。

ARMA模型观测值Xt不仅与其以前p个时刻的自身观测值有关,而且还与其以前时刻进入系统的q个随机误差存在一定的依存关系[5],即:

Xt = φ1Xt-1 + φ2Xt-2 +…+ φp Xt-p + αt - θ1αt-1 - θ2αt-2 -…- θqαt-q  (4)

由式(4)可知,ARMA (p,q)模型其实就是AR( p)模型与MA (q)模型的組合。

时间序列的平稳性是合理进行时间序列分析和预测的重要保证,因此在进行ARMA建模之前,待分析的时间序列必须满足平稳性条件,非平稳时间序列可通过差分法使之平稳化并进行平稳性检验。时间序列通过d阶差分平稳化后,建立ARMA模型进行分析,待模型进行参数估计之后,再通过数据变换的可逆性使得模型参数估计结果适应平稳化之前的数据[5]。通过此过程建立的模型称为整合的ARMA模型,即ARIMA( p,d,q)模型。

3  模型构建及应用

3.1  时间序列的平稳化检验

对选出的编码为6004020503物料的周需求时间序列数据进行训练集测试集划分,将1~170周的数据作为训练集,171~177周的数据作为测试集。对训练集原始时间序列进行可视化描述,如图1所示。

从图1可以看出,序列不是在某个均值上下波动,呈现出非平稳性。但仅从图形描述来判断时间序列平稳性的准确性往往有限,因此本文使用单位根检验的方法对6004020503物料的时序数据的平稳性进行检验。一个时间序列如果能通过差分的方式平稳化,则称其具有单位根,即当一个时间序列具有单位根是非平稳的。原假设H0和备择假设H1:

H0:时间序列具有单位根

H1:时间序列没有单位根(即是平稳序列)

本文采用Python第三方的统计分析库statsmodels中提供的adfuller函数对原始数据和原始数据的一阶差分数据分别进行Dickey-Fuller[6]单位根检验,结果如表6所示。

从表6可以看出原始数据单位根检验并不显著,没有充分的理由拒绝H0,即原始序列具有单位根,是非平稳序列。一阶差分序列的单位根检验的P值非常显著,因此拒绝H0,接受H1,即一阶差分序列是平稳序列。

3.2  ARIMA模型识别

ARIMA( p,d,q)模型的识别即确定参数p,d,q具体数值的过程,该过程也称为ARIMA模型的定阶。由于在前文所述的时间序列的平稳化中,非平穩的原始时间序列经过一阶差分后就平稳化了,因此参数d = 1。ARIMA模型p、q参数的定阶可通过自相关系数(Autocorrelation Function, ACF)图和偏自相关系数(Partial Autocorrelation Function, PACF)图来进行,图2为原始时间序列数据一阶差分后得到的ACF和PACF图。

图2中的ACF图在滞后期q = 4之后截尾,而PACF图在滞后期p = 4之后截尾,因此可以把模型初步设定为ARIMA(4,1,4)。但利用图形定阶只是一种模型识别的辅助手段,因此本文通过网格搜索计算ARIMA所有可能模型的贝叶斯信息准则BIC[7](Bayesian Information Criterion),根据计算出的BIC指数最小的模型作为识别依据。根据BIC准则绘制如图3所示的热力图,从图中可以看到BIC最小值对应的参数分别为p = 1,q = 4,因此最终将模型设定为ARIMA(1,1,4)。

3.3  模型参数估计及检验

确定ARIMA模型的具体形式后,利用样本数据进行模型参数估计及检验。对于一个适当的ARIMA模型,其残差项无自相关性,模型残差项应为白噪声。表7为模型参数估计及参数显著性检验结果。

对模型的残差项进行白噪声检验,将残差项的ACF图绘制出来,如图4所示。

观察图4中各滞后期的残差自相关系数,可以看出它们在置信区间内0附近波动,是一白噪声序列,因此本文中所建立的ARIMA(1,1,4)模型是比较合适的。图5是残差序列的直方密度图,从图中可以看出模型残差项基本服从正态分布,再次验证本文ARIMA(1,1,4)模型是合理的。

3.4  模型的预测

确定好模型的超参并进行模型参数估计和检验后,使用模型对后续一定时期的时序数据进行预测。利用现有样本数据和模型参数估计结果,将差分处理后的数据还原成原始数据并对后续时间的时序数据进行预测,本文对物料6004020503在171~177周的需求量进行预测的结果如表8所示。

将需求量观测值的一阶差分数据和拟合得到的差分数据绘制在如图6所示的时间序列图中,从图中可看到预测值与真实值之间相对是吻合的,二者的波动方向和幅度基本一致。

4  结  论

针对电子产品制造企业在多品种小批量的物料生产中面临的生产需求不稳定、生产周期不确定导致无法合理安排物料生产的问题,本文提出了一种基于ARIMA算法的短期物料生产需求预测模型。首先将以天为单位的物料生产需求历史数据转换成以周为单位的时序数据,使用TOPSIS法选出值得关注的一种物料作为研究对象,然后基于ARIMA算法构建该物料生产的周需求预测模型,并对未来短期内的生产需求进行预测,为企业的物料生产计划提供决策依据。本文建立的小批量物料生产周需求预测模型原理简单,易于解释,最终拟合结果显示良好,模型预测结果在短期内有一定的参考价值。但也存在以下不足:一是由于所研究物料的时序数据较少,模型的预测精度不足。二是ARIMA模型本身只适用于短期预测,长期预测准确度较低。下一步研究中将对上述存在的缺陷进行优化升级,探索针对企业小批量物料生产需求预测的最佳方法。

参考文献:

[1] 张浩.多品种小批量生产系统的排产优化研究 [D].上海:上海交通大学,2011.

[2] 闫海.我国智慧城市建设水平评价研究 [D].太原:太原科技大学,2013.

[3] Suranyi.TOPSIS法(优劣解距离法)介绍及python3 实现 [EB/OL].(2021-02-01)[2023-03-26].https://zhuanlan.zhihu.com/p/37738503.

[4] 王亚俊.考虑属性交互的气象灾害治理能力评价建模研究 [D].南京:南京信息工程大学,2021.

[5] 李婧.“陆态网络”基准站坐标时间序列变化特性分析 [D].郑州:解放军信息工程大学,2013.

[6] Dickey D A,Fuller W A. Distribution of the Estimators for Autoregressive Time Series With a Unit Root [J].American Statistical Association,1979,74(366):427-431.

[7] 宋勇林. 拓展的贝叶斯信息准则的一些性质 [D].武汉:华中师范大学,2014.

猜你喜欢

需求预测
基于贝叶斯最大熵的电动汽车充电需求预测
基于BP神经网络的济南市物流需求预测
基于灰色模型对上海市电力需求预测分析研究
县城地下空间需求预测研究——以蒙城县地下空间综合利用规划为例
基于计算实验的公共交通需求预测方法
浅谈电网规划中的电力需求预测
基于灰色理论的山东省能源需求预测及分析
公益性岗位的需求预测及其效应分析——以新疆乌鲁木齐市为例
基于灰色马尔可夫模型的公务航空市场需求预测
中国中长期煤炭需求预测