APP下载

多个关联确定性时间序列微分方程建模方法研究

2015-04-18孙文凯胡晓华蒋文江

关键词:残差显著性建模

孙文凯,胡晓华,蒋文江

(海南师范大学 数学与统计学院,海南 海口 571158)

多个关联确定性时间序列微分方程建模方法研究

孙文凯,胡晓华*,蒋文江

(海南师范大学 数学与统计学院,海南 海口 571158)

从纯数学的角度,对多个关联确定性时间序列分别进行多次累加产生新序列,研究序列之间的关系,建立多元线性(或非线性)回归方程.给定显著性水平α,对每个回归方程进行显著性检验.在置信度1-α下建立微分方程组模型,从而揭示这些时间序列之间的关系,实现对原序列的预测和控制.最后用1995-2014年海南省GDP和接待旅游人数建立微分方程组模型并进行预测.

多个时间序列;累加;微分方程;预测

对于彼此间互相影响的多个时间序列,如何揭示它们间的动态关系是要研究的主要内容.设X1(t),X2(t),…,Xk(t)(t=0,1,2,…,T)为k个非随机的原始时间序列.如果给定的是单位时间数据如日(月、年)产量等,则可把它进行多次累加,产生多个新序列;如果给定的是累积单位时间数据,如到某日(月、年)的累积产量等,则可把它进行多次累减,产生多个新序列.无论哪种情况,都可从纯数学的角度对每个原始时间序列Xi(t)进行一次、两次甚至多次累加(减),直至最后一次累加(减)产生的新序列出现明显的趋势为止.实际应用中一般二、三次累加(减)即可.

接下来寻找Xi(t)与其他序列和多次累加(减)后产生的新序列之间的关系.对每个Xi(t)建立单个多元线性(非线性)回归模型,给定显著性水平α,在置信度1-α下对单个方程进行显著性检验,若检验通过则利用微分、差分关系建立相应的单个微分方程.最后把单个微分方程合成微分方程组.该微分方程组可以是非线性的(当然也可以是线性的),可以是高阶的(也包括一阶),并能刻画k个原始时间序列X1(t),X2(t),…,Xk(t)彼此间互相影响的动态关系.这样就部分弥补了灰色预测法[1]不能建立非线性模型的不足.每个微分方程可决系数R2的大小能刻画单个微分方程拟合程度的合理性.其中最小的R2能刻画微分方程组拟合程度的好坏.许多著名的微分方程模型,如电子工程中的Van der pol方程[2],生物种群中的Volterra模型[3],气象方面的Lorenz模型[4]等均可纳入这种建模思想的框架下,成为这种建模方法的特例.

1 数学建模思想

处处可导是光滑连续函数的特性,而离散时间序列是由离散的单点构成,通常意义下无导数可言,因此原则上不能用导数研究这类时间序列的性质.但是可以把离散时间序列视为连续情况下的离散化,这样就能从纯数学的角度出发,以微积分和差分为基础研究离散时间序列,并建立相应的微分方程组模型[5].

设x(t),0≤t<∞是一个连续函数,定义

特别的,取Δt=1,(假设x(t)在Δt=1的范围内函数值变化不是很大),则有

在这里将研究范围拓展到多个时间序列,这就要用到多元时间序列分析[6].考虑一个非随机的k元时间序列

其中εkt是随机误差项.在寻找关系式时,可以考虑建立多元线性或非线性回归,或其他时间序列模型.

接下来把X(0)(t),X(1)(t)看作连续函数的离散化,其所在的连续函数不妨仍记为X(0)(t),X(1)(t),则

这种情况要求单位时间(Δt=1)上所研究的时间序列的数值变化不是很大,也就是说数据变化不能随机.给定一个显著性水平α(一般取α=0.05或α=0.01),对关系式①,②,…,ⓚ进行显著性检验,一般包括方程(即上诉关系式)的显著性检验(F检验)和回归系数的显著性检验(T检验).另外,回归系数的求解采用最小二乘法.若关系式①,②,…,ⓚ能通过显著性检验,忽略εit,(i=1,2,…,k)则在置信度1-α下便可建立相应的一阶k元微分方程组模型

只要找到X(0)(t),X(1)(t),…,X(n)(t)的关系式

在一定置信水平上忽略εt便可建立一个k元n阶微分方程组模型

从中解出X(n)(t),进而求出X(0)(t)在应用中一般二、三次累加就可以得到理想结果.

通常情况下,一个时间序列Xt既有确定性趋势也有随机性趋势.可以表示为Xt=μ+εt,模型(1)和(2)刻画了时间序列的确定性部分,称为主题模型.对于随机误差εt,要求E(εt)=0,即εt是白噪声序列.若否,说明εt还有可提取的信息,可再对εt进行建模最终使其为白噪声.这类模型称为辅助模型.由主题模型和辅助模型便可以对原始序列进行很好的预测.

2 构建的微分方程组模型

前面说过许多著名的微分方程组模型都是这种建模方法的特例,并且灰色系统理论中的模型几乎都可以用上面的方法去构造,为了与实际问题相符,这里假设时间序列

非负.假设找到的方程①的具体形式如下

其中ai,bi(i=1,2,…,k-1)为待估参数.在显著性检验通过的情况下便可建立相应的k元一阶微分方程模型

该模型即是灰色预测法中灰色Verhulst模型[7]的白化方程(影子方程).

为了更容易寻找F的具体形式,构造一个新序列I(t)=(i1(t),i2(t),…,ik(t)),分别研究I(t)与X(i)(t)之间的关系,构造得到宗旨是尽量使I(t)与X(i)(t)为线性关系.

首先考虑一个一维的情况.构造I(t)=(X(2)(t))2·X(1)(t),若关系式的具体形式如下

若在一定显著性水平下检验通过,则可建立如下模型

这其实是Van der pol方程,在电子工程中有十分重要的应用.

接下来考虑一个二维的情况.令

且与x(i)(t)关系如下

若在一定显著性水平下检验通过,则可建立相应的微分方程组模型

这便是生物种群中Lotka-Voltera种间竞争模型,是Logistic阻滞增长模型[8]的延伸.N1,N2代表两物种的种群数量;K1,K2为两物种的最大环境容纳量;a0,b0为两物种的增长率;α代表物种2对物种1的竞争系数;β代表物种1对物种2的竞争系数.

这种建模方法的优势在于避免了对最大环境容纳量K1,K2的假设,可以根据回归出的参数a0,a1,b0,b1巧妙得出其估计值.当然该模型还可用于集群企业竞争,或其他的市场竞争.

又如构造新序列

且在一定显著性水平下检验通过,则可建立如下模型

当a2=1,a1<0,b2=1,c2=c3=-1,c1<0时,模型(6)便是Lorenz方程组.Lorenz方程组是描述混沌现象的第一例有名的方程,常用于气象、通信、电路等方面.

3 实证分析

表1是1995-2014年海南省的GDP和接待过夜旅游人数的数据表(数据来源于《海南统计年鉴》[9]).(单位:GDP;亿元;旅游人数:万人).

表1 GDP和接待旅游人数Tab.1 GDP and the number of tourist reception

为了输入方便,在Eviews软件[10]中用x1,x2,y1,y2分别来代表,该表示方法以后也通用,到时不再逐一说明.由图1,2可知,都有随时间增长的趋势,而一次累加之后的增长的趋势更加明显了.

接下来就要找这些序列之间的关系,用软件经过多次比较分析,找出了与之间的关系

图1 累加之前时序图Fig.1 Sequence chart before accumulation

图2 累加之后时序图Fig.2 Sequence chart after accumulation

方程(7)和(8)在α=0.05的显著性水平下检验通过,可决系数R2均为0.99,但DW统计量分别为0.9889和0.9083,可见方程残差存在自相关性,在主体模型之外还应建立一个辅助模型(在以后的篇幅中讨论).

现在联立方程(7)和(8)并将系数带入,可得微分方程组如下

由前文讨论结果,可以用微分近似代替差分,即有

将(10)式带入方程组(9)得

表2 方程组(10)的数值解Tab.2 Numerical solution of equations(10)

具体预测值可由表2逐一计算出,不再赘述.特别的,

这便求出了2013,2014年GDP和接待旅游人数的预测值.

前面说过还要对方程(7)(8)建立残差辅助模型,设其残差序列分别为r1(t),r2(t).经过对自相关系数,偏自相关系数,Q统计量等的分析得以下结论.

图3 GDP序列及预测序列图Fig.3 GDP sequence and the forecast sequence

图4 旅游人数序列及序列预测图Fig.4 Tourists sequence and the forecast sequence

残差序列r1(t)的自相关系数始终在零周围波动,判定该序列为平稳时间序列;对于Q统计量的p值,该统计量的原假设为r1(t)滞后1期,2期,,…,k期的自相关系数均等于0,备择假设为自相关系数中至少有一个不等于0,经分析知p值都大于0.5%的显著性水平,所以接受原假设,即序列自相关系数接近于零,序列是纯随机序列,即白噪声序列.所以不再对r1(t)建立模型.

残差序列r2(t)的自相关系数可看做明显落入随机区间,自相关系数表现为截尾性;而偏自相关系数分析中发现,滞后一期的偏自相关系数明显不为零,而k>1以后的值都在置信区间内,可以认为序列的偏自相关系数具有截尾性.因此,对序列r2(t)可建立ARMA(1,1)模型.模型的具体回归过程见图5.

经分析,可以建立模型如下

其中et是一个白噪声,r2(t-1)表示rt的滞后一期,此时,新残差εt的DW统计量为1.963973,接近2表示其不存在自相关性,即εt是一个白噪声.拟合与残差图见图6.

通过MATLAB求得数值解,特别的,

图5 ARMA模型回归图Fig.5 Regression process of ARMA model

图6 模型拟合与残差图Fig.6 Fitting and residual figure of model

故2013,2014年接待旅游人数预测的最终数据分别为3679.91+2.954433=3682.86和4026.57+12.7499= 4039.32.同时真实值为3672.51和4046.18(单位:万人),在接待旅游人数的预测方面,2013,2014年的预测值的相对误差分别为10.35和-20.86;绝对误差分别为0.28%和0.51%.

在GDP的预测方面,2013,2014年的预测值分别为3329.22和3668.86,同时真实值为3146.46和3500.72(单位:亿元),其相对误差分别为182.76和168.14;绝对误差分别为2.97%和4.8%.

如此就完成了对GDP和旅游人数这两个时间序列的建模和预测,同时发现对于确定趋势的时间序列而言,辅助模型对预测值的影响不大,且主体模型短期预测精度较高.

4 结束语

本文从灰色系统理论累加、累减的基本思想出发,从纯数学的角度,利用微分、差分等工具进一步研究了具有确定趋势的多维时间序列的建模方法,并用假设检验的方法说明所建微分方程组模型的合理程度,用可决系数R2刻画拟合程度.这种建模方法适用于数据较少,样本较小的情况下使用,其短期预测精度较高.这种新手段为我们提供了想象空间,拓宽了建模思路.

[1]刘思峰,党耀国.灰色系统理论及其应用[M].5版.北京:科学出版社,2004.

[2]王树禾.微分方程模型与混沌[M].合肥:中国科学技术大学出版社,1999.

[3]欧伯群,秦发金.具扩散的捕食与被捕食Lotka-Volterra模型研究[J].西北师范大学学报,2001,37(2):28-33.

[4]王光义,郑艳,刘敬彪.一个超混沌Lorenz吸引子及其电路实现[J].物理学报,2007,56(6):3113-3120.

[5]胡晓华,吉承儒,虞敏.灰色预测法的进一步推广及应用[J].大学数学,2013,29(1):117-121.

[6]Jonathan D Cryer.Time Series Analysis with Applications in R[M].BeiJing:China Machine Press,2011.

[7]崔立志,刘思峰,李致平.灰色离散Verhulst模型[J].系统工程与电子技术,2011,33(3):590-593.

[8]胡宝安,陈博文,夏爱生,等.Logistic增长时滞SIS模型分析[J].工程数学学报,2007,24(2):373-376.

[9]海南统计局.海南统计年鉴(2000-2014)[EB/OL].[2015-01-20].http://www.tongjinianjian.com/62736.html.,2014-9-30/2015-01-20

[10]易丹辉.数据分析与Eviews应用[M].北京:中国人民大学出版社,2008.

[11]刘则毅.科学计算技术与Matlab[M].北京:科学出版社, 2001.

责任编辑:毕和平

The Research of Differential Equations Modeling Methods of Correlative Deterministic Multivariate Time Series

SUN Wenkai,HU Xiaohua*,JIANG Wenjiang
(Faculty of Mathematics and Statistics,Hainan Normal University,Haikou571158,China)

From the perspective of pure mathematics,Deterministic multivariate time series were multiply accumulated to produce some new sequences,studying relationship among them and establishing the multiple linear or nonlinear regression model.If a significance level α was given,the significance test for every regression equation was carried out.At confidence level 1-α,the differential equations models were established to reveal the relationship among all the time series,and fore⁃cast or control them.Finally,using the data for the value of GDP and the number of tourist reception in Hainan province from 1995 to 2014,differential equations model is established to forecast.

multidimensional time series;accumulate;differential equation;forecast

O 29

:A

:1674-4942(2015)01-0009-06

2014-12-10

国家自然科学基金资助项目(11361022)

*通讯作者

猜你喜欢

残差显著性建模
基于双向GRU与残差拟合的车辆跟驰建模
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
本刊对论文中有关统计学表达的要求
基于残差学习的自适应无人机目标跟踪算法
基于递归残差网络的图像超分辨率重建
基于显著性权重融合的图像拼接算法
基于视觉显著性的视频差错掩盖算法
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
论商标固有显著性的认定