APP下载

自回归求和滑动平均方法用于间歇过程变量在线预测

2012-01-12刘兴红邹志云刘景全郭宇晴于鲁平

石油化工自动化 2012年2期
关键词:间歇重构建模

刘兴红,邹志云,刘景全,郭宇晴,于鲁平

(防化研究院,北京102205)

鉴于间歇过程在现代工业中的地位和作用愈加重要,且随着数据采集、数据库、化学计量学(chemometrics)等技术的发展,间歇过程基于数据驱动的建模方式发展迅速[1]。非线性时间序列预测技术可实现重要参数未来变化趋势的早期预报,从而为分析判断工况是否正常、确定转入下一工序的时机提供依据,进而达到节能降耗、提高产量的目的。笔者根据间歇过程数据特点,提出了一种间歇过程变量非线性时间序列在线预测方法。

建立间歇过程变量预测模型需要挖掘该变量在以往过程批次中的数据信息。由于间歇过程数据具有动态特点,在批次内表现为非线性的时间序列,即具有非线性和自相关性;在不同操作批次之间过程变量轨迹的变动服从正态分布,且不同批次数据不等长[2]。因此,难于找出一条统一不变的轨迹来拟合,以建立变量的在线预测模型。笔者采用对多个批次数据按照随机的顺序首尾相接组成长数据集的数据重构策略,采用时间序列分析及预报技术,实现间歇过程变量的实时预报。

常用的非线性时间序列建模方法有基于自回归求和滑动平均ARIMA(Autoregressive Integrated Moving Average)的方法[3-4]、人工神经元网络ANN(Artificial Neural Net)方法[5]和支持向量机SVM(Support Vector Machine)方法[6-7]等。ARIMA方法是理论上最为成熟的自回归滑动平均(ARMA)方法在非线性时间序列分析应用中的一种演进和拓展。由于ARIMA方法算法简单,计算速度快,且精度也较高,因而笔者采用ARIMA方法建模。通过与相空间重构-最小二乘支持向量机方法比较,表明该方法可用于间歇过程变量在线预测。

1 建模算法简介

1.1 间歇过程变量在线预测算法设计思路

1.1.1 数据重构

Nomikos和MacGregor[8-13]将间歇过程数据看成三维数据:批次(I)、时间(K)和变量(J),并采用两种方法将三维数据展开为二维数据。方法一是沿批次方向展开,即(I,K×J),其中一维为批次,另一维为每一批次的不同变量的数据随时间首尾相连;方法二是沿变量展开,即(J,K×I),其中一维为变量,另一维为每一变量不同批次的数据随时间首尾相接。前者存在不同批次数据不等长的问题,采用后者对间歇过程变量进行数据重构,所不同的是笔者对单变量(J=1)建立时间序列预测模型,数据重构示意如图1所示。数据重构后的时间序列为{x1,1,x2,1,…,xK1,1,x1,2,x2,2,…,xK2,2,…,x1,i,x2,i,…,xKi,i,x1,I,x2,I,…xKI,I},其中Ki为第i批次的数据采集时间,I为批次数。

图1 数据重构示意(I=4,J=1)

1.1.2 预测算法设计思路

根据间歇过程数据特点,设计间歇过程变量时间序列预测算法的具体思路如图2所示。图中实线箭头为模型训练过程,虚线箭头为模型检验和预测过程。首先对数据进行初始化处理,采用Savitzky-Golay滤波方法对每个批次的数据分别做数据平滑处理;然后将所有数据分成训练集和检验集;采用上一步骤的方法将两个数据集分别做数据重构,即以批次为单位随机地将不同批次数据首尾相接,并采用后面所有数据减去上一批次最后一个数据的方法去除批次连接点处数据跳跃的情况;运用训练集建立ARIMA方法;运用检验集对建立的模型进行验证,预测精度性能指标采用预测均方差MSE(Mean Square Error),验证合格的模型,用于间歇过程变量在线预测。

图2 间歇过程变量预测模型建立流程示意

1.2 自回归求和滑动平均方法

由于间歇过程变量时间序列具有趋势性和非平稳性,因而不能直接采用针对平稳序列的建模方法。ARIMA方法就是采用Box-Jenkins方法,即差分方法,来消除趋势性和非平稳性,使得变换后的序列成为平稳序列,再对该序列采用ARMA方法建模。

首先介绍ARMA方法。假设{Xt,t=1,2,…,N}(N为时间序列的长度)是平稳时间序列,对该序列建立的ARMA模型可表示为[14]

式中:{εt}~WN(0,σ2)为一白噪声过程;p,q——整数,(p,q)≥0称为模型的阶,记为{Xt}~ARMA(p,q)。B表示向后推移算子,其定义为BkXt=Xt-k。则ARMA(p,q)可表示为

且b(·)和a(·)具有如下定义式:

如果时间序列{Yt}的d阶差分Xt=(1-B)dYt是一个平稳ARMA(p,q),其中d≥1是整数,即b(B)(1-B)dYt=a(B)εt,则称{Yt}为具有阶p,d和q的ARIMA过程,记为{Yt}~ARIMA(p,d,q)。

笔者采用的建模步骤如下:

a)求差分阶数d。先求时间序列的1阶差分,判断差分处理后序列是否为平稳性序列。若是,则d=1;若不是,则对序列求2阶差分,依次类推,直至d阶差分处理后序列为平稳序列为止,得差分阶数d。序列的平稳性采用Daniel检验法进行检验。

Daniel检验方法:对于显著水平α,由时间序列{Xt}计算(t,Rt)的Spearman秩相关系数qs,t=1,2,…,n为数据样本容量,Rt=R(Xt)为{Xt}的秩统计量。qs计算公式如下:

构造统计量:

若|T|>tα/2(n-2),则拒绝原假设H0,认为序列非平稳,且当qs>0时,认为序列有上升趋势;qs<0时,认为序列有下降趋势。又当|T|<tα/2(n-2)时,接受H0,认为{Xt}是平稳序列。

b)确定p和q。采用AIC准则确定ARMA模型的阶数p和q。AIC准则起源于Kullaback-Leibler信息量。AIC定阶准则为选取p,q,使得:

笔者应用MATLAB统计函数Aicbic计算统计量AIC,AIC最小值所对应的p和q即为所求。

c)ARMA模型参数估计。ARMA模型参数估计方法有多种,笔者采用最大似然估计方法,并运用Matlab中Garch工具箱的相关函数实现参数估计,建立ARMA模型。

2 间歇蒸馏温度在线预测

间歇蒸馏过程是精细化工生产过程中非常重要的加工和分离环节,其原理是不同组分由于在同一温度(或压力)下的蒸汽分压(或共沸点)不同而实现液体混合物的分离。由于间歇蒸馏过程内在机理复杂,预分离的混合物种类或组成经常变动,对控制作用响应缓慢,且蒸馏塔工艺结构特点千差万别,因而对实现间歇蒸馏过程的自动控制提出了诸多挑战。相对而言,对温度实时监测较易实现,且根据混沌理论,温度能较高程度地反映体系内反应及分离情况。因此,在熟知工艺的前提下,基于温度预报的软测量技术对间歇蒸馏过程的控制可发挥重要作用。笔者采用上述方法对间歇等压蒸馏温度实施在线预测,得到可预测多步的温度值,进而为间歇蒸馏过程的质量控制提供重要的参考。

笔者选取数据为某间歇等压蒸馏过程的上升气温度数据,总批次为15批,数据点数共8 630,采样间隔为15s。10批作为训练集,5批作为检验集。

图3为训练集数据经预处理和重构后的时间序列,可以看出数据连续且平滑。

图3 数据预处理及重构后时间序列曲线

采用1.2节ARIMA方法对该数据集建立的模型为ARIMA(2,2,8)。

表1 ARIMA方法与LSSVM方法多步预测的MSE

图4为对某批次采用ARIMA方法和LSSVM方法进行4步在线预测结果的比较,从图中可以看出,在升温阶段,预报值与实际值吻合得非常好,因而该模型可用于间歇蒸馏过程转馏分点(升温变缓的点)的在线预测。因此,可以看出ARIMA方法可作为一种优良的非线性预测方法用于间歇过程变量的在线预测。

图4 某一批次4步(1min)预测结果比较

3 结 论

a)间歇蒸馏过程温度在线预测结果表明:以批次为单位随机将不同批次数据首尾相接的数据重构策略适于间歇过程变量数据特点,可用于该类数据的预测建模。

b)采用ARIMA时间序列分析及预测方法建立的预测模型,预测精度满足生产现场的要求。

c)考虑到ARIMA在多步预测中随着预测步数的增加,预测精度明显降低的情况,可考虑在非线性段将ARIMA方法与其他非线性建模方法如SVM方法结合的算法设计策略。

[1] 宋建成.间歇过程计算机集成控制系统[M].北京:化学工业出版社,1999.

[2] 陆宁云,王福利,高福荣,等.间歇过程的统计建模与在线监测[J].自动化学报,2006,32(03):400-410.

[3] 单伟,王玉田.非线性时间序列在卫星通信网络数据预测中的应用[J].空间电子技术,2009(02):115-119.

[4] 董晓萌,罗凤娟,郭满才,等,时间序列的自回归模型在杨凌地区降水量预报中的应用[J].中国农业通报,2007,23(11):403-407.

[5] 韩敏,王亚楠.基于Kalman滤波的贮备池多元时间序列在线预报器[J].自动化学报,2010,36(01):169-173.

[6] BERNHARD B,MARCO H,DETLEF B,et al.A Sales Forecast Model for the German Automobile Market Based on Time Series Analysis and Data Mining Methods[C].ICDM 2009,LNAI 5633,2009:146-160.

[7] XU Ruirui,BIAN Guoxing,GAO Chenfeng,et al.Discussion about Nonlinear Time Series Prediction Using Least Squares Support Vector Machine[J].Commun Theor Phys,2005(43):1056-1060.

[8] NOMIKOS P,MACGREGOR J F.Monitoring Batch Processes Using Multiway Principal Component Analysis[J].AIChE Journal,1994,40(08):1361-1375.

[9] NOMIKOS P,MACGREGOR J F.Multivariate SPC Charts for Monitoring Batch Processes[J].Technometrics,1995,37(01):41-59.

[10] MACGREGOR J F,KOURTL T.Statistical Process Control Ofmultivariate Processes[J].Control Fag Practice,1995,3(03):403-414.

[11] NOMIKOS P,MACGREGOR J F.Multi-way Partial Least Squares in Monitoring Batch Processes[J].Chemometrics and Intelligent Laboratory Systems,1995(30):97-108.

[12] KOURTI T,NOMIKOS P,MACGREGOR J F.Analysis,Monitoring and Fault Diagnosis of Batchprocesses Using Multiblock and Multiway PLS[J].Proc Cont,1995,5(04):277-284.

[13] KOURTI T.Multivariate Dynamic Data Modeling for Analysis and Statistical Process Control of Batch Processes,Start-ups and Grade Tansitions[J].Chemometrics,2003(17):93-109.

[14] 范剑青,姚琦伟.非线性时间序列建模、预报及应用[M].北京:高等教育出版社,2005.

[15] 刘兴红,邹志云,马丽欣,等.相空间重构-最小二乘支持向量机用于间歇过程变量在线预测[J].计算机与应用化学,2011(12):1577-1580.

猜你喜欢

间歇重构建模
间歇供暖在散热器供暖房间的应用
长城叙事的重构
联想等效,拓展建模——以“带电小球在等效场中做圆周运动”为例
北方大陆 重构未来
基于PSS/E的风电场建模与动态分析
不对称半桥变换器的建模与仿真
北京的重构与再造
论中止行为及其对中止犯的重构
管群间歇散热的土壤温度响应与恢复特性
间歇精馏分离喹啉和异喹啉的模拟