APP下载

基于时延挖掘模糊时间认知图的化工过程多变量时序预测方法

2020-05-15蔡涛杨博李宏光

化工学报 2020年3期
关键词:时延精度变量

蔡涛,杨博,李宏光

(北京化工大学信息科学与技术学院,北京100029)

引 言

在化工生产过程中,现场操作人员往往通过监控关键过程变量来实现对整个工艺过程的掌控,从而保证生产过程的安全和稳定运行[1],为此,对关键过程参数的准确预测对于提高过程控制性能和优化产品的质量指标具有重要的作用。由于工业现场的环境复杂、生产过程存在着非线性和不确定性等特点,并且由于管线和容器的积分作用使得变量间存在大的时间延迟,传统的数据驱动建模方法往往难以满足过程监控的要求。因此,采用新方法建立时间序列预测模型引起了广泛的关注[2]。

模糊认知图(fuzzy cognitive map,FCM)[3]作为一种数据驱动的软计算工具,能够把信息和知识存储于概念与概念之间的关系中,通过整个网络中各个概念节点的相互作用模拟系统的行为。FCM 由于其良好的动态特性和学习能力、处理非线性和不确定性的优势[4]以及优于神经网络的“可解释性”[5],使其在单变量[6-10]和多变量[11-15]时间序列的预测中得到了广泛的应用。

自FCM 的理论方法建立以来,研究人员从各个方面对其进行了改进。针对FCM 模型中权值矩阵的学习算法,Stach 等[16]将改进的遗传算法应用到权值矩阵的优化过程中;Papageorgiou 等[17]使用粒子群算法对FCM 进行优化;Salmeron 等[18]将模因算法应用到FCM 学习过程中,探究全局和局部搜索算法对构建FCM模型的影响;Papageorgiou[19]综述了FCM学习方法的各种改进措施。另外,研究者对FCM 的结构进行了改进探索。Liu 等[20-21]提出了模糊认知网络的模型,解决了FCM 对专家知识依赖性过强的问题;Hagiwara[22]提出了一种拓展模糊认知图模型,可以表示概念间的非线性因果关系;骆祥峰等[23]将条件概率引入FCM 中,提出了概率认知图模型。在复杂系统模型的建立过程中,变量间的时延是一个很重要的因素,对其进行有效的处理能够使得所建立的模型更加符合实际系统的运行情况。Park 等[24]提出了模糊时间认知图(fuzzy time cognitive map,FTCM),将时间信息引入到FCM 模型中;Wei 等[25]将FTCM 模型用于评估虚拟企业的信任动态。然而,目前FTCM 对于时间信息都是基于经验处理的方法,使得对于普遍存在时间延迟的化工过程预测很难获得满意的精度。为此,本文将互相关函数(cross-correlation function, CCF)引入FTCM 模型的时间信息处理机制中,处理FTCM 模型节点的时间延迟,同时修改FTCM 的推理机制,添加节点自我影响因子和偏置[26],并优化转换函数的参数,提高了预测模型的精度。

1 模糊认知图

模糊认知图是一个三元序组U =(C,E,W),如图1所示。

图1 FCM的拓扑结构Fig.1 FCM topology

其中,C ={C1,C2,…,Cn},表示FCM 中的n 个概念节点的集合;E ={ <Ci,Cj>},是FCM 中概念节点间因果关联的有向弧,有向弧<Ci,Cj>表示概念节点Ci对Cj有因果关联或影响;W ={wij},wij∈[0,1],wij表示节点Ci对Cj的影响程度。如wij>0,则Ci对Cj有正的影响,即Ci的增加(或减少)引起Cj的增加(或减少);如果wij<0则Ci对Cj有负的影响,即Ci的增加(或减少)引起Cj的减少(或增加);如果wij=0,则表明Ci对Cj没有影响。

FCM的关联权重矩阵为n×n阶的矩阵,即

FCM 在t 离散时刻的状态值用向量A(t)描述,A(t) =[A1(t),A2(t),A3(t),…,An(t)],n 为 节 点 数,Ai∈[0,1]。其推理机制为

其中,Aj(t)代表第j 个节点在t 时刻的状态值,Ai(t-1)表示第i 个节点在t-1 时刻的状态值,wij对应于节点Ci和Cj之间的连接权重,t为时间标签,n为概念节点的数目,ƒ 为函数,通常用带有陡度参数τ>0的S形函数表示,即

FCM 模型的准确程度(即关联权重矩阵)受训练数据本身的影响及转换函数ƒ(x)的参数τ 的影响,但目标概念节点的状态值仅由与之相关节点的前一状态有关,对于滞后系统而言,传统的FCM 并不能反映系统变量间真实的因果关系,因此需要对FCM模型进行改进。

模糊时间认知图(FTCM)是在模糊认知图(FCM)基础上的扩展,它使用领域专家的知识定义时间信息集,增加了概念节点间的时间滞后信息。FTCM 使用模糊集的形式表达时延信息,如{I,N,L},其 中I、N 和L 分 别 表 示“Immediate”、“Normal”和“Long”模糊值的形式,如{1,2,3},其中“3”可以表示3 个滞后单元如3 年、月等;“2”可以表示2 个滞后单元;“1”表示1 个。FTCM 的示意图如图2 所示。其中,+0.9、-0.1、-0.7、-0.8、-0.5和+0.5 为节点间的连接强度,3、1、2、1、2 和1 表示节点间的滞后时间。

图2 FTCM模型Fig.2 FTCM models

2 改进的FTCM模型

2.1 推理机制FTCM

为了处理时间信息,对FTCM 在以下方面进行改进处理:

①由于普通FTCM 的推理机制采用模糊集(值)的形式确定时延信息,对专家知识有很强的依赖性,无法从已有数据中挖掘时延,所以使用CCF 处理时延信息,改进FTCM 的推理机制,增加节点间准确的时间交互信息;

②增加FCM 的记忆因子γ,取消i ≠j 的条件限制,实现节点的自我影响;

③在转换函数中添加偏置w0和优化ƒ中的τ,以提高模型的预测精度;

改进后的FTCM推理模型为

图3为改进推理机制的FTCM。

可见,改进的FTCM 模型利用已知的历史数据,能够对时延信息进行处理,使模型更加贴合系统的实际运行情况。同时为了提高模型的预测精度,增加概念节点的自我影响和偏置,并优化转换函数的参数。

2.2 时延挖掘

相关联的变量间的变化是存在时间维度的差异的,而且这种时间维度差异本身也会随着时间及相关变量的改变而改变。对相关变量进行时滞的计算,能提高变量间关联的准确性和有效性。而互相关函数[27](CCF)是一种较为有效、便捷的时滞提取方法。

假设有2 个时间序列变量a、b,μa和μb是时序的n 个观测值的均值,sa和sb是标准差,整体的时延估计k的关系系数由式(5)给出

其中,k = -n + 1,…,n - 1。

通过计算样本期望来获得关联系数值

图3 改进的FTCM的结构示意图Fig.3 Improved FTCM structural diagram

其中,sa和sb分别代表样本a、b的标准差。

CCF的思想是通过假设各个序列间存在一个特定的时间滞后[28]。因此绝对值最大的Φab(k)可以被认定为关联系数,并且当关系系数取最大时的时刻为序列间整体延时估计k。

通过使用CCF 方法,获取滞后系统的整体的时延估计,并将其加入到FTCM 模型之中,以提高模型的预测精度和解释性。

2.3 FTCM 模型参数学习

(1)粒 子 群 优 化 算 法(particle swarm optimization, PSO)是一种实现简单、全局搜索能力强且性能优越的启发式搜索技术。为了确定搜索与优化的方向,该算法中的n 个粒子既能利用各自积累的个体历史经验,又能有效地利用粒子群中的全局社会知识。相关研究[29-31]证明了采用PSO 算法对FTCM 模型进行参数学习的有效性,这里,也采用了此机制,使用PSO 进行模型参数的学习伪代码如表1所示。

表1 粒子群寻优的伪代码Table 1 PSO optimization pseudo code

(2)布谷鸟搜索算法(cuckoo search,CS)是由Yang 等[32]于2009 年开发的自然启发式算法。CS 基于布谷鸟的寄生性育雏行为。该算法可以通过所谓的Levy 飞行来增强,而不是简单的各向同性随机游走。CS 执行过程如表2所示。

算法在搜索空间中寻找最大程度满足给定适应度值标准条件的权值矩阵,这里使用RMSE 作为适应度值函数

表2 布谷鸟搜索算法的伪代码Table 2 Cuckoo search pseudo code

其中,i=1,2,…,C 表示输出节点的数目;j=1,2,…,N 表示数据的长度。yij和y^ij分别表示输出节点的实际值和预测值。

3 实验与分析

这里通过数值实例和实际化工过程数据对所提出的方法进行实验和分析,实验环节的流程如图4所示。

3.1 数值实例

考虑如下数值模型

其中,x1、x2为随时间变化的随机曲线,如图5和图6所示。

在数值实例中,x1、x2对y 的时延分别为30 和47,由式(5)、式(6)进行整体的时延估计可得:x1→y,关联系数为0.9493,时延为29;x2→y,关联系数为0.2681,时延为49。对于该数值模型,CCF 能较为准确地估计变量间的时延信息。

图4 实验环节流程Fig.4 Flow chart of experiments

将挖掘的变量间时延信息加入到FTCM 模型中,利用粒子群算法(PSO)和布谷鸟搜索算法(CS)进行参数的寻优,最后获得的仿真结果如图7所示。传统的FCM 模型无时延信息,对于y 的值,只能由前一步的状态求得,缺少实际的意义,而且精度不高。而改进后的FTCM 模型中既包含了时延信息,又对预测精度有了一定的提高。真实值中加入了随机噪声,FTCM 模型对噪声无法进行训练拟合,所以,结果显示出了一定的差异,但是目标变量总体的趋势得到了较好的预测。同时使用PSO 和CS 分别对模型参数进行寻优,获得的结果如图7 所示,PSO 在FTCM 模型中得到了较好的结果。

3.2 化工过程实例

考虑某煤气化汽包过程,其工艺流程如图8 所示。其中,汽包液位是进行监控预测的工艺参数。根据工艺知识和数据分析,确定了5 个与汽包液位相关的变量,如表3所示。

图5 x1曲线Fig.5 x1curve

图6 x2曲线Fig.6 x2 curve

(1)时延挖掘 使用互相关函数计算相关变量的最大相关系数和时延,如表4所示。

在得出的结果中,对最大相关系数低于0.5 的数据,不做处理,所以C1→C5相关变量不处理;由于C5为汽包液位本身的自影响,在模型的推理机制中默认为1。

图7 数值实例仿真结果Fig.7 Numerical simulation results

图8 汽包工艺图Fig.8 Steam drum process diagrams

表3 相关变量选取Table 3 Correlated variables

表4 时延挖掘Table 4 Time-delay mining

(2)FTCM 参数学习 在构建FTCM 模型的过程中,预先通过专家知识的经验确定FTCM 的关联矩阵的结构能够减小运算的压力,计算出来的FTCM 模型更具有实际的意义和应用价值,因此根据实际的工艺状况和专家的经验,预先确定了关联矩阵W的结构如下

其中,w11=w21=w31=w41=0;w12=w22=w32=w42=0;w13=w23=w33=w43=0;使用表1 对参数W、γ、w0、τ 进行学习,构建模型。

(3)模型的构建 具体过程如下:

①数据规范化处理。进行FTCM 模型相关参数的学习的数据来源于化工过程的真实数据,由于变量的取值范围差距比较大,因此需要对原始数据进行规范化处理。在模糊认知图进行预测的相关文献中,最小-最大规范化被多次使用,所以本文使用最小-最大规范化方法进行数据处理。其公式为

xi为时间序列在某一时刻的取值是规范化后的值,xmax和xmin是时间序列x的上界和下界,通过规范化后数据落入[0,1]区间。

②模型参数的学习。使用粒子群优化算法对W、γ、w0、τ 进行学习,获得的较为理想的结果为:w14=-0.0342,w24=0.0748,w34=-0.0198,w44=1;γ=1;w0=-0.5;τ=5。

③预测模型。通过上面互相关函数获得的时延信息和模型的参数,搭建如图9所示模型。

(4)实验结果 通过研究不同的因素对模型的预测精度的影响,得到了时延信息、自我影响因子γ和偏置w0对模型的影响程度,结果的误差如表5所示。

图10为汽包液位预测结果。

可见,不同的转换函数参数τ 和目标变量的记忆因子γ对预测的精度影响较大。变量间的时延和协调系数w0对精度有所提升,但是效果不明显。变量间时延的挖掘增强了模型的“可解释性”,使模型更加贴合系统实际的关系。

4 结 论

图9 FTCM(PSO)模型Fig.9 FTCM(PSO)model

图10 实验结果Fig.10 Experiment results

表5 不同因素的误差结果Table 5 Errors corresponding to different factors

通过改进传统的FCM 在处理大时滞系统和预测精度方面的不足,提出了一种基于数据驱动的FTCM 模型,增加了概念节点的时间信息,并通过增加节点自我影响、偏置和优化转换函数的参数以提高模型的预测精度。在处理具有时滞的多变量系统时,对其中的关键变量进行了预测。实验的结果表明了所提出模型在预测方面的有效性。同时由于增加模型的时间信息,对于模型的解释方面也有较好的提高。

猜你喜欢

时延精度变量
热连轧机组粗轧机精度控制
寻求不变量解决折叠问题
5G承载网部署满足uRLLC业务时延要求的研究
超高精度计时器——原子钟
分析误差提精度
基于GCC-nearest时延估计的室内声源定位
基于DSPIC33F微处理器的采集精度的提高
简化的基于时延线性拟合的宽带测向算法
分离变量法:常见的通性通法
卫星导航设备收发链路时延测量方法研究①