APP下载

磨煤机一次风量长短期记忆网络预测模型

2022-07-04孙传瑜杨耀权

电力科学与工程 2022年6期
关键词:磨煤机风量辅助

孙传瑜,杨耀权

(华北电力大学 自动化系,河北 保定 071003)

0 引言

提高火电机组锅炉燃烧效率,是电力企业需要解决的关键问题。磨煤机一次风送风量是提高燃烧效率的重要参数[1]。

对于一次风量的测量,目前通常采用的是接触式测量方式。由于现场环境复杂、影响因素较多,测量结果常会发生严重漂移现象。利用往期历史数据建立一次风量预测模型,不仅可以解决接触式测量所存在的缺陷,还可以通过其分析出送风系统运行参数与实际送风量之间的非线性关系,为现场工作人员及时调整送风系统相关参数提供有价值的参考。

近年来,随着机器学习与深度学习算法的快速完善,越来越多的数据驱动方法被应用于建立预测模型[2]。深度学习具有特征抓取能力强。预测精度高等优点。文献[3]采用长短期记忆(long short-term memory,LSTM)方法构建黑箱模型。文献[4]采用机器学习中的最小二乘支持向量机(least square support vector machines,LSSVM)方法构建软测量模型。文献[5]采用 LSSVM方法进行脱硫系统浆液pH值测量,并取得了较好的预测效果。

在建立预测模型时,除了选择合适的建模方法外,对输入变量进行选择与处理也是提升模型预测精度的关键所在。文献[6]采用核主成分分析(kernel principal component analysis,KPCA)方法来对与磨煤机一次风实际送风量相关的辅助变量进行降维,以提高模型泛化能力,并建立了KPCA-LSSVM预测模型。文献[7]采用套索算法对数据进行处理,有效去除了冗余变量,解决了模型过拟合问题,并利用经验模态减少了噪声干扰。

在建立模型时,若输入变量过多,则可能会造成模型过度复杂,不利于实际应用;若输入变量过少,则可能会导致表达特征过少,降低模型预测精度。因此,选择合适的数据预处理方法,成为关乎模型预测精度的关键。

为准确预测出磨煤机一次风实际送风量,本文提出了一种基于麻雀算法结合KPCA-LSTM网络的软测量预测模型。利用相似度函数法处理数据,以提高模型泛化能力;再利用 KPCA对数据进行降维[8],缩短模型运行时间,进一步提高模型范化能力。利用 LSTM神经网络建立预测模型[9],对其中存在的多个超参数使用麻雀算法进行寻优[10,11],以提高预测精度。

1 KPCA-LSTM基本原理

1.1 核主成分分析

对磨煤机一次风送风系统进行机理分析,预选出所需的辅助变量。

辅助变量所具有的维度高、非线性等特点,会造成模型复杂度升高、泛化能力和学习能力变差等问题。

采用KPCA可以有效挖掘到各辅助变量之间蕴含的非线性信息,进而降低数据维数,最大程度保留原数据特征。

KPCA算法原理:通过非线性映射函数φ(X)将输入矢量映射到高维空间,然后在高维空间中使用PCA方法[12]计算主元成分。

1.2 相似度函数

通过计算不同样本之间的欧氏距离来判断样本之间的相近程度,进而决定样本的取舍。

由于采集的数据集中含有大量相似或相近的数据样本,因此会造成模型训练时间过长,浪费计算资源。同时,训练样本中过多的冗余样本也会造成模型出现过拟合现象。因此采用相似度函数法去除其中的冗余数据。

相似度函数公式为:

式中:Xi、Xj为数据集中的2个不同样本;‖·‖2为向量二范数,用来求取样本之间的欧式距离;Di,j为求取的相似度值;Ck为数据集中第k个辅助变量;n为辅助变量的总个数。

经过相似度函数计算:如果得到的相似度值Di,j接近于1,则说明2个样本中含有的相同信息量较大,应去除其中一个冗余样本;当相似度值Di,j接近0时,则表明2个样本中含有的信息存在较大差异,此时应该保留含有差异的样本。

1.3 麻雀算法

在建立一次风量预测模型时,需要对模型内部的超参数进行优化。寻找最优超参数是提高模型预测精度的关键。

粒子群算法在寻优过程中容易出现过早收敛、陷入局部最优的问题。遗传算法虽然全局搜索能力强,但是局部搜索能力较弱,往往只能得到次优解而不是最优解。考虑以上寻优算法出现的问题,本文选择了寻优效果较好且运算时间较短的麻雀算法进行超参数优化。

麻雀算法的核心是发现者、加入者、警戒者三者的位置更新。根据算法设定,警戒者所占种群比例为10%~20%;发现者和加入者之间比例是动态变化的,即一只个体成为发现者必然意味着另一只个体成为加入者。

fi>fb,表示此时麻雀正处于种群边缘,极易受到捕食者的攻击。fi=fb,表明处于种群中间的麻雀意识到了危险,想要靠近其他麻雀来减少被捕食的风险。

通过循环迭代,不断更新发现者、加入者和警戒者三者之间的位置,最终找到最优参数,完成寻优任务。

1.4 LSTM神经网络

LSTM是一种特殊的RNN[13]类型,可以学习长期依赖信息。

此网络的核心思想是引入细胞状态(cell state)。细胞状态用来存放需要记忆的信息,同时其内部含有3个门控(遗忘门、输入门、输出门)。LSTM 通过每个单元中的遗忘门(forget gate)、输入门(input gate)和输出门(output gate)以及tanh激活函数[14]构成细胞状态,实现历史信息的取舍。

LSTM通过读取ht-1和xt,经过遗忘门,给每个在细胞状态Ct-1中的信息输出一个在范围为[0,1]之间的数值,用来决定模型会从细胞状态中丢弃什么信息。1表示“完全保留”,0表示“完全舍弃”。

LSTM遗忘门公式为:

LSTM中的输入门由2部分功能组成:一是找到那些需要更新的细胞状态,二是把需要更新的信息更新到细胞状态里。这2部分功能同样是通过读取ht-1和xt,经过输入门,将创建的新的细胞状态值向量C˜t加入到状态中。遗忘门找到需要忘记的信息ft后,将它与旧状态相乘,丢弃掉需要丢弃的信息。最后,将结果加上it C˜t,使细胞状态获得新的信息。这样就完成了细胞状态的更新。

LSTM输入门公式为:

LSTM输入门更新公式为:

在输出门中,通过读取ht-1和xt,将其通过sigmoid层来确定哪部分信息将输出;然后把细胞状态Ct通过tanh进行处理后与sigmoid层输出相乘,最终得到输出ht。

LSTM输出门公式为:

由于 LSTM 神经网络中默认的激活函数是tanh函数,而采集的数据集中数据全部为正数,所以需要将tanh激活函数更换为relu函数[14]。此函数更适合模型的训练,使模型的预测更精确。

relu函数数学表达式为:

2 预测模型的构建

2.1 基于机理分析的辅助变量预选择

在建立预测模型时,首先需要确定模型的输入变量。通过对磨煤机一次风送风系统进行机理分析,预选出7个变量作为辅助变量。

磨煤机一次风由热风和冷风在风道内充分混合而成。一次风将磨煤机中的煤粉吹入给粉管道,送入炉膛进行点火。

风量在管道内测量。考虑管道长度L远远大于管道横截面积A,且流体做不可压缩流动,根据伯努力方程,流体参数在同一条流线上有如下关系:

式中:p0为总压;p1为静压;ρ为空气密度;υ为空气流速。

此方程为理想方程,没有考虑实际误差。在考虑总压p0与静压p1的测量误差后,需要增加校正系数ε。校正系数ε取值范围为[0.84,0.87]。由此得到空气流速公式为:

空气密度ρ的计算公式为:

管道内空气流量质量为:

式中:K为流量系数;A为管道横截面积。

在对管道内一次风量进行实际测量时,需要考虑一次风流通过程中所遇到的阻力。一次风流通时所遇到的阻力有:一次风热风管道风阻Rh、一次风冷风管道风阻Rc、热风门风阻Rv、冷风门风阻Rw。在理想状态下,一次风总风量等于一次风热风量与一次风冷风量之和。

一次风热风量为:

式中:pi,1为热风管道进口风压;ph为热风管道出口风压;ρh为热风空气密度。

影像学方面的诊断。对所选取的研究对象进行影像学方面的诊断,对于CT组的研究对象采用CT诊断的方法进行诊断,具体操作为:对研究对象的头颅进行CT的平扫,其检查结果的主要特点为:研究对象的静脉窦区域会呈现出条带样的高密度阴影,横窦状的高密度影以及矢状的高密度影和不规则的高密度影等。

一次风冷风量为:

式中:pi,2为冷风管道进口风压;pc为冷风管道出口风压;ρc为冷风空气密度。

一次风总风量为:

通过对一次风送风系统进行机理分析,最终预选出的7个辅助变量分别为:一次风机电流i、磨煤机冷风调门开度、磨煤机热风调门开度、空预器一次风进出口差压Δp1、空预器一次风进出口温差ΔT1、一次风机出口空气压力与磨煤机入口空气压力之间的差压Δp2、一次风机出口空气温度与磨煤机入口空气温度之间的温差ΔT2。

由式(11)(12)可知,送风系统实际送风量与差压的平方成正比,所以选取空预器一次风进出口差压Δp1、一次风机出口空气压力与磨煤机入口空气压力之间的差压Δp2作为辅助变量。

由式(10)可知,一次风实际密度与温差有关,所以选取空预器一次风进出口温差ΔT1、一次风机出口空气温度与磨煤机入口空气温度之间的温差ΔT2作为辅助变量。

一次风在管道内流通时,会遇到相应阻力,其阻力的主要来源是调门开度;所以,选取磨煤机热风调门开度和磨煤机冷风调门开度作为辅助变量。

同时,由于一次风流量的主导变量是一次风机电流,电流大小决定总风量的大小;所以,选取一次风机电流作为辅助变量。

预选出的辅助变量如表1所示。

表1 预选辅助变量Tab. 1 Preselected auxiliary variables

2.2 基于相似度函数的样本选择

选取某600 MW火电机组15 d实际运行数据。记录同一时刻这7个辅助变量运行数据及其对应的实际送风量。间隔5 min记录一次,最终得到数据集X。

式中:Xi为数据集X中第i个样本;前7个元素为第i个样本中的7个辅助变量;第8个元素为同一时刻辅助变量所对应的实际送风量。

由于数据集X中含有大量冗余样本,因此采用相似度函数法去除其中冗余数据。

相似度函数法的核心:通过计算不同样本之间的欧氏距离来判断样本之间的相近程度,进而决定样本的取舍。

相似度函数公式为:

将数据集X经过相似度函数计算,得到含有3 000个样本的新数据集X′。

2.3 基于KPCA的特征选择

将经过相似度函数计算得到的新数据集X′,进行核主成分分析。通过非线性映射函数φ(X)将X′映射到高维空间,然后在高维空间中使用 PCA方法计算主元成分。

设向量ωi为高维空间中的特征向量,λi为其对应的特征值,则高维空间中的PCA为:

将特征向量ωi用样本集合表示为:

将式(14)代入式(13),计算可得:

对等式(15)两边左乘φ(X′ )T得到:

引入核函数矩阵K:

式(16)经过核函数矩阵运算后为:

将α代入式(14),即可求得特征向量ωi;将其作为高维空间中的一组基,通过这组基可以得到测试数据在高维空间中的表示。

经过KPCA得到各主成分的方差贡献度和累计方差贡献度如表2所示。

表2 贡献度Tab. 2 The contribution degree

由表2可知,前5个主元的累计方差贡献度达到了 99.997%,能够表达所有主元中的绝大部分信息,所以选用前5个主元和其对应的实际送风量构成数据集 ′′X。对数据集 ′′X进行归一化,将归一化之后的数据作为模型的输入数据。对输入数据进行划分,将数据集的前2 900个样本划分为训练集,后100个样本划分为测试集。训练集用于训练模型的内部参数,测试集用于对模型进行测试。

2.4 建立基于LSTM网络的模型

在确定了模型的输入数据后,接下来需要确定模型的相关参数,即LSTM隐含层层数、迭代次数 epoch、隐含层输出节点数 units、记忆天数mem_days以及学习率lr。

首先,对模型中的LSTM隐含层层数进行确定。通过多次实验可以得到不同隐含层层数对模型预测结果的影响,其实验结果如表3所示。

表3 不同隐含层数下模型预测结果Tab. 3 Model prediction results under different hidden layers

由表3可知,随着隐含层层数的不断增加,模型预测精度不断提升。当隐含层层数超过3层时,随着层数的增加,模型能够抓取的特征越来越多,学习能力越来越强;但此时却出现了过拟合现象,即在测试集上的表现越来越差。所以最终确定LSTM隐含层层数为3层。

在确定了隐含层层数后,使用麻雀算法对迭代次数 epoch、隐含层输出节点数 units、记忆天数mem_days、学习率lr等超参数进行寻优,并与粒子群寻优算法进行对比。

初始化种群大小为 100个,迭代次数为 200次,设定epoch的区间为[1 000,5 000]、units为[8,32]、学习率lr为[0.001,0.01]、mem_days为[3,8]。使用公式(7)(8)(9)进行位置更新。选取预测值与真实值的最大引用误差作为适应度函数[15]进行训练。

适应度函数为:

式中:n为预测值个数;Yi为预测值;为真实值。

经过麻雀算法得到,当迭代次数epoch为4 360、隐含层输出节点数units为32、学习率lr为0.001、记忆天数mem_days为5时,模型预测精度最高。而经过粒子群寻优算法得到,当迭代次数 epoch为3 250、隐含层输出节点数units为16、学习率lr为0.001、记忆天数mem_days为5时、模型预测精度最高。

为量化预测效果、评估模型优劣,引入最大引用误差(MQE,最大量程为 100)和均方根误差(RMSE)作为模型的评价指标[16]。计算公式如下:

采用2种不同寻优算法得到的模型预测结果对比如表4所示。

表4 不同寻优算法预测结果Tab. 4 Prediction results of different optimization algorithms

由表4可知,采用粒子群算法进行寻优时,陷入了局部最优状态,因此造成寻优效果差、模型预测精度低。使用麻雀算法有效避免了这一问题,使模型取得了较好的预测精度。

3 KPCA-LSTM模型预测实验

经过麻雀寻优算法最终确定,当迭代次数epoch为4 360、隐含层输出节点数units为32、学习率lr为0.001、记忆天数mem_days为5时,模型预测精度最高。此时模型的预测效果如图1所示。

图1 不同模型预测效果对比Fig. 1 The comparison of prediction effects of different models

在实验中引入了LSSVM模型和混合LSSVM模型用于对比。由图1可知,KPCA-LSTM模型较LSSVM模型和混合LSSVM模型拥有更优的预测效果。

不同模型预测效果评估结果如表5所示。

表5 不同模型预测效果评估Tab. 5 The evaluation of prediction effects of different models

4 实际运行数据验证

对建立的KPCA-LSTM预测模型进行现场实验验证。

将训练优化后的预测模型装载到基于 ARM的磨煤机一次风量软测量仪表中。

此仪表是使用 OK6410开发板、基于 FLTK对话框结构、采用模块化设计开发的一套软测量仪表。此仪表通过硬件平台数据采集模块获取辅助变量测点信息,具有计算多个测点实测风量平均值、进行误差统计等功能。

现场实测10组数据如表6所示。

表6 软测量仪表数据统计Tab. 6 Soft measurement instrument data statistics

在进行现场实验前,先将训练优化后的KPCA-LSTM 预测模型装载到软测量测试功能块中,通过数据采集卡获得测点的实时辅助变量值。运行软测量测试功能块时,其内部的预测模型会自动读取实时数据并进行计算,同时将计算后的预测结果及统计信息进行存盘。

在进行测试时还应具备如下条件:

测试系统正常运行,不出现使测试停止的条件;磨煤机正常运行,各辅助变量测点正常;数据采集准确。

满足上述条件后,在某600 MW火电机组上进行现场实验。现场实验过程中记录的预测值与现场实际风量测量值如图2所示。

图2 KPCA-LSTM预测模型现场试验效果Fig. 2 The effect of KPCA-LSTM prediction model field test

图2中红色虚线为KPCA-LSTM预测模型在连续接收300组现场实测辅助变量值后输出的一次风量预测值,蓝色和绿色实线为磨煤机在该时段内2个一次风量测量测点的实际测量值。对比3条曲线可知,KPCA-LSTM 预测模型输出的预测值与现场仪表所测实测值偏差较小。

将KPCA-LSTM预测模型输出的预测值与现场2个测点实测值的平均值进行运算。使用最大绝对误差Emax和平均误差AE进行现场试验效果评估。

经计算得:最大绝对误差Emax为0.45;平均误差AE为0.200 72。

最大绝对误差Emax值为0.45,表示一次风量预测值与2个实测值的平均值之间的最大偏差为0.45 t。平均误差AE值为0.200 72,表示预测值与2个实测值的平均值之间的平均误差为0.200 72 t。由评估结果看出,所建立的KPCA-LSTM预测模型在进行现场实验时拥有较高的准确度和更小的波动性,这说明模型准确合理。

5 结论

本文建立的磨煤机一次风量KPCA-LSTM预测模型较LSSVM模型、混合LSSVM模型具有更小的最大引用误差和均方根误差。

使用麻雀算法优化LSTM网络中的超参数,可使一次风量预测精度更高、预测能力更强。

现场试验中,本文KPCA-LSTM预测模型预测值最大绝对误差为0.45、平均误差为0.200 72。该偏差值较小,说明模型能够提高火电机组磨煤机一次风量预测准确度,同时也说明了所建立的模型正确合理。

本文研究结果可为磨煤机一次风量预测提供理论参考。

猜你喜欢

磨煤机风量辅助
老年人行动辅助车
数据中心间接蒸发冷却空调机组二/一次风量比
麦捷煤业矿井通风能力核定分析
某乘用车冷却系统进风量仿真及优化
定风量调节阀在通风空调系统中的应用
中速磨煤机磨损加剧原因分析及整改措施
例谈何时构造辅助圆解题
钢球磨煤机钢球补充量的研究
双进双出磨煤机及给煤机控制策略改进
浅谈我国中速磨煤机的发展与设计