APP下载

基于 Elastic Net 特征变量选择的 SCR 入口 NOx 软测量模型

2021-09-13王印松陈瑞杰

中国测试 2021年12期

王印松 陈瑞杰

摘要:在传统选择性催化还原反应器( selective catalytic reduction,SCR)入口 NOx 软测量研究中,选取相关变量大多是基于机理分析方法,具有一定主观性。针对这一问题,提出 Elastic Net 方法结合最小二乘支持向量机(least squares support vector machine,LSSVM )的 SCR 入口 NOx 软测量模型。首先采用 Elastic Net 对潜在相关变量进行变量选择,该方法无需机理分析,避免变量选择的主观性。此外,Elastic Net 克服最小絕对收敛和选择算子(least absolute shrinkage and selection operator,LASSO)变量选择时因数据内部存在共线性和群组效应而影响选择效果的问题。然后利用 LSSVM 具有的训练速度较快、泛化性能优良和非线性逼近能力强等优点,建立 Elastic Net-LSSVM 软测量模型。现场数据仿真结果表明:Elastic Net-LSSVM 与 LSSVM 相比,在预测时均方根误差减小8.45%,使预测更准确,验证软测量模型的有效性,可为烟气脱硝系统的控制优化提供参考。

关键词: NOx 软测量; Elastic Net;特征变量选择; LSSVM

中图分类号: TP274.2文献标志码: A文章编号:1674–5124(2021)12–0079–08

Soft sensor model of SCR entrance NOxbased on Elastic Net feature variable selection

WANG Yinsong,CHEN Ruijie

(Department of Automation, North China Electric Power University, Baoding 071003, China)

Abstract: In the traditional selective catalytic reduction(SCR) entrance NOxsoft sensing research, the selection of relevant variables is mostly based on mechanism analysis method, which has a certain subjectivity. To solve this problem, this paper proposes a SCR entrance NOxsoft sensor model based on Elastic Net method and least squaressupportvectormachine(LSSVM). Firstly,ElasticNetisusedtoselectvariablesofpotential characteristic variables. This method does not need mechanism analysis and avoids the subjectivity of variable selection. In addition, Elastic Net overcomes the problem that the selection effect is affected by collinearity and group effect in the selection of variables of least absolute convergence and selection operator (LASSO). Then, the soft sensing model of Elastic Net-LSSVM is established by using the advantages of LSSVM, such as fast training speed, excellent generalization performance and strong nonlinear approximation ability. Field-data simulation results show that compared with LSSVM, Elastic Net-LSSVM can reduce root mean square error by8.45%, which makes the prediction more accurate, and verifies the effectiveness of the soft sensor model, which provides a reference for the control optimization of flue gas denitrification system.

Keywords: NOxsoft sensing; Elastic Net; feature variable selection; LSSVM

0引言

为了降低火电机组污染物排放,烟气脱硝系统的控制优化一直是火电机组的研究热点之一,其中 NOx 的测量是解决控制优化的难点[1]。燃煤电站脱硝过程主要采用 SCR 方法,SCR 烟气脱硝系统入口 NOx 浓度在线监测需要经过烟气管道抽气与烟气分析仪处理,造成的迟延时间普遍高达1 min[2]。使用软测量技术能有效解决迟延造成的影响。

软测量方法属于间接测量方法,它通过分析变量间数学关系建立目标函数的预测模型[2]。针对上述问题,通过建立高精度的 SCR 入口 NOx 浓度软测量模型,可实现对入口 NOx 浓度的间接测量,对控制氮氧化物排放具有重要意义。

软测量模型性能主要取决于建模关键变量的选择,选择合适的特征变量不仅可以大大减少模型计算量,还可减少冗余变量中的噪声干扰。目前,针对软测量模型特征变量提取问题,多种特征选择方法不断被提出,主要分为3类:1)机理分析方法:文献[3]通过对过程机理分析,基于对主副反应过程的了解,选择主要的反应物与反应条件数据作为相关变量,实现了对 CO2、SO2和 NOx 排放因子的细致分析;文献[4]由机理分析确定相关变量,然后采用卡尔曼滤波与数据融合技术实现在线测量 NOx 浓度。2)智能选择算法:文献[5]利用 PLS 方法得到變量重要性投影指标Vip值,结合贪心搜索确定最优子集;文献[6]在信息熵理论基础上改进 MIFS 筛选算法,综合考虑了特征变量与主导变量相关性,减少了信息冗余。3)机理分析与智能算法结合方法:该方法首先通过机理分析确定潜在相关变量,再通过智能算法建模得到相关变量。文献[7]采用 KPCA 对潜在相关变量进行处理,实现降低模型维数和消除变量间相关性的目的;文献[8]利用 MMI- PCA-KLPP 二次降维,在高度降维的同时,保证了样本的局部和全局结构特征,有效缩短了模型训练时间;文献[9]采用偏互信息方法选择相关变量,通过计算条件期望,在一定程度上消除了变量间共线性,使预测结果更准确。

上述方法虽然在一定程度上实现了模型特征变量选择和入口 NOx 浓度有效测量,但都有不足之处。对于机理分析方法,由于任一因素改变都会使机理模型改变,因此分析过程复杂,成本较高;对于智能算法,大多属于前向选择方法,容易引入冗余变量。此外,以上方法也未考虑高维变量顺序对高维互信息的影响。对于机理分析与智能算法结合方法,在机理分析确定潜在相关变量时未有统一标准,导致潜在相关变量选取上差异极大,仅依靠研究者对电站的理解,利用机理分析结合该机组实际情况选取潜在特征变量,易造成漏选、错选及变量信息错误处理等问题。

针对以上问题,本文以某电站660 MW 机组实际运行数据为研究对象,利用 Elastic Net 分析方法选取特征变量,通过添加正则化项施加惩罚,从而无需机理分析就能有效去除无关变量,达到变量选择目的。该方法属于“白箱”模型,可探索机理潜在特性,便于后续研究的开展,为实际热工过程特征变量选择提供参考。将 Elastic Net 方法结合 LSSVM 方法,建立了 Elastic Net-LSSVM 入口 NOx 浓度软测量模型,并设置两组对照实验验证该模型的优势。

1理论基础

1.1 Elastic Net 特征变量选择

电站实际数据含有大量潜在特征变量,但是入口 NOx 浓度的预测精度只取决于部分关键特征变量,因此选择特征变量不仅能够减少计算时间,降低计算成本,且能够有效提高软测量模型的性能,对于热工过程模型建立具有实际意义。

设多变量回归模型为:

式中:Y = y1 ,y2 , ··· ,ynT e Rn×1——n 个样本对应的入口 NOx 浓度实测值;

X =[x1 , x2 , ··· , xn]T e Rn×p——n 个样本p 维潜在特征变量;

β=[β1 ,β2 , ··· ,βp]T e Rp×1——目标回归向量;

ε1 e Rn×1——随机误差。

由于多变量回归模型局限性,通常添加正则化项达到变量稀疏化效果[10],其表达式为:

式中:λ——惩罚系数;

b——回归向量范数。

当 b=1和 b=2时,分别是 LASSO 模型和岭回归( ridge regression,RR)模型[11]。LASSO 方法和 RR 方法分别通过 L1和 L2范数的正则化降低过拟合风险。相比 RR 方法,LASSO 方法的 L1范数能够使无关变量的回归系数压缩为0,求得明确稀疏解。但 LASSO 方法有两个缺陷,对于高维变量低维样本数据( n

p 时,LASSO 因数据内部多重共线性和群组效应而影响降维效果。针对该问题,Zou 等[12]提出了 Elastic Net 模型,该方法通过 L1和 L2范数凸组合方式改进惩罚系数,同时继承了 RR 模型和 LASSO 模型的优势,其推导如下:

(β)= argβ(m)in {∥Y ? Xβ∥2(2)+λ1∥β∥1+λ2∥β∥2(2)}(3)

令α=λ1/(λ1+λ2),λ=λ1+λ2,式(3)转化为Na?ve Elastic Net 模型:

(β)= argβ(m)in {∥Y ? Xβ∥2(2)+λ[α∥β∥1+(1?α)∥β∥2(2)]}(4)

其中α∥β∥1+(1?α)∥β∥2(2)称为 ElasticNet 惩罚,是LASSO 惩罚与岭惩罚的凸组合。其中,Elastic Net 惩罚的凸性强弱取决于α(0<α<1)的大小,α越趋近于0,凸性越强,岭惩罚性质表现得越明显;α越趋近于1,凸性越弱,LASSO 惩罚性质越明显。如图1可清晰展示惩罚参数等高线。

为便于证明 Elastic Net 优势,可通过变换将其转换为 LASSO 形式展示,对于给定数据集(X, Y)和(λ1, λ2),定义(X*, Y*)为:

令r =λ1/√1+λ2;β*=√1+λ2β,则:

那么:

经过变换,样本维度转变为n+p,相关变量矩阵 X*的秩为p,可实现全变量选择,克服了 LASSO 的共线性效应和群组效应。Na?ve Elastic Net 模型易产生过度收缩,因此略加修正成为 Elastic Net 模型:

与Na?ve Elastic Net 相比,Elastic Net 仅在系数上对其进行调整,不但继承了Na?ve Elastic Net 的优点,而且在变量稀疏计算中,因变量往往是正交解,1+λ2作为调节因子是最优解。

1.2最小二乘支持向量机

对于数据集( X, Y),X =[x1 , x2 , ··· , xn]T ∈ Rn×m 代表 n 个样本 m 维特征变量,Y = y1 ,y2 , ··· ,ynT ∈ Rn×1代表具有 n 个样本的 NOx 浓度向量。将变量矩阵X 从初始空间映射到 Hilbert 空间:

基于结构风险最小化原则搜寻最优参数ω和b:

式中:ω——置信空间,表示模型的复杂度;

C——正则化常数;

lε(f(xi)–yi)——ε不敏感损失函数。

若引入松弛变量ξ,可将式(10)和(11)改写为:

引入拉格朗日方程(αi≥0为拉格朗日乘子):

由 KKT (Karush–Kuhn-Tucker)最优化条件得:

经过合并:

引入核函数κ(xi , xj)=?(xi)T ·?(xj),将式(15)转化为线性方程组求解:

(16)

通过上式得到参数ω和 b,最终得出 LSSVM 回

(17)

实际运用中,通常采用径向基核函数:

2 Elastic Net-LSSVM 软测量模型

Elastic Net 软测量模型流程为:1)原始数据获取:从实际现场提取时间跨度1日以上原始数据集;2)数据预处理模块:首先移除非稳态数据、剔除异常数据,将样本维度由 n 维降为 h 维,然后确定 NOx 的迟滞时间,最后数据标准化;3)Elastic Net 特征变量选择:通过 Elastic Net 方法,变量由 p 维降为 m 维,构建新样本集 X(h×m)和 Y(h×1);4)PSO- LSSVM 模型预测:合理划分样本集,投入 LSSVM 模型进行训练。LSSVM 预测最佳参数 C 和σ由 PSO 进行寻优确定,直至满足终止条件后,记录最佳参数 C 和σ,同时记录 NOx 预测结果。5)利用均方根误差(6RMSE )、平均相对误差(6MRE )、决定系数(r2)和误差大于30 mg/m3的超标个数(CB)作为该模型评价指标,验证模型性能(目前大气污染物排放已纳入严格监管,北京市新建锅炉 NOx 排放标准已降低至30 mg/m3,为便于后续脱硝控制优化,应考虑纳入 CB 指标作为衡量软测量)。均方根误差(6RMSE )、平均相对误差(6MRE )、决定系数(r2)和超标个数(CB)的计算公式为:

式中:n——样本个数;

yi——实际测量值;

i——实际测量值的平均数;

i——相应的预测值。

3基于实际热工过程历史数据仿真

3.1原始數据获取与数据预处理

以某电站660 MW 超临界机组脱硝系统为研究对象,从 SIS 数据库中提取负荷跨度较大运行数据,从实际现场 SIS 数据库中提取负荷跨度较大运行数据(333.8~605.9 MW ),共56 h,采样间隔设定为60 s。剔除3个数据缺失及问题变量,潜在相关变量个数达62,其中,甲侧反应器入口 NOx 浓度变量范围为201.5~431.8mg/m3。经过预处理,筛选出具有代表性的2015组数据,选取1411组(70%)作为训练集,另604组(30%)作为测试集。

3.2 Elastic Net 变量选择

根据式(4)和(9)可知,Elastic Net 筛选变量取决于参数α(0<α<1)和正则化参数λ(λ>0)。为获模型最佳参数,首先采用10折交叉验证确定其系数α,然后基于 lambda.1SE 准则(lambda.1SE 准则,即误差小于等于最小误差与一个标准误差之和时,取得的最大λ值)确定正则化系数λ[12]。当确定最佳参数α=0.72时,不同正则化系数λ对应的 MSE 变化曲线如图2所示,图中蓝线与 MSE 交叉圆圈处表示最佳正则化系数λ。由图可知,基于 lambda.1SE 准则获取的最佳正则化系数为λ=0.00406。

基于获取的最佳系数(α=0.72,λ=0.00406),Elastic Net 方法采用最小角回归算法( least angleregression, LARS)迭代计算各潜在特征变量的稀疏系数[11]。各变量的稀疏系数解路径如图3表示,稀疏系数为0表示无关特征变量,不为0表示经过筛选得到的特征变量,坐标上方的数字为对应模型包含的变量数。由图 3 可知,Elastic Net 方法选择了 41 个特征变量,为了直观显示每个变量的稀疏系数,将所有稀疏系数可视化排列,其中横坐标表示潜在特征变量编号,纵坐标表示稀疏系数,如图 4 所示。

根据所得稀疏系数值可知,在多测点变量数据中,空气预热器 A /B 出口二次风温度、空气预热器 A /B 出口二次风压力,均仅保留了 A;甲侧反应器入口温度1~3保留了2和3,但2回归系数极低,说明2对3起到一定补充作用,综上验证了 Elastic Net 方法能够有效解决变量多重共线性选取问题。由机理分析大致确定的重要关键变量,均被 Elastic Net 选择为特征变量,从一定程度上验证了机理方法,体现了 Elastic Net 选择变量的优势[3]。变量维度由62降低为41,可明显看出变量冗余性降低,提高了模型后续计算效率。

3.3模型结果分析

将训练集投入 Elastic Net-LSSVM 模型训练,通过 PSO 寻优算法[13]确定了 LSSVM 模型最佳参数( C=301.337,α=298.435),图5和图6分别展示了训练集与测试集预测结果。由图5和图6可知,预测值与实际值均大致分布于对角线附近,此时训练样本的评价结果为6RMSE =6.2852、6MRE =0.0186、 r2=0.9407、CB=1,测试样本的评价结果为6RMSE =7.5558、6MRE=0.0216、r2=0.9262、CB=4。结果表明,该模型具有较好拟合及预测能力。

为了更直观地展示 Elastic Net-LSSVM 软测量模型的预测结果,图7采用点连线将预测值与实际值作对比,虚线代表实际值,实线代表预测值。由

为了进一步验证该模型的泛化性能,将已完成实验的数据命名为序列1,再用同样方法取出序列2(342.3~603.4 MW)、序列3(359.2~583.5 MW)、序列4(347.4~603.0 MW)进行分组实验,并用上述评价指标评价泛化性能。为比较在不同样本数量的泛化性能差异,分别在序列2、序列3和序列4分别取出500、600和700个样本进行实验。图8表示运用序列1已训练好的模型预测序列2、序列3和序列4,表1表示模型评价结果。

由图8和表1可知,利用序列1训练,然后预测序列2、序列3和序列4均能较为准确地预测 NOx 浓度。其中,对序列2和序列4的预测结果较准确且超标样本占比少;对序列3的预测结果较差,但总体仍然能够满足软测量泛化性要求。序列2数量为500,序列4数量为700,这两组预测效果较好,然而样本数与原序列接近的序列3预测效果较差,说明序列长度对预测结果没有造成显著影响。综合实验结果,验证了该模型具有较良好的泛化性能。

3.4模型对比分析

为了验证 Elastic Net 变量选择方法对模型性能      提升的有效性,对比常用变量选择方法 PLS、LASSO 和 PCA,设置对照实验组①:LSSVM、PCA-LSSVM、PLS-LSSVM、LASSO-LSSVM 及Elastic Net-LSSVM 进行实验仿真并分析,实验对比结果见表2。其中, PCA 方法提取24个主成分其特征值贡献率达95%以上,因此提取24维特征向量即可满足软测征值贡献率达到95%以上,结果选取了46个特征变量[5, 14]。设计分组实验对比各模型泛化性能,利用同样的序列2、序列3和序列4进行实验,实验结果见表3所示。

结合表2和表3实验结果对各模型性能逐一分析,LSSVM 模型是将62个变量全部投入模型训练,虽然在序列1的预测结果效果尚可,但引入过多冗余信息造成模型泛化效果不佳,在对序列2、3、4的泛化预测中,指标 r2值显示其预测可靠程度均比较低,且误差均为最高。作为比较,Elastic Net-LSSVM 模型对序列1的预测结果为6RMSE=7.5558,相比 LSSVM 模型的8.2530,RMSE 减少了8.45%,对序列2、3、4的预测结果中,RMSE 分别减少了28.46%、14.41%、20.15%,验证了 Elastic Net 方法的有效性。 PCA-LSSVM 在序列1的预测中表现优良,测试误差仅比 Elastic Net-LSSVM 稍差,且将变量维度降低为24维,有效提高了模型预测效率。然而,在对序列2、3、4的泛化預测中,PCA-LSSVM 效果较差,与 LSSVM 模型相比,未能有效提升模型预测准确率,此外,PCA 方法降维提取的变量不具有实际意义,不便于后续研究开展;PLS-LSSVM 在序列1预测中,预测精度低,未能有效提高预测准确率,对序列4预测效果较差,泛化性能一般;LASSO-LSSVM 模型与 Elastic Net-LSSVM 模型类似,均能够实现特征变量选择和NOx 浓度预测,但Elastic Net-LSSVM 综合性能更佳。综上,在建模前使用 Elastic Net 变量选择模型能有效提高模型性能。

为了验证 Elastic Net 方法的适应性,将本文采用 LSSVM 模型与常用的机器学习算法 KPLS、BPNN、 SVR 进行比较。设置对照实验组②:Elastic Net-KPLS、Elastic Net-BPNN、及 Elastic Net-SVR,进行仿真实验并分析结果。实验对比结果见表4。

由表4可知,Elastic Net 方法结合 LSSVM 模型相比其他对照预测模型综合性能最佳,Elastic Net- SVR 效果次之,然后是 Elastic Net-BPNN,而 Elastic Net-KPLS 模型综合效果最差。

4结束语

本文基于烟气脱硝系统控制优化的实际需要,提出一种基于 Elastic Net 特征变量选择的 SCR 入口 NOx 浓度软测量模型,首先给出了建模预处理流程,然后利用 Elastic Net 方法筛选变量,最后利用 LSSVM 模型预测 NOx 浓度,并采用某电站660 MW 超临界机组历史运行数据验证了该方法的可行性。实验结果表明,Elastic Net 方法能较为全面地分析潜在特征变量进行筛选而无需机理分析,有效减少了建模所需变量个数,提高了运算效率;此外,该模型具有“白箱”特性,便于后续开展研究。相比于无变量选择、PCA 方法、PLS 方法及 LASSO 方法,基于 Elastic Net 特征变量选择的 NOx 软测量模型综合表现最好,分组实验表明,Elastic Net 具有良好泛化性能,可用于不同序列数据预测分析;相比 Elastic Net-KPLS、Elastic Net-BPNN 及 Elastic Net- SVR 模型,Elastic Net-LSSVM 模型误差较小,其静态准确度和泛化性能均可满足软测量要求。

参考文献

[1] SHAKIL M, ELSHAFEI M, HABIB M A, et al. Soft sensorforNOxandO2 usingdynamicneuralnetworks[J]. Computers & Electrical Engineering, 2009, 35(4):578-586.

[2] BUSCAG,LIETTIL,RAMISG,etal. Chemicalandmechanistic aspects of the selective catalytic reduction of NOx, byammoniaoveroxidecatalysts: Areview[J]. Applied Catalysis B Environmental, 1998, 18(1/2):1-36.

[3] NAZARI S, SHAHHOSEINI O, SOHRABI-KASHANI A, etal. Experimental determination and analysis of CO2, SO2, andNOx,emissionfactorsinIran sthermalpowerplants[J]. Energy, 2010, 35(7):2992-2998.

[4]石饶桥, 李健, 张彪, 等.基于卡尔曼滤波的烟气 NOx 浓度融合测量方法[J].机械工程学报, 2017, 53(24):63-69.

[5]杨国田, 王英男, 谢锐彪, 等.基于变量选择的深度置信神经网络锅炉烟气 NOx 排放预测[J].热力发电, 2020, 49(4):34-40.

[6]马平, 李珍, 梁薇.基于互信息的辅助变量筛选及在火电厂NOx 软测量模型中的应用[J].科学技术与工程, 2017,17(22):249-254.

[7]趙欢, 王培红,陆璐.电站锅炉热效率与 NOx 排放响应特性建模方法[J].中国电机工程学报, 2008(32):96-100.

[8]刘长良, 曹威, 王梓齐.基于 MMI-PCA-KLPP 二次降维和模糊树模型的 NOx 浓度软测量方法[J].华北电力大学学报(自然科学版), 2020, 47(1):79-86.

[9]刘吉臻, 秦天牧, 杨婷婷, 等.基于偏互信息的变量选择方法及其在火电厂 SCR 系统建模中的应用[J].中国电机工程学报, 2016, 36(9):2438-2443.

[10]潘天红, 李鱼强, 陈琦, 等.基于 Elastic Net 特征变量选择的黄山毛峰茶等级评价[J].农业工程学报, 2020, 36(13):264-271.

[11] ROBERT TIBSHIRANI.Regression shrinkage and selection viathelasso[J]. Journalof theRoyalStatisticalSociety: Series B (Methodological)267-288,1996,58(1):.

[12] HUI Z, TREVOR H. Regularization and variable selection via theelasticnet[J]. Journalof theRoyalStatisticalSociety:Series B (Statistical Methodology), 2005, 67(2):301-320.

[13] GEQ,GUOC,JIANGH,etal. Industrialpowerload forecasting method based on reinforcement learning and PSO- LSSVM[J].IEEE Transactions on Cybernetics, 2020(99):1-13.

[14]马宁, 董泽.基于 PLS-SVR 的电站锅炉 NOx 排放特性建模[J].中国测试, 2019, 45(11):138-142.

(编辑:商丹丹)