APP下载

基于核偏最小二乘回归方法的发电机关键运行参数预测分析

2017-10-14马贺贺张小虎

大电机技术 2017年4期
关键词:定子线圈发电机

马贺贺,李 辉,张小虎



基于核偏最小二乘回归方法的发电机关键运行参数预测分析

马贺贺1,李 辉1,张小虎2

(1.上海电气集团股份有限公司中央研究院,上海200070;2.上海电气电站设备有限公司上海发电机厂,上海200240)

通过对发电机关键运行参数的实时预测能够辅助实现发电机运行状态的有效监控。传统偏最小二乘方法(Partial Least Squares,PLS)在应用过程中没有考虑变量间的非线性关系,为提高发电机关键运行参数的预测精度,引入核函数进行变量空间的非线性映射变化,实现非线性回归分析,并将核偏最小二乘回归方法(Kernel Partial Least Squares Regression,KPLSR)应用于发电机定子线圈出水温度预测,实际运行数据的对比分析验证了方法的有效性。

发电机;偏最小二乘方法;核函数;参数预测

0 前言

为了保证发电机的长期稳定运行,发电机组的关键部件往往安装一些测量装置,采集发电机的实际运行数据,供运行人员监视发电机的运行状态是否健康。实际运行过程中,水内冷的发电机定子,易发生定子内冷水对线棒产生腐蚀而使腐蚀产物沉积堵塞线圈出水,导致线圈冷却条件变差,定子绕组局部温升过高而损坏绝缘,并带来严重后果[1-3]。对于这一类逐渐劣化的问题,利用历史数据建立正常状态下的关键参数预测模型,进一步对实际运行过程展开实时预测,通过预测结果与实际采样数据的对比来判断当前变量是否存在不良趋势,可实现比阈值报警更为及时、有效的故障发现与预防。

其中,正常数据的模型预测精度是给操作人员提供可信依据的保证。应用中,一般可采用两类方法进行预测分析建模。一种是采用单变量时序建模的方式,通过对该变量自身的变化情况进行分析,利用其历史时刻的实际数据来预测变量变化趋势[4-6]。由于这一类方法基于过去多个时刻的实际数据进行建模预测,不利于对该物理量的当前健康状况进行评估。另一种是采用多变量建模的方式,如回归分析、神经网络、支持向量机等方法[7-9]。通过对多个变量潜在的耦合关系进行综合分析与建模,达到预测某一关键变量的目的。其中偏最小二乘方法集成了回归分析与成分分析的优势,并在工业过程建模中得到了广泛的应用[10]。但在对发电机关键参数进行预测分析的过程中,发电机本身较为复杂,各变量之间存在较为复杂的非线性耦合关系,而传统的PLS难以有效表征变量间的非线性关系[11,12]。本文通过引入核函数对与发电机定子线圈出水温度有关的多个变量进行高维空间变换后运用回归分析,通过实际数据验证了核函数的引入提高了PLS回归分析预测精度,KPLSR方法能够基于正常数据建立更为准确的基准预测模型,实现对该变量的状态实时预测评估。

1 偏最小二乘方法

(1)对初始数据进行标准化之后,设和的主元向量为和,则可以表示出输入输出矩阵在第一主元所对应的主成分和。

(2)为建立输入矩阵与输出矩阵的回归关系,根据主成分分析的思路,可以把输入输出矩阵进行回归建模:

(3)将当前主元不能解释的残差部分,进行迭代分解回归,直到获取的主元个数达到最大(即输入矩阵的秩)。则最终的回归预测模型为:

对于新样本,直接利用回归系数矩阵即可求解获得输出预测值。

2 核偏最小二乘方法及其应用

从偏最小二乘方法的计算原理中可以看出,PLS进行回归分析属于多元线性回归的方式。而在实际应用过程中,物理对象机理的复杂性决定了表征其状态的各个变量彼此之间存在较强的非线性关系。因此,通过引入核函数方法,通过非线性映射将原始变量空间投影至高维核空间,即进一步在高维空间中进行回归分析,能够增强模型的非线性数据处理能力[12,15]。

常用的核函数包括高斯核函数、Sigmoid核函数以及Polynomial核函数等。其中高斯核函数表示为:

式中表示核函数宽度。在进行发电机关键参数预测的过程中,本文采用学习能力较强的高斯核函数对原始数据进行高维空间映射。主要步骤如下:

(1)对发电机正常运行状态下的过程数据进行标准化处理;

(2)利用高斯核函数对输入矩阵进行高维空间映射得到高维核矩阵K;

(3)利用下式对高维数据空间进行中心化处理

(4)在高维空间中进行偏最小二乘回归,计算回归系数;

(5)利用训练集变量均值、标准差对新样本进行标准化,并进行高维空间投影;

(6)高维空间进行中心化之后,利用回归系数矩阵获取新样本的输出预测值;

(7)对输出结果进行逆标准化运算后得到最终的发电机定子线圈出水温度预测结果。

3 实验分析

采集某电厂发电机实际运行数据进行分析,以发电机定子线圈出水温度作为输出变量,结合专家经验知识选取8个输入变量建立预测模型。输入变量分别为:有功功率、发电机定子线圈进水温度、发电机定子线圈冷却水流量、发电机励端空侧密封油回油温度、定子边端铁心及端部结构件温度、发电机铁心中部齿和轭部温度、汽端冷氢温度、励端冷氢温度。选取2016年4月期间数据作为正常运行状态的训练集进行建模,数据间隔为10min,训练集样本个数为4319个,选取2016年5月期间的数据作为测试数据集,共计4449个样本。

分别对上述数据进行PLS方法以及KPLS方法建模,并在测试集上测试两种方法的预测效果。按照交叉验证方法选择两种方法的主元个数,PLS方法主元个数为3,KPLS方法主元个数为10。改变核函数参数的值,并对训练集数据的预测结果进行对比分析,可以看出,在值较小时,其对模型的拟合精度有较大影响。随着核函数宽度的增加,训练模型的预测精度趋于平稳,因此本文选择100作为最终模型的核函数参数。

采用模型均方根误差(MSE)、绝对误差平均(MAE)、平均绝对百分误差(MAPE)以及希尔不等系数(TIC)对两种模型的预测性能进行综合评估。具体模型训练结果与测试集预测结果对比见表1。从表1中数据可以看出,在模型训练阶段,KPLSR方法在模型训练阶段各项精度指标均小于PLS,更加有效地表征了发电机定子线圈出水温度与其他变量之间的潜在关系,更好地拟合了输出变量。测试集样本的预测也验证了KPLSR模型的有效性,提供了精度更好的预测结果。图2和图3给出了测试集中两天的定子线圈出水温度实际值与预测值之间的对比,从图中可以看出,在发电机正常运行情况下,基于历史数据建立的预测模型能够较为精确地输出预测结果,验证了KPLSR算法的有效性。预测模型输出的预测值代表了当前输入条件下正常运行状态该有的输出结果,在实际数据出现劣化趋势时,通过二者对比将能够在异常的初期阶段进行及早发现,保证发电机的正常安全运行。

表1 预测结果对比

图1 核函数参数影响分析

图2 2016年5月13日数据预测结果对比

图3 2016年5月20日数据预测结果对比

4 结论

本文通过分析传统PLS方法在解决变量间非线性问题时的局限性,结合发电机数据的实际情况,引入核函数变换来提高PLS的预测分析能力。通过在高维核空间中进行回归建模,更为有效的捕捉了变量间的非线性关系,KPLSR方法能够输出更为准确的发电机定子线圈出水温度预测结果,实际的发电机运行数据验证了KPLSR方法的有效性。通过利用历史数据建立正常运行状态下的关键参数预测模型,能够辅助实现发电机异常的及早发现,进而提高发电机的运行安全性。

[1] 钱锋. 发电机水冷定子线圈局部温度异常的故障诊断分析[J]. 大电机技术, 2004(5).

[2] 徐俊红. 水轮发电机定子线圈腐蚀原因分析[J]. 大电机技术, 2010(4):20-21.

[3] 张修波, 姚德全, 韩德才. 发电机水冷定子绕组温度的监测与保护[J]. 电力建设, 2002, 23(7): 50-52.

[4] 李辉, 郭双全, 张梦航. 基于时间序列的发电机温升趋势分析方法[J]. 上海电气技术, 2016, 9(1).

[5] 梁平, 范立莉, 龙新峰. 非线性模型在汽轮发电机组振动故障预测中的应用[J]. 华南理工大学学报 (自然科学版), 2006, 34(6): 122-126.

[6] 赵化时, 赵旋宇, 史迪, 等. 基于PMU数据和时间序列模型的发电机参数识别(英文)[J]. 南方电网技术, 2015, 9(7): 68-75.

[7] 邓建国, 罗隆福. 基于BP神经网络的大型水轮发电机定子铁心的温度预测[J]. 湖南大学学报(自科版), 2000, 27(1): 72-75.

[8] 邹敏, 周建中, 刘忠,等. 基于支持向量机的水电机组状态趋势预测研究[J]. 水力发电, 2007, 33(2): 63-65.

[9] 李锐华, 孟国香, 谢恒堃, 等. 基于偏最小二乘神经网络的大电机定子绝缘击穿电压混合预测方法[J]. 中国电机工程学报, 2007, 27(3): 100-105.

[10] S. de Jong. SIMPLS: An Alternative Approach to Partial Least Squares Regression. Chemometrics and Intelligent Laboratory Systems, 18: 251–263, 1993.

[11] Kim K, Lee J M, Lee I B. A Novel Multivariate Regression Approach Based on Kernel Partial Least Squares with Orthogonal Signal Correction[J]. Chemometrics & Intelligent Laboratory Systems, 2005, 79(1-2): 22-30.

[12] Bennett K P, Embrechts M J. An Optimization Perspective on Kernel Partial Least Squares Regression[J]. Advances in Learning Theory Methods Models & Applications, 2003, 3(10): 227-250.

[13] 邓念武, 徐晖. 单因变量的偏最小二乘回归模型及其应用[J]. 武汉大学学报(工学版), 2001, 34(2): 14-16.

[14] 尹力, 刘强, 王惠文. 偏最小二乘相关算法在系统建模中的两类典型应用[J]. 系统仿真学报, 2003, 15(1): 135-137.

[15] Rosipal R, Trejo L J. Kernel Partial Least Squares Regression in Reproducing Kernel Hilbert Space[J]. Journal of Machine Learning Research, 2001, 2(2): 97-123.

Prediction Analysis of Key Generator Operation Parameters Based on Kernel Partial Least Squares Regression Method

MA Hehe1, LI Hui1, ZHANG Xiaohu2

(1.Shanghai Electric Group Co., Ltd., Central Academe, Shanghai 200070, China; 2. Shanghai Electric Power Generation Equipment Co., Ltd., Generator Plant, Shanghai 200240, China)

Real-time prediction of key operation parameters can assist to achieve effective status monitoring of the generator. Traditional partial least squares method is used without considering the nonlinear relationship between variables. In order to improve the prediction accuracy of generator operation parameters, Kernel function for nonlinear mapping of the variable space is applied in this paper. The kernel partial least squares regression method is used to predict generator stator coil outlet temperature. The validity of KPLSR is verified by contrastive analysis of the real operation data.

generator; partial least squares; kernel function; parameter prediction

TM301.3

A

1000-3983(2017)04-0007-03

上海市科委企业合作专项项目 (15dz1180400)

2017-02-15

马贺贺(1985-),2013年4月毕业于华东理工大学控制科学与工程专业,获得博士学位,现从事工业数据分析工作,工程师。

猜你喜欢

定子线圈发电机
基于LSTM的汽轮发电机线圈的早期异常检测
可拆分式线圈在无损检测中的应用
异步电动机定子冲片槽型优化
超小型薄壁线圈架注射模设计
基于新型趋近律的双定子电机控制系统研究
大型发电机励磁用旋转变换器的开发和应用
随身携带的小发电机
柴油发电机负荷计算
一种在线辨识定子电阻的MRAS转速估算方法
2007款日产贵士车点火线圈频繁烧毁