APP下载

大数据分析技术在风电设备异常预测中的应用

2017-03-27张慧亭王坚凌卫青

电脑知识与技术 2017年3期
关键词:风电机组BP神经网络

张慧亭++王坚++凌卫青

摘要:针对风电机组运行工况复杂多变,机组状态监测数据量大、多源、复杂、增长迅速等特点,现有的异常预测方法在面对大数据时难以既保证预测精度又进行快速处理,故提出了结合Hadoop批处理技术和BP神经网络的风电机组在线异常预测模型,对设备状态信息进行异常预测。实验结果显示,该异常预测方法在保证精度的前提下具有较好的加速效果,可以为风电场维护人员提供重要的参考信息。

关键词:风电机组;异常预测;Hadoop批处理;BP神经网络

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2017)03-0245-03

Application of Big Data Analysis Technology in Wind Power Equipment Anomaly Prediction

ZHANG Hui-ting, WANG Jian, LING Wei-qing

(CIMS Research Center,Tongji University, Shanghai 201804, China)

Abstract: According to the working conditions of wind turbine generator monitoring complex, large amount of data, multi-source, complex, the characteristics of rapid growth, the abnormal current prediction methods in the face of big data to ensure accuracy and rapid processing, the proposed combination of Hadoop batch processing technology and BP neural network of wind turbine online anomaly prediction model, abnormal prediction of equipment state information. The experimental results show that the method has good acceleration effect under the premise of ensuring the accuracy, which can provide important reference information for the wind farm maintenance staff.

Key words: wind turbine; anomaly prediction; Hadoop batch processing;BP neural network

风能作为一种蕴藏量巨大且无污染的可再生能源,受到世界各国的关注与日俱增。但是,风电机组的故障率会随着运行时间的加长而不断升高,这就需要对机组主要部件的故障做好预防工作。目前,风 电 业 主 广 泛 采 用 数 据 采 集 与 监 控(supervisory control and data acquisition,SCADA)系统监测风电机组及其部件的运行状态,然而,SCADA 系统的监测项目针对各自监控的对象,仅仅依靠对监测数据设置阀值来进行越限报警,而且在线监测信息量大、采集数据点密,传统的监控系统难以满足海量监测數据的在线处理需求[1]。因此,如何通过风电机组状态监测大数据进行快速有效的机组设备异常预测成为了新的课题。

较多研究者通过建立状态参数预测模型,分析风电机组运行状态的真实变化情况。文献[2]通过对齿轮箱温度趋势的分析建立了预测模型,该模型是基于单一运行参数针对某个子系统构建的,预测精度有待提高。文献[3]首先建立了主轴轴承、齿轮箱的多元线性回归温度预测模型来对部件温度进行一步超前预测。文献[4]提出了一种基于最小二乘支持向量机的风电机组故障预警方法,利用实际风场机组运行监控数据验证了此方法的可行性,但是,对于结构复杂的海量监测数据,该方法在保证精度的情况下难以满足我们对于处理速度的要求。

针对如上问题,本文提出了结合Hadoop批处理技术和BP神经网络状态参数模型的风电机组异常预测方法。首先,使用Hadoop平台存储海量历史状态监测数据,依据选取的状态参数,实现基于BP神经网络的异常预测算法,然后使用MapReduce框架并行的对预测模型进行训练,以获得较好的加速效果,最后,通过实验验证该异常预测模型的有效性和精确性。

1 风电设备异常预测模型体系概述

1.1 模型框架

基于模型预测精度与数据处理速度的需要,本文基于Hadoop集群,运用MapReduce框架,提出了兼顾预测精度与运行速度的风电设备异常预测模型,该模型的框架结构如图1所示,主要包括数据采集层、存储层、分析层、应用层等4个模块。

具体模块描述如下:

1)数据采集层。主要包括风电设备的状态监测数据、天气数据、地理信息数据

以及各种特殊传感器等业务系统的生产运行管理数据。这些数据来源不一、模态各异,而且存在大量的重复数据,该模块主要完成异常数据和重复数据的清除工作,清理后的数据使用Sqoop等大数据连接器技术传输到分布式数据库或者文件系统中,Sqoop在传输数据时会自动对其格式进行标准化的调整,减少了人为的序列/反序列化操作。

2)存储层。本文主要采用HBase,Hive等分布式数据库作为存储介质,HBase是一个构建在HDFS上的分布式列存储系统,它具有高可靠、高性能以及可伸缩等特点,可以方便地在服务器上搭建起大规模结构化存储集群。Hive是基于Hadoop的一个数据仓库工具,提供类sql查询功能,可以将sql语句转译为MapReduce作业并在Hadoop上执行,便于大批量数据处理任务的并行运行[5]。这些分布式数据库都具有高容错率和高吞吐量的特点,可以很好地满足海量历史监测数据的存储要求,并且适用于数据的批处理访问模式。

3)分析层。集成有训练好的BP神经网络预测模型,基于SCADA状态监测数据、天气数据以及地理信息数据,应用大数据分析技术进行风电设备的异常状态预测。

传统的BP神经网络训练方法在处理海量数据集时面临耗时长,甚至是内存不足无法训练等问题,本文在开源云计算平台Hadoop 的基础上,实现了基于MapReduce框架的BP神经网络并行化运行方式,可以并行的对训练样本进行批量训练,大大地提升了模型的精度和运行速度。

4)应用层。该模块使用训练好的异常预测模型,结合在线输入的监测数据,进而获得状态参数的预测值,计算模型输出值与实际监测值的残差,当残差发生剧烈波动时,判断风电设备的运行状态出现异常,并通过数据可视化技术对相关人员进行展示。

1.2 基于MapReduce的BP神经网络预测模型

BP神经网络是一种按误差反向传播算法训练的多层前馈网络,在各个领域得到了广泛的应用,它能够很好地表示任意的非线性映射关系,而无需事前了解描述这种映射关系的数学方程。BP神经网络的拓扑结构包括输出层、输入层和若干隐层,它的学习算法使用最速下降法,通过不断调整网络的权值和阀值来使网络的误差平方和最小。有研究表明,只要隐层含有足够多的神经元数目,仅仅包含一个隐层的神经网络就能够以任意精度逼近一个连续的非线性函数[6]。因此,本文采用只含有一个隐层的神经网络模型,模型示意图如图2所示:

为了运用并行运算的方法来减少算法运行时间,本文参考文献[7]中对 BP神经网络算法的MapReduce并行化方法,在Map阶段对每个权值的变化量进行计算并输出,然后在Reduce阶段对各个权值的总变化量进行统计,之后再统一调整权值,并且使用批处理的方式进行训练。

1.3 风电机组异常预测运行流程

受风速的波动变化和天气的季节性变化影响,风电机组的运行环境经常发生剧烈的动态变化,因而需要在不同的运行工况之间进行频繁地切换,导致设备状态监测数据的幅值在正常运行状态下也会发生较大的变化,这意味着我们不能根据幅值的大小来判断机组的运行安全程度。而目前主流的做法都是采用阀值报警的方法,即如果监测信号达到了报警阀值,则判断机组的运行状态出现异常,这导致了很多漏报和误报的情况发生,为了提高风电设备异常预测的精确度,本文采用了残差分析的方式对机组的运行状态进行判断,基本流程如图3所示:

具体过程阐述如下:

1)选取风电机组正常运行状态下的 SCADA 数据,经过预处理得到可用的监测数据,然后将这些数据按一定的比例划分为训练数据和测试数据。

2)训练数据经过归一化处理后,选取风速、齿轮箱油温、机舱振动传感器X、机舱振动传感器Y,机舱振动有效值和发电机转速等6个状态参数为模型的输入参数,对BP神经网络模型进行训练,直到模型的输出值误差达到理想的范围。

3)用预测模型对目标参数进行预测,与实际值对比,获得残差,如果残差没有超过阈值,则判断状态正常。

4)如果残差超过阈值,则采用式(1)计算均方根误差(root-mean- square-error,RMSE),来衡量残差变化的剧烈程度,应用目前流行的滑动窗口技术,可以更加准确的反映其变化趋势,本文通过计算每天的 RMSE,来获得 RMSE 的变化情况。

[D=1mi=1mxi-x2] (1)

式中:D为均方根误差;m 为样本数;x为模型的预测值;xi为实际值。

5)当RMSE超过阈值,则判断机组状态出现异常。

1.4 实验结果与分析

为了模拟风电场大数据风电机组异常状态预测的相关情况,在实验室搭建的Hadoop平台上对本文所述方法进行了仿真实验,Hadoop集群由一个主节点(Master)

个两个从节点(Slave)组成,各节点是由Windows Server 2012 上的Hyper-V管理器创建的虚拟机,节点的内存为2G,硬盘为200G,在开发的过程中用到了Eclipse、Hive、HBase等工具。

实验采用某风电公司风电场提供的2015年6月到2016年9月产生的实际运行数据,其中包含37台风机的监测数据,选取其中15台风机2016年7月份共15组监测数据,按一定的比例抽取数据作为测试样本,对模型进行训练,每组训练1000次,使得模型输出值误差范围达到满意的效果,进而得到性能良好的神经网络预测模型。

为了验证模型状态参数预测的精确度,选取对应1台风机2016年7月份的共15组监测数据作为测试样本对模型进行测试,预测下一时刻齿轮箱油温平均值,如图4所示为其中2台风机实际监测值与模型预测值的对比效果,其中,预测值为蓝色曲线,真实值为红色曲线,可以看到,两条曲线基本吻合,验证了模型的有效性和精确性。

图4 模型预测效果对比图

为了测试模型并行化之后的加速效果,对同样大小测试数据集分别在单机和集群环境下测试程序运行时间,发现当测试数据量较小时,单机所用时间少于集群运行时间,而随着数据集的增大,集群的计算优势就越来越明显。

1.5 结束语

针对在海量历史监测数据基础上如何快速有效的对风电设备的异常运行状态进行预测这一问题,本文基于当前主流的大数据技术,设计并实现了风电设备的异常预测模型。基于Hadoop的MapReduce框架,通过对训练样本学习得到并行化的BP神经网络预测模型,提高数据批处理的效率,加速风电机组异常状态预测的计算过程和数据处理的效率。实例表明,在正常运行工况下,预测模型能准确地对状态参数进行预测,同时具有出较好的加速效果,满足海量监测数据环境下风电机组在线异常状态预测的要求。

参考文献:

[1] Bin Lu, Yaoyu Li, Xin Wu and Zhongzhou Yang. A Review of Recent Advances

in Wind Turbine Condition Monitoring and Fault Diagnosis[J]. PEMWA 2009, IEEE, 2009(6): 1-7.

[2] 郭鹏, David Infield, 杨锡运. 风电机组齿轮箱温度趋势状态监测及分析方法[J]. 中国电机工程学报, 2011,31(32): 129-136.

[3] 张小田. 基于回归分析的风机主要部件的故障预测方法研究[D]. 北京: 华北电力大学, 2013.

[4] 许骏龙, 李征. 基于支持向量机的风电机组故障预警[J]. 工业控制计算机, 2013(8): 54-56.

[5] 徐长安, 余忠源. 基于Hadoop的海量风电数据平台研究[C]// 2014电力行业信息化年會论文集. 2014.

[6] Hornik K.Multilayer feedforward networks are universal approximators[J]. Neural Networks, 1989, 2(5): 359-366

[7] 陈春萍, 查雅行, 钱平, 等. 基于MapReduce的BP神经网络遗传算法在非线性系统辨识中的研究[C]//中国通信学会. 第十八届全国青年通信学术年会论文集(下册). 中国通信学会, 2013: 7.

猜你喜欢

风电机组BP神经网络
基于S能量熵的直驱式风电机组故障诊断方
基于实践应用的风电机组测试与认证教学改革