APP下载

基于多特征融合决策树的原油管道工况识别研究

2021-07-05刘喜梅尹国才

中国新技术新产品 2021年7期
关键词:峭度决策树小波

刘喜梅 尹国才

(北华航天工业学院计算机学院,河北 廊坊 065000)

0 引言

管道运输是一种便捷的、安全的、经济的运输方式,并与其他四大运输方式,即水路、公路、航空和铁路并称现代五大运输方式。石油管道运输在世界经济中扮演着越来越重要的角色。为了保证管道平稳地运行,在管道系统中,多使用SCADA系统,对管道系统进行远程控制调度,并监控管道的运行参数,如管道内的压力、流量以及流体密度等相关参数。基于SCADA管线运行数据和压力波动的海量历史数据,综合运用先进算法,智能识别管道运行工况。

长期以来,国内有关管道压力异常波动的研究主要集中在管道泄漏、管道失效以及输油泵故障等具体领域,针对各类工况智能识别研究较少。陈萍[1]提出了把动态压力信号作正负区间划分、把相邻区间信号累加值差分、相邻区间信号均值差分和相邻区间信号峰值差分作为泄漏信号识别特征的特征量计算方法和相对量化方法[2],该方法具备了一定的工况适应性。刘啸奔、龚骏等人[3-4]引入主成分分析和神经网络的方法,对不同类型且时域形态差异较为明显的压力波动信号进行分析[5],实现了对稳态、启泵、停泵、调阀以及泄漏等工况的有效区分。

该文在该基础上,将各类方法进行有效融合,弥补了各自的缺陷,通过提取管线运行数据信号特征,根据专家经验,采用决策树进行融合建模,从而提高工况识别的准确率,获得更好的实际应用效果。

1 基于小波的信号去噪预处理

在信号分析中有用信号通常表现为低频信号,噪声信号通常表现为高频信号。信号可以由小波分解后的小波系数来描述,小波系数越大,其携带能量越多。小波去噪的基本思想就是根据噪声与信号在各尺度上的小波系数具有不同表现这一特点,将各尺度上由噪声产生的小波分量,特别是将那些噪声分量占主导地位尺度上的噪声分量去除,然后将保留下来的小波系数利用小波算法,重构出原始信号中的有用信号。

在利用小波变换信号处理方法对压力传感器采集到的信号进行滤波消噪时,需要选择合理的小波基函数和恰当的小波变换分解层数。最优基和最优尺度的选取是决定消噪质量的关键。

小波基函数的选择应当视具体分析信号的不同而不同,常用的几种经典小波基函数有dbN小波、symN小波和coifN小波等。目前小波去噪质量的评价指标主要有4种:均方根误差(RMSE)、信噪比(SNR)、互相关函数(R)以及平滑度(r)。

对于小波变换的最优分解层数可以基于均方根误差变化判别法(VRMSE)确定小波去噪的最优尺度,当小波分解的第k层的均方根误差与第k+1层的均方根误差变化的数值开始趋于稳定或接近于0时,可认为此时的小波分解层数k最优。

根据上述方法得到所采集信号的最优基为coif5、最优尺度k=7,利用小波滤波的压力信号效果,如图1所示。

图1 小波变换最优基和最优尺度去噪效果图

2 工况特征提取

2.1 基于统计方法的特征提取

2.1.1 样本熵

“熵”(Entropy)是系统混乱度的度量。近似熵是一种用于量化时间序列波动的规律性和不可预测性的非线性动力学参数,它用一个非负数来表示一个时间序列的复杂性,反映了时间序列中新信息发生的可能性,越复杂的时间序列对应的近似熵越大。

样本熵与近似熵的物理意义相似,都是通过度量信号中产生新模式的概率大小来衡量时间序列复杂性,新模式产生的概率越大,序列的复杂性就越大。与近似熵相比,样本熵具有2个优势:样本熵的计算不依赖数据长度;样本熵具有更好的一致性。根据管道工况产生机理,不同工况压力信号所携带的能量不同,复杂性也不同,图2为管道停泵、启泵、切罐、调节阀关和调节阀开5种不同工况压力信号的样本熵。可以看出,样本熵对样本类型的区分程度比较好。

图2 5种不同工况的信号样本熵

2.1.2 峭度

在管道工况识别研究中,大部分学者都选择直接将信号的峭度值作为特征值,或者先进行信号分解,将信号分量的峭度值构成特征向量,用于描述管道泄漏工况的特征。峭度指标是无量纲参数,对冲击信号特别敏感,特别适用于信号突变的诊断。信号的峭度如公式(1)所示。

式中:i为信号采样点编号,xi为信号的幅值,为信号的均值,σ为信号的标准差,N为信号的采样长度,K为信号峭度。

图3为管道停泵、启泵、切罐、调节阀关和调节阀开五种不同工况压力信号的峭度。从图中可以看出,峭度对样本类型的区分程度同样比较好。

图3 5种不同工况的信号峭度

2.2 典型工况规律特征

根据场站设备以及典型工况产生机理,工况发生会引起压力、流量特定的趋势波动。

当管道某点发生泄漏时,油品外泄,使泄漏点压力降低。上端与泄漏点形成正压差,加速流体从上游向泄漏点的流动,使紧邻泄漏点的上游流量增大,而泄漏点与下端形成负压差,导致紧邻泄漏点的下游流量减小。随着两端油品向漏点处的流动,在泄漏点处形成减压波分别向管道的上下游传递,从降低了全线压力。因此,管线泄漏引起的压力、流量变化趋势为进出站压力降低、出站流量上升以及进站流量下降。

采用定性分析与定量计算相结合的方法研究典型工况对站内压力、流量等参数的影响规律,以此为依据计算压力、流量信号波动趋势,作为工况识别特征。场站在管道运营中,根据传输需要分为传输首站、末站、中间泵站3种类型,每种场站可能发生的典型工况及其压力、流量波动趋势和设备状态变化见表1。

表1 典型工况及其压力、流量波动趋势和设备状态变化

基于上述工作生成表征工况的特征向量,见表2。对表征工况的进出站压力、流量等复杂信号提取其样本熵、峭度及变化趋势3种信号特征;对进出泵压力、泵运行状态、调节阀状态和罐前阀门状态等提取变化趋势特征,共组成表征工况的17种特征的特征向量。

表2 典型工况及其压力、流量波动趋势和设备状态变化

3 基于决策树的工况识别

决策树算法的准确率、鲁棒性较好,计算效率高,且能够适应小样本的训练环境。决策树是一种基本的分类与回归方法,对于该文所研究的工况识别,实际是一个分类问题。采用决策树构建工况识别算法也与实际专家经验总结的工况识别方法相吻合。

决策树在分类问题中,表示基于特征对实例进行分类的过程,可以认为是if-then的集合,也可以认为是定义在特征空间与类空间上的条件概率分布。从根节点开始,对实例的某个特征进行测试,根据测试结果将实例分配到其子节点,此时每个子节点对应该特征的一个取值,这样递归地对实例进行测试并分配,直到到达叶节点,最后将实例分到叶节点的类中。

针对工况识别的特点,该文采用CART分类树构建工况识别决策树,将根据上述方法构建的决策树应用于试验管道进行测试,测试效果见表3。对于泄漏、启泵、停泵、切罐、调节阀开以及调节阀关6种工况分别试验20次,该算法判断准确率达97.5%。使用该算法构建的决策树模型能够较好地识别管道运行中的工况情况。

表3 试验管道测试效果

4 结论

该文根据管道运行规律特征,在管道运行理论的基础上,采用对管道信号有良好区分效果的统计方法提取信号特征;并总结了专家工况识别判断经验,研究管道工况的规律特征,提出基于多特征融合决策树的一种石油管道工况识别算法,对管道运行工况的智能识别具有较好的工况识别效果,能较好地帮助调控人员快速进行决策控制,对降低管网运行安全风险具有重要的意义。

猜你喜欢

峭度决策树小波
基于MCKD和峭度的液压泵故障特征提取
构造Daubechies小波的一些注记
联合快速峭度图与变带宽包络谱峭度图的轮对轴承复合故障检测研究
基于MATLAB的小波降噪研究
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
基于峭度分析的声发射故障检测
基于改进的G-SVS LMS 与冗余提升小波的滚动轴承故障诊断
基于决策树的出租车乘客出行目的识别
基于鲁棒性小波包峭度图的滚动轴承故障诊断*