APP下载

基于信息增益的管道堵塞声学检测方法∗

2021-04-28朱雪峰吴建德

振动、测试与诊断 2021年2期
关键词:堵塞物三通声学

朱雪峰, 冯 早, 吴建德, 马 军

(1.昆明理工大学信息工程与自动化学院 昆明,650500)(2.昆明理工大学云南省人工智能重点实验室 昆明,650500)

引言

供/排水管道是城市建设和社会发展的生命线,在管道运行状态中,过载、疲劳、环境污染等因素会导致管道内部出现裂缝、堵塞、泄漏等功能性缺陷,进而降低管道的使用寿命。堵塞是管道运行中普遍存在的一种现象,管道出现轻微堵塞时,如果不能够被及时发现并加以处理,随时间的推移,堵塞面积不断增大,最终形成严重堵塞。严重堵塞将降低管道的运载能力和系统的可靠性,增加环境污染的可能性和系统的冗余性,并且导致系统中部分管道超压,增加泄漏的可能性,最终造成水资源的严重浪费和环境污染[1]。若轻微堵塞能够被及时发现并加以处理,就能最大限度地减少严重堵塞和多重堵塞造成的损失。由于管道深埋于地下,使得对其运行状态的评估具有复杂性和挑战性。因此,埋地管道运行状态的无损检测,对保证管道正常运行的高效性与可靠性具有重要意义,是城市基础设施维护的重点和难点[2]。

迄今为止,已出现听音法、机器人检测法等多种检测方法,但都有一定的缺陷。听音法的检测结果严重依赖人工经验。机器人检测法是利用电荷藕合器件图像传感设备(charged coupled device,简称CCD)对管道内部进行检测,设备的购置价格和维护费用过高,检测效率低。然而,声学检测作为一种无损检测方法,具有操作简单、检测范围长、成本低及不严重依赖检测人员的主观性等优点,在检测管道运行状态中广泛应用。但在实际检测中,声波经过声阻抗不连续界面会发生不同程度的反射、折射、衍射等物理现象,造成在不同的频率范围内,声波对管道的运行状态敏感度不同。因此,回波信号在不同频率范围内携带的信息量不同,即不同频率的分量特征权重各异。研究表明,在大多数(99%)管道泄漏的情况下,声能主要集中在频率范围为0~100 Hz的低频分量,这说明声学信号具有明显的频域局部特征[3]。孙洁娣等[4]提出基于K-L散度的PF分量选择算法,选取含有管道泄漏状态的主要PF特征分量,从而完成对管道泄漏的定位。文玉梅等[5]利用频谱内能量分布的差异选择各分量内的特征向量,实现了供水管道泄漏的辨识。肖启阳等[6]根据峭度值选取包含管道微小泄漏的冲击成分分量,实现管道微小泄漏的检测。以上的研究均是对管道泄漏状态进行识别,对管道堵塞这方面的研究较少。但是,声学信号在不同频率范围内对堵塞的敏感程度受管道内径、长度、埋设情况等因素的影响,且与堵塞物大小和堵塞程度有关。因此,有必要在堵塞条件下对声学信号不同频率包含的特征信息量进行详细分析。

基于上述分析,笔者首先对采集到的声学信号进行离散小波变换(discrete wavelet transformation,简称DWT);其次,利用信息增益(information gain)简化和筛选分量;最后,对筛选后的分量进行声压级变换,提取梅尔频率倒谱系数(mel frequency cepstral coefficients,简称MFCC),作为特征向量输入至极限学习机(extreme learning machine,简称ELM)中,实现了管道运行状态的分类识别,对管道不同程度堵塞的检测具有重要的实际意义。

1 管道堵塞识别的时频分析原理

1.1 基于信息增益的声学信号处理

采用声波的“直入射”方法对管道运行状态进行检测时,声学信号携带足够的信息来识别管道的缺陷和堵塞。然而,声学信号中包含体波、共振波、导波、散射波等各种成分和噪音,具有复杂的非线性和非平稳特性。

离散小波变换[7]是根据被分析信号的特征,选择与信号频谱相匹配的频带进一步分解,从而对信号进行全面的时频分解,提高时频分辨率,也就是说离散小波变换是对满足条件的频段进行分解,其中,db系列的小波基是故障诊断中常用的[8]。假设原始信号x(n)中的频率范围是[0,fs],则每个节点的频率段为fs/n2,分解后获得多个分量,部分分量与管道堵塞信息紧密相关,而其他的分量则与堵塞无关或是噪声干扰成分。因此,有必要对分量信息进行筛选,为此提出一种基于信息增益的分量筛选方法。

基于信息增益筛选分量的基本原理如下:给定样本集D和连续属性a,假定a在D上出现n个不同的取值,将这些值从小到大进行排序,记为{a1,a2,...,an}。相邻 的属性取 值ai与ai+1,t在区 间[ai,ai+1]取任意值所产生的划分结果相同。因此,对于连续属性a,把区间[ai,ai+1]的中位点作为候选划分点,划分点t可将D给定样本集分为子集,其中属性a的取值范围小于或等于t的样本为,属性a的取值范围大于t的样本为其信息增益[9]的计算公式为

其中:Gain(D,a,t)是给定样本集D基于划分点t二分后的信息增益。

基于信息增益筛选分量选择的主要步骤如下:

1)计算给定样本集D;

2)对于每个属性a即分量,计算信息增益Gain(D,a,t)和划分点

3)筛选Gain(D,a,t)的最大值,并将对应的分量选择为决策树的根节点;根据计算得到的划分点,将样本集D分裂为两份,其中大于t的样本为小于或等于t的样本为4)将剩余的分量作为前节点的数据集,选取信息增益最大的分量为根节点分裂的非叶子节点;

5)对于每一个分量,如果信息增益值大于给定阈值,则重复步骤3和步骤4;

6)如果最大信息增益小于一个给定阈值,则停止分量选择,完成分量筛选。

声压级变换(sound pressure level,简称SPL)[10]使声学信号在相对于振幅较高的成分中,振幅较低的成分得以拉高,以便观察掩盖在低振幅噪声中的特征信号。因此,采用声压级变换对声学信号内容进行放大,增加不同程度堵塞之间的区分度,使管道不同运行状态的特征信息在后续分解中更易提取。声压级计算公式为

其中:pe为原始声学信号的声压有效值;p0为参考声压的有效值,文中参考声压取1×10-5Pa。

1.2 基于MFCC和ELM的管道堵塞识别

当声波沿着管道轴线传播时,遇到堵塞物会出现共振波,峰值会发生相应变化,峰值为共振峰,表示堵塞物的主要频率成分,而共振峰携带管道运行状态的辨识属性,利用梅尔频率倒谱系数[11]来描述共振峰的信息,达到提取管道不同运行状态特征参数的目的。

极限学习机因具有结构简单、学习速度快等优点得到广泛应用。Huang等[12]提出的一种针对训练单隐藏层前馈神经结构(single hidden layer feed forward neural network,简称SLFN)的极限学习机算法,并将其应用在故障诊断中,其具有参数调整简单、学习速度快、随机产生并后续不需要实时调整连接权值以及隐含节点阈值等显著特点。

ELM的网络输出为

ωi与bi为随机生成,这使得ELM直接产生全局最优解,其求解最终转化成范数最小二乘解,求解速度快。

ELM的优化目标为

其中:C为惩罚系数。

式(5)可有以下求解

其中:(HTH+CI)⊥为矩阵HTH+CI的morepenrose广义逆;H为隐藏节点的输出;T为期望输出。

极限学习机的学习速度非常快,在ωi和bi随机赋值并且保持不变的情况下,仅需要确定输出权重β来逼近任意训练的样本即可。而传统的基于梯度下降的BP神经网络模型每次迭代需要调整n∗(L+1)+L∗(M+1)个值,且BP神经网络模型为了保证系统的稳定性通常选择较小的学习率,易出现学习时间加长、陷入局部最优、过拟合等问题。鉴于ELM的优点,文中选用该方法对处理后管道运行状态信号进行识别。

1.3 基于声学检测的管道堵塞识别系统流程

针对埋地管道不同程度堵塞特征难以提取的问题,笔者提出了一种将离散小波变换、信息增益、声压级、梅尔频率倒谱系数以及极限学习机相结合的堵塞识别方法,其具体步骤如图1所示。

图1 基于声学检测的管道堵塞识别系统流程Fig.1 Blockage detection system based on acoustic technology

1)分别选取管道正常运行状态、堵塞运行状态、多重堵塞运行状态的声学信号进行频域分析,初步观察得到不同运行状态的特征频率;

2)根据特征频率,对声学信号进行离散小波变换,获得表征原始信号特征不同频率的分量信号;

3)对离散小波包分解得到的各个分量计算信息增益,分量的信息增益值根据决策树筛选原则进行筛选,设定一个阈值,将筛选后的信息增益值与设定的阈值进行比较,若该分量信号的信息增益值小于阈值,则停止筛选;

4)对信息增益值筛选后的分量信号进行声压级变换;

5)提取声压级变换之后声学信号的梅尔频率倒谱系数作为特征集合;

6)将特征集合输入至极限学习机分类器,得到管道运行状态的识别。

2 管道堵塞检测平台搭建

如图2所示,实验室搭建了管道堵塞的声学检测实验平台[13]。本实验采用黏土制成的半圆柱体模拟堵塞物,激励信号选取正弦扫频信号,因为正弦扫频信号的频带可以按需求调节,用它去激励多自由度的系统时,可以使声学信号对管道敏感的频率范围内能量集中,易于激发出该频段内所需的信息,多用于户外检测使用的激励信号。实验参数如下:黏土管道直径为150 mm,长为14.4 m。检测时,使用装有LabVIEW软件的计算机控制虚拟仪器产生频率为100~6 000 Hz的正弦扫频信号,然后通过ILBVIEW软件的DAQ助手,控制NI PXIe-6363数据采集卡的模拟输出端口,输出模拟电压信号,经过功率放大器放大后,驱动声卡产生音频信号,通过扬声器将音频信号发射至管道中,作为激励信号源,该声波信号在管道内部与声阻抗不连续界面经过复杂的相互作用,被置于管道首端的麦克风接收回波信号,经滤波器滤波后上传至计算机中存储,滤波器的滤波范围为100~4 000 Hz,采样频率为44 100 Hz,通过分析接收的信号确定管道内部声学性能的变化,其中选用Analog Devices Inc公司型号为LM4950的功率放大器,选用Visaton公司型号为FR874OHM的 扬 声 器,选 用Knowles Acoustics公司型号为SPM0208HE5的麦克风。

图2 管道堵塞检测实验平台图Fig.2 Experimental platform of blockage detection

为模拟实际工况,在图2所示的实验平台上分别进行不同程度堵塞的实验,管道中有水流动用来模拟正常排水管道的运行条件,水流的速率由水泵设定,本实验中模拟水流的最大速率为7 L/s,其他模拟水流速率为:0.42,1.00,1.80,4.25和6.10 L/s,用来形成不同高度的管内水位。实验室定义管道堵塞程度为堵塞物高度占管道横截面高度的百分比,高度为20,40和55 mm的模拟堵塞物分别放置在直径为150 mm的管道中,这些刚性、无孔的堵塞物高度分别占管道截面积的13%,26%和37%,近似认定为轻微堵塞状态、中度堵塞状态和中重度堵塞状态。

管道的运行状态在本研究中设定为:正常运行空管状态;正常运行状态的空管中有常规部件三通件;存在单个堵塞物的运行状态(包括高度为20 mm的堵塞物、高度为40 m的堵塞和高度为55 mm的堵塞;多重堵塞(包括40 mm堵塞和55 mm堵塞同时存在并放置在管内不同位置、40 mm堵塞和三通件同时存在、55 mm堵塞和三通件同时存在、40 mm堵塞物、55 mm堵塞和三通件同时存在))共计9种管道运行状态。每种运行状态的样本数有40组,总计360组。

3 实验结果与分析

3.1 声学检测信号分析

声学信号在管道中传播时,与管壁、堵塞物以及三通件发生碰撞,产生反射、折射和衍射,选择典型管道运行状态下的声学信号的时域和频域波形如图3所示。

图3 直入射声学检测信号时域和频域波形图Fig.3 Direct incidence acoustic waveform in time domain and frequency domain

如图3所示,横坐标的“距离”是声波在管道中的传播距离,便于在时频域图中确定管道尾端、堵塞物和三通件的大致位置。文中传播距离等于传播时间乘以声音在空气中的传播速度(约340 m/s),因为在排水管道中,水流占管道横截面积的20%,声音多在空气中传播。图3(a)为原始信号的时域波形图,难以在时域波形中分辨出堵塞物的位置和堵塞物的大小,甚至和管道配件(三通件)混淆难以区分,主要原因在于环境噪声的存在和不同的物体对不同范围的频带响应不同。从图3(b)的频谱波形图可知,堵塞物和三通件对超过6 000 Hz以上的频率范围不敏感,因此在频域上频率超过6 000 Hz之后,幅值不明显。因此,对信号的下一步降噪和分解频率范围都在5 000 Hz以内,引入离散小波变换,从信噪比较低的原始声学信号中提取出包含特征信息的分量。

根据此特点,对采样频率为44 100 Hz的声学信号进行6层离散小波变换,如图4所示。图中:x为离散的声波输入信号;h为高通滤波器;g为低通滤波器;↓2为降采样滤波器。经过第1层离散小波变换,声学信号x被分解成频率范围为0~22 050 Hz的低频分量和频率范围为22 050~44 100 Hz的高频分量,去除高频噪声分量;对频率范围为0~22 050 Hz的低频分量继续第2层离散小波变换,得到频率范围为0~11 025 Hz的低频分量和频率范围为11 025~22 050 Hz的高频分量,不满足频率范围低于5 000 Hz的要求,去除高频噪声分量;依次经过6层离散小波变换,声学信号被分割成8个分量,其频 率 由 低到高排列:0~689,689~1 378,1 378~2 068,2 068~2 757,2 757~3 446,3 446~4 134,4 134~4 823,4 823~5 513 Hz。

为便于分析和观察,选取典型管道的运行状态进行能谱图分析。从图5(a)中可知,颜色越浅表示此处的能量越大,从正常管道的能谱图可以看出,信号的能量主要集中200~1 000 Hz频率范围内,除管道首端和尾端能量聚集,其他位置无能量聚集。对于单个堵塞和三通件,从图5(b),(c)中可知,当管道中有三通件和堵塞物时,能量在此处具有良好的时频聚集性,且与声学理论相符合,能量在堵塞物处聚集,在三通件处稍微发散。对于多重堵塞,从图5(d),(e),(f)中可知,随着堵塞物的增加,各堵塞物和三通件间的能量逐渐衰减,不同运行状态的能量出现的频段仍保持相对稳定,但管道中存在两个堵塞和三通件时,出现了能量的交叠。能谱图能准确定位管道首端、尾端、堵塞及三通件的位置,但无法准确判定管道不同的运行状态,因此需要进一步对管道运行状态进行识别研究。

图4 6层离散小波变换Fig.4 Six-level wavelet decomposition tree

图5 管道运行状态能谱图Fig.5 Energy spectrum of pipeline operation state

由于不同频率的声波以不同的速率在反射面不同程度的反射,因而信号强度和在不同频率范围内对管道的运行状态敏感度不同。分量中与管道堵塞无关的特征分量会给分类带来干扰,导致分类的精度降低[14]。

分量筛选的目的是简化特征空间,剔除复杂度,提高系统性能。一个分量能够为分类模型带来的信息越多,则该分量越重要,分类模型中它的有无将导致信息量发生较大变化,而前后信息量的差值就是这个分量给模型带来的信息增益。因此,采用信息增益从8个原始分量中筛选出M个有效分量来识别管道的不同运行状态。基于信息增益筛选有效分量的主要步骤如下。

1)计算给定样本集D。选择9类管道运行状态,每个运行状态各40个样本,共计360个样本,每个样本有8个分量组成数据集D。

2)计算信息增益。根据式(1)计算得到360个样本的信息增益和相应的划分点。

3)根节点选择。如图6(a)所示,8个分量中“分量4”的信息增益值最大,选择为决策树的根节点;根据计算得到的划分点,把数据集D分裂为两份。

4)子节点选择。对于剩下的7个分量,采用步骤2计算信息增益,选择信息增益最大的分量为决策树的叶节点。如图6(b)所示,“分量1”是数据集D小于等于分量4中信息增益最大分量,选为第2层左子树的子节点。如图6(c)所示,“分量8”是数据集D大于分量4中信息增益最大值,选为第2层右子树的子节点。经过第2层以后,数据被分为4份。

5)离散小波包分量剩下的5个,采用步骤2计算信息增益,信息增益给定阈值为0.1。如图6(d)所示,“分量6”是第3层左子树中信息增益最大,如图6(e)所示,“分量3”是第3层右子树中信息增益最大。

6)经过第3层筛选后,最大信息增益小于给定阈值0.1,停止并完成分量的筛选。

图6 信息增益计算图Fig.6 Information gain calculation diagram

决策树的根节点为第1层信息增益最大值分量是分量4,经过第2层筛选,在左节点中信息增益最大的分量是分量1,右节点的最大分量是分量8,同理经过最后一层的筛选,只有左节点分量的信息增益值大于阈值,因此第3层的分量为分量6和分量3。由图6可知,信息增益筛选后的分量为4,1,8,6,3。

对信息增益筛选后的分量进行声压级变换,增加不同分量之间的区分度,以便于提取特征。声压信号和声压级变换后信号的对比图如图7所示。

由图7(a)可知,对于正常运行的管道有无三通件,其信号的拐点不易区分。由图7(b)可知,经声压级变换后的信号拐点能明显区分,离散小波变换能直接去除信号中高频噪声,声压级变换能更好地反映信号的局部特征,增加不同运行状态之间的区分度,提高声学信号的敏感度。

图7 声压级变换图Fig.7 Conversion diagram of sound pressure level

3.2 管道堵塞识别

分别采集正常管道、堵塞管道、多重堵塞管道的声学信号,共计360个样本,根据上文信号处理方法对信号进行相关处理,然后提取其MFCC特征。管道360个样本的梅尔频率倒谱系数能够从总体上反映出管道正常运行和堵塞运行状态的差异,管道运行状态中有堵塞时,梅尔频率倒谱系数有明显的变化,具体分析如下:MFCC随着堵塞程度的加深变化趋势比较混乱,各分量曲线的波动大,说明MFCC对管道堵塞更为敏感。声波在管道中传播时,遇到三通件等管道的横向连接,在一系列频率范围内信号均匀地反射,而遇到堵塞物,声波以非均匀模式反映信号的强度。因此,梅尔频率倒谱系数可作为管道运行状态的识别依据。

随机选取另一组的声学检测信号作为测试样本,包括9类管道运行状态,各20组样本,总计180组样本,分别提取8个分量,主成分分析筛选(principle component analysis,简称PCA)、信息增益筛选后4,1,8,6,3分量的特征参数集MFCC,分别输入至ELM模型,测试管道运行状态识别的准确率,识别结果如表1所示,表中LC为三通件(lateral connection,简称LC)。

表1 ELM的识别准确率Tab.1 The accuracy rate of ELM recognition

由表1可知,经筛选后管道运行状态声学信号的识别率准确率较筛选前有明显的提高,说明分量筛选的有效性,不同分量之间特征参数的信息量不一样。相比较利用PCA筛选分量,信息增益筛选分量的准确率高,这说明基于信息增益筛选分量的方法能最大程度的保留数据特征信息以及减少分量中冗余及噪声特征的干扰的方式,提高了模型的识别精度。但对于管道的多重堵塞,识别准确率只有

50%~60%。

为进一步验证本研究方法的有效性,利用信息增益筛选分量,分别采用支持向量机(support vector machine,简称SVM),BP神经网络(back propagation,简称BP)和ELM来进行识别,并对识别结果进行比较,如表2,3所示。

由表2可知,若正常运行的管道和管道中只有单个堵塞时,基于SVM,BP神经网络、ELM的方法,筛选前对管道运行状态的识别准确率平均结果分别为76.6%,76.0%和77.4%,整体低于80%,识别准确率结果偏低。筛选后的识别结果分别是83.2%,87.4%和94.8%,识别准确率明显提高。通过上述分析可知:利用信息增益筛选后的分量包含更多的管道运行状态的特征,分量的筛选对特征提取是有效的,它不仅能大幅度减少数据量,也能够用更少的识别时间来实现高准确率的识别。

上述结果表明,笔者所提出的方法不仅能有效识别运行状态下管道的程度堵塞,而且能够排除三通件等常规管道部件对堵塞识别的影响,提高管道状态的识别准确率。对管道的多重堵塞采用相同的信号处理方法,得到不同分类器的识别准确率,如表3所示。

表3 管道多重堵塞的不同分类器识别准确率Tab.3 Recognition accuracy using different classifi‑ers for multiple blockages in the pipe %

当管道中存在多重堵塞时,基于SVM,BP神经网络、ELM的方法筛选前的识别平均结果分别为56.5%,58.5%和56.5%,都低于60%,整体偏低。这是因为采用“直入射”的声波对管道多重堵塞进行检测,其声学信号由两部分组成,首先出现的是共振波模态,其次是“类导波”模态,对于多重堵塞或堵塞物和三通件共存的管道,声波的衰减强烈,造成共振波与“类导波”混叠,难以对多个堵塞进行准确的识别。今后可针对如何提高多重堵塞检测的识别准确率展开研究。

表2 单个堵塞管道的不同分类器识别准确率Tab.2 The recognition accuracy using different clas‑sifiers for single blockage into pipe %

4 结束语

目前,管道堵塞的声学信号与堵塞类型、形状、大小等因素有关,受管道材料、管径大小、水流量、管道压力以及周围环境的影响。为了揭示管道堵塞信号的传播机理,提高堵塞识别准确率,笔者提供一种快速、客观和准确的方法来识别埋地管道堵塞的特征。针对离散小波变换后只有部分的分量包含管道堵塞信号的问题,提出基于信息增益的分量筛选方法,有效提取包含大量堵塞信息的特征分量,信号中有用的信息得到保留,又为深层次地挖掘信息起到十分关键的作用。对正常声学信号和带有三通件管道的声学信号进行声压级变换,对比两种信号的声压级波形,发现声压级变换能有效的从混合信号中反映管道运行的局部特征,增加不同运行状态之间的区分度。将MFCC的特征参数与ELM分类器相结合,能够准确地从含有噪声的声学信号中提取出堵塞特征,有效的识别管道不同程度的堵塞。但由于管道拓扑结构和检测环境的复杂性,管道所处环境、堵塞形式、管道声学传播特性的多样性,使得对于管道的多重堵塞问题还需要进一步探索与研究,主要包括以下两方面:研究声波在多重堵塞管道中的传播特性、规律,建立声波传播模型和堵塞可能性预测模型。同时,研究主动声波检测技术,即向管道施加特殊激励信号,通过管道传播后,收集含有管道信息的信号,得到管道运行状态的内在的各种信息。研究包括:激励信号的类型、波长、频率选择;声场分布;信号在不同管道材质的衰减及传播方式。

猜你喜欢

堵塞物三通声学
一起热压三通开裂失效机理研究
元坝气田X1井井筒堵塞原因分析
渤海油田疏水缔合类堵塞物伤害机理及解堵技术
非均相聚合物驱油藏防砂井近井挡砂介质堵塞机理实验研究
爱的就是这股Hi-Fi味 Davis Acoustics(戴维斯声学)Balthus 70
J气田气井井筒堵塞物组成性质及形成机理研究
Acoustical Treatment Primer:Diffusion谈谈声学处理中的“扩散”
Acoustical Treatment Primer:Absorption谈谈声学处理中的“吸声”(二)
Acoustical Treatment Primer:Absorption 谈谈声学处理中的“吸声”
隆德县三通古碑考释