APP下载

基于声音识别与温度诊断的天然气泄漏监测

2023-11-14黄忠胜刘文华宋文容强富平

石化技术 2023年11期
关键词:阀室相似性特征提取

黄忠胜 刘文华 宋文容 强富平

1. 国家管网西部管道公司 新疆 乌鲁木齐 830000

2. 昆仑数智科技有限责任公司 北京 102200

目前国内外管道阀室泄漏检测方法主要分为两大类,即直接检测和间接检测[1]。这些泄漏检测方法存在诸多缺陷,主要表现在:①需要实时获取管道运行压力、流量、温度等运行参数,而实际中对管道阀室获取完整的实时数据难度大[2];②无论直接检测或是间接检测,上述检测方法与管道阀室信息化管理,仍然需要大量人工参与,不利于管道阀室数字化智能化建设[3];③目前检测方法多基于单因素数据(如管道),对阀室的温度、声音等自然环境影响参数应用研究不足,不能从整体多维度进行信息分析和多种检测方法的相互校验[4]。

为解决上述检测方法存在的问题,本文提出了基于多算法融合的阀室天然气泄漏智能检测分析研究方法,通过智能声音识别和温度规则综合诊断,提高管道阀室天然气泄漏检测准确率和可靠性。

1 智能音频诊断技术研究

1.1 音频降噪技术研究

下面主要研究数字滤波、小波降噪、谱减法3种典型的降噪方法。

1.1.1 数字滤波

数字滤波对输入信号采样多次,然后用特定计算方法进行数字处理,以削弱或滤除干扰噪声造成的随机误差,从而获得真实信号过程。

1.1.2 小波降噪

基本思路是将信号通过小波变换,信号产生的小波系数含有信号的重要信息,将信号经小波分解后小波系数较大,噪声小波系数较小,通过选取合适的阀值进行筛选[5]。

1.1.3 谱减法降噪

谱减法适用于满足平稳噪声(整个时间范围内,噪声均值和方差基本保持不变),且噪声为纯加性噪声的场景。工程中一般默认混合信号(含噪信号)的前几帧仅包含环境噪声,利用混合信号的前几帧的平均幅度谱或者能量谱作为估计噪声的幅度谱或者能量谱。最后利用混合信号(含噪信号)的幅度谱或者能量谱与估计到的幅度谱与能量谱相减,得到纯净信号的幅度谱或者能量谱。

1.2 音频特征提取技术研究

通过拾音器获取声音信号,经过采样与量化,转化为数字信号。通过对数字信号进行分帧、加窗处理,即得到固定时间间隔的音频帧。从这些音频帧中取出固定维度的特征向量,再对这些特征进行帧叠加与帧采样,即完成了音频由时域到频域的特征提取,得到最终的特征帧。这些最终的特征帧将被作为机器学习算法的输入,去完成声音识别等高级任务。

1.3 泄漏音频异常检测

1.3.1 基本思路

每种声音都具有其独特性,音频片段A提取特征logfBank1(logfBank提取算法类似于MFCC算法,都是基于fBank特征提取结果基础上,再进行一些处理),在音频A中加入泄漏声音后提取混合声音频特征logfBank2,logfBank1与logfBank2其特征数值差异即为是否含有异常泄漏声音。

1.3.2 基于panns_cnn14神经网络模型进行异常检测

本次采用pans_cnn14作为预训练模型,用于音频的特征训练。

(1)数据集准备

训练音频分2组,分为泄漏音频和非泄漏音频,泄漏音频内包含有天然气阀室真实泄漏声音以及实验室模拟泄漏声音,总计时长达8h;非泄漏音频包含天然气阀室背景声音以及日常生活背景声,总计时长达40h。2组音频通过格式转化、采样率归一化、音频降噪处理、音频切分等处理,分给每个时长为5s的wav格式音频片段。

(2)加载预训练模型

项目基于百度飞桨PaddleSpeech深度学习框架进行开发,预训练模型基于Audioset音频数据进行训练,该数据由谷歌发布,包括632个音频事件类的扩展类目和从YouTobe视频整理的2084320个人类标记的10s声音剪辑的结合,可涵盖大部分的音频场景。

(3)设计分类算法

深度学习方法可以突破特征维度数量的限制,以更灵活的组网方式和更深的网络层次,更好地提取声音的高层特征,从而获得更好的分类指标[6]。

采用panns中的CNN14作为backbone,用于提取声音的深层特征,SoundClassifer创建下游的分类网络,实现对输入音频的分类。

(4)工程部署和实验测试

实验测试数据采用与训练数据相同的格式,实际泄漏音频420个,非泄漏音频9580个,合计10000个音频。实验基于最新训练模型,预测准确率99.7%,错误率0.3%。

1.4 泄漏音频相似性检测

1.4.1 基本思想

提取特定时长音频特征矩阵,通过计算矩阵相似度来表示音频之间的相似程度。获取泄漏音频作为比对库,计算测试音频与比对数据库中所有泄漏音频相似度均值,通过与实验探索的阈值进行对比,预测测试音频是否泄漏。

1.4.2 基于音频MFCC特征提取矩阵进行相似度计算

(1)数据集准备

数据集准备同1.3.2数据准备一致。

(2)音频特征提取

梅尔频谱特征作为声音识别和声纹识别领域最为成熟的音频特征,诸多音频处理工具包如librosa、torchaudio、paddleaudio等都有MFCC特征提取函数,输入音频文件,即可获得相应的特征矩阵。

利用训练好的声音分类模型,截取神经网络和线性层部分作为新模型,可获取一维音频特征表示向量,实验探索中使用panns_cnn14成熟音频分类模型,并基于实验音频数据进行训练微调。

实验探索中基于声纹模型神经网络层(自定义多层LSTM或成熟的ECAPA-TDNN模型)加线性层作为新模型,获取音频一维特征向量。

(3)相似性度量与阈值探索

音频经过特征提取即可获得矩阵或一维向量,通过比较矩阵或向量的相似性即可表示音频之间的声音相似程度:

相似性方案中阈值确定,计算每一个泄漏音频与其他泄漏音频的相似性,得到数组χ0,χ1,χ2…χi,同样计算每一个非泄漏音频与所有泄漏音频的相似性,得到数组δ0,δ1,δ2…δj寻找最佳可区分两组相似性的值α作为区分阈值。

(4)工程部署和实验测试

实验测试数据采用与训练数据相同的格式,实际泄漏音频420个,非泄漏音频9580个,合计10000个音频。实验分别基于3种音频特征提取方式进行测试,梅尔频谱系数诊断预测准确率99.78%,效果略优于其他2种诊断方式。

2 结构化温度诊断规则与实验测试

2.1 同一采集点温度随时间变化阈值设置与实验测试

先采集一段时间的区域最低温,以此计算平均最低温Ta,后续测得的实时区域最低温T低于该平均温某个特定值(阈值A),即:T

根据方案设计,在不同阈值设定下进行30次(25次非泄漏,5次模拟泄漏)工况实验,测试表明在实验工况条件下设置阈值为1.8℃效果最佳。

2.2 不同采集点温度对比变化的阈值设置与实验测试

具体做法是,采集阀室不易发生泄漏位置处温度Ta,采集阀室容易发生泄漏位置处温度Tb,设备每隔30s采集两区域的温度进行对比。正常工况条件下Ta与Tb接近,当泄漏发生时,Ta>>Tb,通过与设定阈值T对比诊断。因两区域处于相同的工况条件,能够影响两区域温度差异发生变化的因素,排除采集设备的微小差异,只有泄漏工况条件。

根据方案设计,在不同T值设定下分别进行了30次(25次非泄漏,5次模拟泄漏)工况实验,测试表明在实验工况条件下设置阈值0.8℃效果最佳。

3 综合音频诊断与温度数据检测分析

3.1 音频综合诊断

结合泄漏音频异常检测与泄漏音频相似性对比两种方案,将音频事件检测过程中模型预测概率值与音频相似性赋予不同权重,再与经验阈值进行对比,从而给出音频综合诊断结果。

3.2 结构化温度综合诊断

结构化温度诊断的2种方案,在大量实验基础上,分别给出方案最佳阈值和在该阈值条件下预测结果的准确度。赋予2种预测不同权重,再与经验值阈值对比,给出温度诊断结果。

3.3 音频、结构化温度综合诊断

考虑到任何单一诊断方法都很难达到完全准确可靠,而天然气泄漏的危害性极大。在综合音频、结构化温度诊断时,任何一种方案监测到泄漏即进行报警。

在590次工业试验中预测准确率在97%以上,测试结果如表1所示。

表1 综合工业试验异常诊断实验结果

4 结束语

本文研究基于声音、结构化温度综合分析进行诊断,针对西部管道公司输气管道2处阀室开展工业性试验。通过泄漏音频异常检测和音频相似性对比进行声音综合诊断;通过检测同一采集点温度随时间变化和同时检测不同采集点温度差异进行温度综合诊断。

猜你喜欢

阀室相似性特征提取
一类上三角算子矩阵的相似性与酉相似性
浅析当代中西方绘画的相似性
国内外输气管道阀室间距设计对标分析
国内外油气长输管道阀室设计标准差异研究
天然气管道阀室雷击事件原因分析和对策
基于Daubechies(dbN)的飞行器音频特征提取
Bagging RCSP脑电特征提取算法
低渗透黏土中氯离子弥散作用离心模拟相似性
西气东输泗阳站阀室放空安全分析
基于MED和循环域解调的多故障特征提取