基于音频特征的汽车发动机状况识别技术

2024-02-03李晨玉

农机使用与维修 2024年1期

李晨玉

(天津滨海汽车工程职业学院,天津 300352)

0 引言

汽车发动机稳定和可靠运行对于车辆的性能和安全至关重要,实时监测和诊断发动机故障是确保汽车发动机的稳定和可靠运行的重要保证。传统的发动机故障诊断方法通常依赖于传感器数据和复杂的物理模型,其实施成本高且难以普及[1-2]。

近年来,随着机器学习和信号处理技术的迅猛发展,为实时监测和诊断发动机故障提供了更具成本效益和可扩展性的方法。基于音频特征的发动机状况识别技术基于车辆已有的音频传感器,对发动机在运行过程中产生的声音信号进行分析和识别,以评估发动机健康状况和检测潜在故障[3]。音频特征的提取是基于音频信号的重要步骤,可以采用傅里叶变换、小波变换和时域特征提取等信号处理方法,将原始音频信号转化为具有代表性的特征向量。这些特征向量包含了发动机运行状态的关键信息,如频谱分布、能量分布和周期性特征等[4-6]。信号特征提取结束后,基于机器学习算法对提取的音频特征进行训练和分类,通过对大量标记的训练样本进行学习,能够识别不同发动机状况下的特征模式,并为未知样本进行准确的分类。

本文将深入探讨基于音频特征的汽车发动机状况识别技术,系统论述了该技术研究进展,并对其关键技术及方法进行阐述,包括数据采集、特征提取、机器学习模型训练等关键步骤。研究成果期望能为汽车制造商和维修服务提供商提供一种新的发动机状况监测和故障诊断方法,以提高车辆可靠性、安全性和维护效率。

1 研究进展

国内外关于基于音频特征的汽车发动机状况识别技术的研究成果如表1所示[7-9]。调研结果表明,通过采用不同的信号处理和机器学习算法,以及提取不同的音频特征,为发动机故障诊断和状况监测提供了多样化的方法和解决方案,为进一步发展基于音频特征的汽车发动机状况识别技术提供了重要的参考和借鉴。

表1 国内外研究进展

尽管国内外研究学者取得了一系列的研究成果,但是基于音频特征的汽车发动机状况识别技术仍然面临一些挑战和问题。首先,不同车型和驾驶条件可能会导致声音信号的差异,需要更深入的研究来提高模型的泛化能力。其次,数据质量和噪声对诊断结果有着重要影响,因此需要进一步优化信号处理方法。此外,模型的可解释性也是一个重要问题,特别是在实际应用中需要解释诊断结果的情况下。

2 技术方法

2.1 信号处理与特征提取

基于音频特征的汽车发动机状况识别技术依赖于有效的信号处理和特征提取方法,可以去除噪声、增强信号质量,并将信号转换为更易于分析的形式。特征提取则通过提取关键特征来描述音频信号的内容和特性。本章介绍在基于音频特征的发动机状况识别中常用的信号处理和特征提取方法。

2.1.1 预处理

音频信号通常受到环境噪声和其他干扰的影响,因此需要进行预处理以去除这些干扰并提高信号质量。常见的预处理方法包括降噪技术,如维纳滤波、中值滤波和小波阈值去噪;滤波技术,如低通滤波和高通滤波;伪音移除方法,如自适应伪音消除和谱减法等。当噪声类型不同时,所采用的信号处理方法也不同,在实际应用过程中需要根据不同的信号类型进行处理方法的选择,如表2所示。

表2 不同噪声类型处理方法及特点

2.1.2 傅里叶变换

傅里叶变换是将时域信号转换为频域信号的重要工具。通过傅里叶变换,可以将音频信号表示为频谱图,从中提取频率分量、频谱能量、频谱形态等频域特征。傅里叶变换可以采用快速傅里叶变换(FFT)算法实现高效计算。

2.1.3 小波变换

小波变换可以将信号分解成不同频率的子带,使时频特性能够同时表示。在发动机状况识别中,小波变换常用于分析发动机振动信号,并提取与故障相关的特征。常见的小波变换方法包括离散小波变换(DWT)和连续小波变换(CWT)。

2.1.4 时间域特征提取

从音频信号的时域波形中提取特征可以描述发动机声音的时域变化和统计特性。常用的时域特征包括时长、峰值、均值、方差、时域波形形状等。这些特征可以通过滑动窗口分析、统计计算和数学模型来提取。

2.1.5 频域特征提取

从音频信号的频谱图中提取特征可以描述发动机声音的频域分布和谱线特性。

1)频谱能量。频谱能量是指在不同频率区间内的信号能量分布情况,通过计算每个频率区间内的能量值,可以了解发动机声音在不同频率范围内的能量分布情况。常见的频谱能量特征包括总能量、能量集中度等。

2)频谱峰值。频谱峰值是指频谱图中具有最大幅值的频率分量,主要用于表示发动机声音的主要频率成分和谱线峰值的位置。常见的频谱峰值特征包括主频率、最高峰值幅度等。

3)频率分量。在频谱图中具有显著幅值的离散频率点称为频率分量,通过提取频率分量,可以识别出发动机声音中的特定频率成分。常见的频率分量特征包括频率峰值位置、频率带宽等。

4)频谱形态。频谱形态描述了频谱图中的形状和轮廓特征,可以反映发动机声音在不同频率范围内的能量分布和频谱线的形状。常见的频谱形态特征包括谱线斜率、谱线的宽度和形状等。

2.2 机器学习算法的选择与训练

2.2.1 算法选择准则

1)问题类型。根据问题的性质和要求选择合适的算法。例如,分类问题可以使用决策树、支持向量机(SVM)、逻辑回归等;回归问题可以使用线性回归、随机森林等;聚类问题可以使用K均值聚类、DBSCAN等。

2)数据规模。考虑数据集的大小,选择适合处理大规模数据的算法。例如,当数据集非常庞大时,深度学习算法(如神经网络)可能更适合,而对于小规模数据集,传统机器学习算法也能够提供良好的性能。

3)特征空间。根据特征的类型和属性选择算法。例如,对于文本数据,可以使用基于词频的方法(如朴素贝叶斯分类器),或者使用词嵌入技术(如Word2Vec)来表示文本特征。

4)可解释性要求。根据应用需求,考虑算法的可解释性。某些场景下,需要能够理解算法的决策过程和结果,因此可以选择基于规则的方法(如决策树),而不是黑盒模型(如深度神经网络)。

1）根据《广州市建筑节能与绿色建筑“十三五”专项规划》，到2020年，广州市新建建筑全面执行绿色建筑标准，累计新增的绿色建筑总量约为8600万m2；二星级以上绿色建筑占绿色建筑总量的比重达到20%以上，新增二星及以上绿色建筑总量约为1300 万 m2；

5)计算资源和效率。考虑算法的计算复杂度和资源需求。某些算法可能需要大量的计算资源和时间进行训练和推理,因此需要根据可用的资源和应用场景进行选择。

6)鲁棒性。考虑算法对异常值、噪声和缺失数据的鲁棒性。一些算法对数据质量的要求较高,而其他算法则能够更好地处理不完整或有噪声的数据。

2.2.2 训练过程关键技术

1)数据准备。将采集到的音频数据划分为训练集和测试集,确保数据集的平衡性和代表性。同时,对数据进行预处理,如标准化、归一化等。

2)特征选择。根据研究需求和算法选择准则,选择合适的音频特征进行训练。可以使用特征选择方法,如相关性分析、特征重要性排序等。

3)模型选择与训练。根据算法选择准则,选择合适的机器学习算法进行训练。常用的算法包括决策树、支持向量机、神经网络等。对选定的算法进行训练,调整模型的超参数以提高性能。

4)模型评估。使用测试集评估训练好的模型性能。常见的评估指标包括准确率、召回率、精确度等,计算公式如下[10]。

准确率(AC)是指模型正确预测为正类的样本数占预测为正类的样本总数的比例,是衡量模型对于正类预测准确率的指标。例如,如果一个分类模型对100个样本进行分类,其中有80个样本分类正确,那么准确率就是80%(0.8)。计算公式如式(1)所示

(1)

(2)

精确率(Pre)是指模型在所有预测为正类的样本中,真正为正类的样本占比。精确率适用于样本类别平衡的情况,因为它关注模型对于正类的识别准确率,能够较好地反映模型的分类性能。是衡量模型对于正类识别准确率的指标。例如,如果一个分类模型将100个样本中的90个预测为正例,其中有85个样本被正确分类为正例,而有5个样本被错误地分类为正例,那么精确率就是85%(0.85)。公式如式(3)所示

(3)

5)模型验证与调优。进行交叉验证和验证集验证,确保模型的泛化能力。根据验证结果进行模型调优,如调整特征、调整模型结构、增加训练数据等。

3 技术应用

3.1 深度学习的应用

深度学习算法在音频处理和模式识别方面的应用已经取得了显著成果,并且在汽车发动机状况识别中有着巨大的潜力。深度学习模型如卷积神经网络(CNN)和循环神经网络(RNN)可以更好地学习音频特征的时序信息和复杂关系,从而提高发动机状况识别的性能。

深度学习模型通过多层神经网络结构,深度学习模型可以自动地从原始音频数据中提取高级的抽象特征。例如,CNN可以通过卷积和池化操作捕捉音频信号的局部模式和频域信息,而RNN则能够建模音频数据的时序依赖关系,使得模型能够更好地理解和识别发动机声音的特征。此外,深度学习模型还具有良好的泛化能力[11],能够适应不同车型、发动机类型和工况的音频数据。通过大规模的训练数据和适当的正则化方法,深度学习模型可以有效地避免过拟合问题,并提高对新数据的识别准确性。

3.2 多模态融合

随着传感器技术的发展和数据采集能力的提升,多模态数据融合将在汽车发动机状况识别领域发挥越来越重要的作用,为故障预测和预防提供更可靠的手段。通过结合其他传感器数据,如振动、温度等,可以获得更全面的发动机状态信息,提高故障检测的准确性,有助于及早发现潜在故障,采取相应的维修和维护措施,提高汽车的可靠性和安全性。

3.3 实时性和嵌入式应用

实时性是汽车发动机状况识别技术的关键需求之一。及时监测和识别发动机的健康状况对于保证行车安全和降低故障风险至关重要。实时性要求识别算法能够在短时间内对音频数据进行处理和分析,以快速准确地判断发动机状态,具备高效的计算能力和快速的响应时间。另一个发展方向是将发动机状况识别技术应用于嵌入式设备上,将发动机状况识别技术集成到嵌入式系统中,可以实现在车辆内部对发动机状态进行实时监测和诊断,不依赖外部的网络连接或云服务。这样的嵌入式应用能够提高系统的稳定性、可靠性和安全性,同时减少对外部环境的依赖。

3.4 自适应学习和增量学习

随着发动机工作状态可能随时间、环境和使用情况的变化而变化,自适应学习和增量学习方法在基于音频特征的汽车发动机状况识别技术中将变得更为重要。自适应学习是指算法具备自我调整和优化的能力,能够根据实时数据的变化来更新模型和参数,以适应不同工况和环境。在发动机状况识别中,可以根据发动机在不同工作状态下产生的音频特征变化,动态调整模型的权重和阈值,从而提高识别的准确性和稳定性。

增量学习是指算法能够在新数据到来时,利用已有模型进行快速更新和调整,以适应新的情况。在发动机状况识别中,增量学习方法可以利用已有的训练模型,通过引入新的训练样本进行参数的调整和优化,以适应新的工况和变化,可以避免重新训练整个模型,节省计算资源和时间成本。

4 发展趋势

4.1 多模态数据融合

将音频特征与其他传感器数据(如振动传感器、温度传感器等)相结合,将会产生协同效应,弥补单一传感器数据可能存在的局限性。例如,振动传感器可以捕捉到发动机机械振动产生的信号,而温度传感器可以反映发动机的热特性,这些信息的结合有助于更准确地判断发动机的工作状态。其次,通过多模态数据融合,可以提高故障的检测率和诊断的精确性,减少误报和漏报的情况,从而增强了整体的发动机健康监测能力。

4.2 深度学习应用扩展

未来,随着深度学习的应用扩展,更多先进的深度学习模型将在发动机故障诊断中发挥重要作用,从而进一步提升诊断的精确性、效率和可靠性。深度学习模型能够自动从原始音频数据中学习到更具有表征性的特征,无需人为干预,同时,深度学习模型的层次化特征学习能力使其能够理解更高层次的语义信息,有助于区分不同发动机故障模式之间微小的差异,提高诊断的精确度。