APP下载

基于卡尔曼滤波的乐音基频小波自相关检测法

2022-04-20张皓斐张皓博

电子设计工程 2022年7期
关键词:乐音基频小波

张皓斐,张皓博

(1.青岛理工大学信息与控制工程学院,山东青岛 266525;2.齐鲁工业大学 电气工程与自动化学院,山东济南 250353)

随着音频处理和语音识别技术的发展,乐音识别技术在音乐领域展现出了重要的实用价值。

从频域角度讲,单一的乐音音符是典型的平稳定常复合信号,它是由基频和泛频共同构成的,而乐音识别的核心任务就是识别乐音的基频,以此来确定乐音的音高[1]。基频检测的方法主要有离散小波变换(Discrete Wavelet Transform,DWT)结合快速傅里叶变换(Fast Fourier Transform,FFT)[2]、倒谱分析法[3]、自相关函数[4]以及线性预测系数(Linear Prediction Coefficient,LPC)等,这些方法均可在低噪背景下较为精确地识别信号基频。但由于乐音音域宽广的特点以及加性环境噪声的干扰,以上所提方法的鲁棒性并不理想。为此,设计了一套采用卡尔曼滤波器(Kalman filter)结合小波阈值法去噪,进而通过自相关函数提取基频的算法,并将其与DWT 结合FFT 的基频检测算法进行了深入比较。此外,使用了语音质量感知评估(Perceptual Evaluation of Speech Quality,PESQ)以验证全频域段内音频质量的增强效果以及乐音基频检测算法的可行性。

1 乐音特性简介

十二平均律是规范两音符相对音高的定律方法,将一个纯八度音程即倍频程平均分为十二等份的半音音阶[5],故两相邻乐音音阶的频率之比为:

现代调音标准规定a1的频率为440 Hz,则c1(中央C)的频率约为261.626 Hz。在低、中、高3 个音区各自抽取一个音组,并以其为例,通过十二平均律可推得这3 个音组共36 个音符所对应基频如表1所示。

表1 各音组的音符和基频对应表

2 基频检测原理

2.1 滤波模型建立

自适应卡尔曼滤波是在受环境噪声干扰下的最优化最小均方误差递推估计算法[6],因此对含噪信号的处理是卡尔曼滤波非常适用的对象。

考虑纯净音频信号:

将该式假设为一全极点线性系统的输出信号,则p阶的AR 模型形式为:

其中,ai(k),i=1,…,p为AR 模型的系数,w(k)是方差为的系统过程白噪声向量,p为阶次。

考虑受外部白噪声干扰的含噪音频信号:

其中,v(k)是方差为的观测过程白噪声向量。

将上述模型表示为状态空间的表达形式:

在被公式表述的状态空间表达形式里,X(k)和y(k)分别是状态和观测向量,A为在该时刻系统的状态转移矩阵,H为在该系统的观测矩阵,G为H的转置矩阵。

当被观测系统的参数确定时,可推得该系统的最优状态估计五大基本公式:

2.2 滤波参数估计

在卡尔曼滤波算法执行之前需要初始化其参数,主要有系统模型的系数、系统白噪声方差Q、观测白噪声方差R和误差协方差矩阵P。

因为该系统状态方程中的系数A(k)是一个动态参数,因此需要对和Q进行迭代计算,故可暂时初始化为含噪音频的及Q。具体计算流程为:对每一帧含噪音频信号,首先使用LPC 算法直接计算以及Q,然后在卡尔曼滤波模块中代入该参数以对含噪音频进行处理,如此反复迭代多次以更新和Q,直到音频模型中的残差项位于较为合适的阈值范围内为止。

在初始化R时,可以假定信号开端只含有噪声信号,而无有效的乐音时段,从而可对音频信号开端的噪声信号求方差得到R,作为噪声的统计先验知识,而P在取初值时可以与R等同。

2.3 多分辨小波分析与阈值法去噪

在小波分析中,小波变换易于在时间和频率层次上进行信号的多分辨定位分析[7]。多分辨分析是将f(t)∈L2(R)在不同频带中逐级分解的过程。

设Wj和Vj分别为多分辨分解中的小波空间和尺度空间,则Wj为Vj在Vj-1中的正交补空间:

则通过正交小波函数可将任意f(t)∈V0分解为小波细节W1和小波逼近V1,再对V1进一步分解,从而实现对f(t)的多分辨分解,即:

将f(t)∈L2(R)按照空间组合展开,可得:

其中,ψ(t)称为小波函数,φ(t)称为尺度函数,称为尺度为j的小波系数,称为尺度为j的尺度系数。

在工程实际中通常使用Mallat 算法来进行小波分析,图1 所示为小波三层Mallat 分解结构。其设计思路可简要概述为信号受一系列分解带通滤波器组滤波并得到若干带通分量的过程[8]。

图1 小波三层Mallat分解结构图

在一般情况下,对信号的小波阈值量化处理有如下几个基本步骤[9-11]:

1)选定一个正交小波基,并对含噪信号f(t)进行N层小波分解;

2)对含噪信号各层的高频系数通过阈值函数量化处理,第N层低频系数不作处理;

3)重构各层小波系数以获得去噪信号。

音频去噪工作成功与否主要在于小波基和分解层数的选择、阈值函数的选择及阈值的确定。

1)小波基和分解层数的选择

紧支集正交小波系Symlet 具有良好的正则性和对称性,能够减少对信号造成的相位失真现象,故经综合考虑,将sym6 小波基进行4 层分解,以降低分解层数N和小波基及其阶数对运算速度的影响。

2)阈值函数的选择

由于经卡尔曼滤波后的音频信号噪声含量较少,软阈值处理后的损害程度相对较小,故经综合考虑,选择软阈值函数进行去噪处理。

3)阈值的确定

图2 为4 种常用阈值估计方法的实际去噪效果,为确保重构信号具有较高的逼近性,选用无偏似然估计阈值法。

图2 4种阈值估计的去噪效果

2.4 自相关函数检测基音频率

自相关函数法是一种具有良好抗干扰能力的时域估计算法,其运算量较少,常用于基频检测[12]。

将去噪后的乐音信号记为s(n),对每一帧信号利用短时自相关函数的公式[13-14]进行运算:

其中,N为每帧信号的长度,k为时延,i表示第i帧,n为第i帧内的样点。

自相关函数在基音周期整数倍处取得峰值,对其第一极大值点进行搜寻并将其作为基音频率点就可以提取信号的基音频率[12,15]。

在对信号加窗分帧处理时通常采用矩形窗,且窗长至少要大于两个基音周期,依照十二平均律,最低音阶对应频率为27.5 Hz,即36.4 ms,所以合适的窗长为80 ms,帧移比例为1。图3 为经滤波去噪前后信号的自相关函数图像,可知去噪后显著提高曲线的平滑性,能够更加精确地检测其基音频率。

图3 滤波去噪处理前后信号的自相关函数

3 算法实现流程

综上所述,乐音基频检测算法可用流程图如图4表示。

图4 算法流程图

基频检测流程可用如下几个步骤表述:

1)加窗分帧乐音信号,并初始化滤波参数;

2)对每一帧信号运用LPC 迭代更新滤波参数法进行自适应卡尔曼滤波,滤除大部分噪声;

3)选用sym6 小波基进行4 层正交小波分解;

4)根据第一层小波系数进行噪声标准差估计,各层的高频系数均采用软阈值函数和无偏似然估计法调整阈值以进行阈值量化处理;

5)利用小波重构算法重构信号,对各帧信号进行自相关运算,通过检测峰值的方法提取基音频率。

4 实验结果分析

实验所用纯净乐音样本为16 kHz 采样率的虚拟三角钢琴软音源。以中央C 音阶为例,在纯净信号中加入白噪声,设置信噪比为-5 dB,纯净信号与低信噪比含噪信号的波形如图5 所示。

图5 纯净信号与含噪信号的波形

4.1 音频增强效果对比

分别用重构DWT 低通分量的方式和卡尔曼滤波结合小波变换阈值去噪方式对含噪乐音信号去噪处理,结果如图6 所示。

图6 两种方式对信号去噪的效果

通过图6 可以观察到,重构DWT 低通分量的方式在低信噪比下无法有效消除噪声影响,而文中方法则克服了该缺点,首先通过卡尔曼滤波能够滤除全频段大部分噪声,然后对小波变换的各层高频分量作阈值处理,而非简单地置零,在进一步去除残留噪声的同时保留了高频段的信号特征以减少失真。

为更加客观地对处理后的音频信号进行质量评估,选用PESQ 法并在-5 dB 信噪比下进行评估,结果如表2 所示。其评估原始得分在-0.5 到4.5 之间[16],音频质量越高则分数越高。

表2 低信噪比下PESQ评估对比

4.2 基频检测效果对比

在对含噪乐音去噪处理后,分别用FFT 算法和自相关函数法对各自的去噪信号有效乐音段进行基频检测对比实验,检测结果如图7 所示。

图7 两种方式对基频检测的效果

由图7 可知,卡尔曼滤波结合小波阈值去噪法有着较强的抗干扰能力,对噪声的消除较为彻底,利用自相关函数对基频检测的轨迹更为稳定和平滑。

4.3 鲁棒性分析

为验证文中方法对基频检测的鲁棒性,在低、中、高3 个音区中各自抽取一个音组,并在-5 dB 信噪比环境下计算出经该方法与DWT 结合FFT 算法分别处理得到的有效基频识别数据的平均识别误差率,结果如表3 所示。据表可知,该方法在全频域段内的平均识别误差率相比下降了0.89%,而由式(1)可得相邻音阶频率的偏差率约为5.946%,在各音区内均高于文中方法的平均识别误差率,从而佐证了该方法在全频域段内的较高鲁棒性。

表3 各音组的平均识别误差率

5 结束语

为在较低信噪比环境下实现音频信号的增强和乐音基频的准确检测,提出了一种利用自适应卡尔曼滤波结合小波阈值降噪的自相关检测方法。实验分析表明,与DWT 结合FFT 的基频检测算法相比,文中方法不仅能够很好地抑制乐音中混杂的白噪声,有效增强音频信号的质量,又能在全频域段内准确检测乐音的基音频率,具有较高的鲁棒性。

猜你喜欢

乐音基频小波
语音同一认定中音段长度对基频分析的影响
基于多小波变换和奇异值分解的声发射信号降噪方法
基于时域的基频感知语音分离方法∗
如何区分乐音和噪声
构造Daubechies小波的一些注记
桥面铺装层对中小跨径桥梁基频影响分析
那一刻
作文成功之路·作文交响乐——学生展现心灵乐音的舞台
基于MATLAB的小波降噪研究
45000kHz基频晶体滤波器