APP下载

基于贝叶斯判别法对音乐特征信号的分类研究

2022-06-11常凤徐小华胡忠旭

电脑知识与技术 2022年13期
关键词:分类音乐

常凤 徐小华 胡忠旭

摘要:在大量的乐库中,对音乐进行有效、快速的分类已是研究热点。各个音乐App按照音乐流派识别并推送用户感兴趣的音乐,可以提高用户使用体验和对平台的使用黏性。文章从音乐的流派进行研究,提取四种不同类型音乐信号的Mel频率倒谱系数(Mel Frequency Cestrum Coefficient,MFCC)(24个数值)作为特征值,利用贝叶斯分类算法对80组样本进行分类研究,判别准确率为97.5%;同时,文章分别用贝叶斯分类、BP神经网络等五种不同分类算法,对20组测试数据进行分类判别。结果表明,贝叶斯分类具有较高的音乐分类准确度。

关键词:MFCC;贝叶斯算法;音乐;特征信号;分类

中图分类号:TP18      文献标识码:A

文章编号:1009-3044(2022)13-0079-03

1 引言

音乐作为最能鼓动人心的“语言”,在人们的生活中无处不在。伴随计算机和网络技术的不断发展,音乐已经成为用户移动互联生活里占比较高的活动之一。网络上已有大量的音乐和专辑供人们下载和欣赏,每个人对欣赏音乐的流派基本不会发生变化。因此,如何快速准确地检索出用户想要的音乐,并按照音乐流派推送给相应用户以提高用户使用体验,变得越来越重要,基于音乐特征信号的音乐流派分类研究也成为近年来的研究热点。

据音乐的不同性质,主要有流派、乐器、情感分类等[1-5]。音乐的流派分类主要有古典、爵士、乡村和摇滚音乐等。本文基于贝叶斯判别法对音乐特征信号的分类研究,是实现音乐流派分类的检测方法。本文使用MFCC特征提取技术提取古典、爵士、乡村和摇滚四种不同音乐类型音乐信号中的Mel倒谱系数作为音乐的特征信号,用来训练贝叶斯网络分类器。通过80组训练数据,研究贝叶斯判别法的准确率;通过20组测试数据研究比较贝叶斯判别法、BP神经网络、SVM神经网络、Fisher判别法、距离判别法共五种不同分类算法下的音乐流派分类准确率。根据实验结果,得出不同算法在音乐流派分类中的适用性。

2 MFCC特征参数提取

特征提取是指从音乐信号中将具有辨识性的成分提取出来,获得一组能够代表音乐特性参数的过程。特征提取是识别音乐类别过程中至关重要的一步。现有的特征提取方法有线性预测编码系数LPC[6]、线性预测倒谱系数LPCC、梅尔频率倒谱系数MFCC等[7-9]。本文采用更接近人耳听觉特性的梅尔频率倒谱系数MFCC提取音乐信号中的Mel倒谱系数作为特征值。

人的听觉系统对不同频率信号的感知度不同,是一个特殊的非线性系统。MFCC就是利用人耳听觉特性,由Stevens、Volkman和Newman在1937 年提出的[7-9]。MFCC与频域成非线性对应关系,常用于声音的各种特性分析中。MFCC的实现过程主要包括:预加重、分帧、加窗、快速傅里叶变换、Mel频率滤波、DCT离散余弦变换[7-9]。结构框图如图1所示。

1)预加重。预加重通过数字滤波器完成,是为了使信号频谱变得平坦,增加信号高频中的能量,有利于后期进行频谱分析。

2)分帧。虽然语音信号是非平稳的、随时间变化的时变信号,但在短时间范围内(20ms~40ms)信号基本保持不变,即表现出准稳态行为。因此,根据语音信号的短时平稳性,对语音信号进行分帧,按帧对信号进行分析。

3)加窗。在MFCC提取過程中,要对每一帧做傅里叶变换,因此在进行傅里叶变换之前,采用加汉明窗函数对连续信号的分段处做平滑处理,达到平滑语音信号的效果。

4)快速傅里叶变换(FFT)。假设原音乐信号为[s(n)],经过预加重处理、分帧、加窗平滑后可以得到每帧音乐的时域信号为[x(n)],FFT算法将N个样本的每个帧从时域信号转换成频域信号[X(k)] [7-9]。FTT算法可理想地用于评估其频谱。[X(k)]可以表示为:

[X(k)=n=0N-1x(n)e-j2Πnk/N] [0≤k≤N]               (1)

其中,[x(n)]为时域信号,[X(k)]为频域信号,N为采样点数。

5)Mel频率滤波。由于人耳对不同频率的敏感度不相同,所以在特征提取过程中,Mel频率倒谱系数通过模拟人耳听觉感知特性,将线性频谱映射到基于人耳听觉感知特性的Mel非线性频谱中,普通频率[f]和Mel频率[mel(f)]的公式如下:

[melf=2595*lg1+f700]                         (2)

6)对Mel频谱取对数。对数具有将乘法变为加法的效果。[|X(k)|2]为能量谱,通过第[m]个Mel频谱滤波器组[Hm(k)] 滤波,求出对数能量[E(m)]。

[Em=lnk=0N-1(Hmk×Xk2]   [0≤m≤M]      (3)

7)离散余弦变换。将对数能量[E(m)]进行DCT变换后获得Mel频率倒谱MFCC。

3 贝叶斯判别法

贝叶斯判别是用先验概率来描述已有的认知,然后通过来修正先验概率,得到后验概率,根据后验概率进行判别[10-11]。设有[k]个[p]维总体[G1,G2,…,GK],对应的概率密度函[f1x,][f2x,f3x,…fkx]。假设样本[x]来自总体[Gi]的先验概率[pi][i=1,2,3,…k],则有[p1+p2+…+pk=1]。根据贝叶斯理论,[x]的后验概率为:

[pGix=pifi(x)i=1kpjfjk]   [i=1,2,…,k]          (4)

在不考虑误判条件下,[x∈Gi],则[p(Gix)=max1≤j≤kp(Gix)] ;若考虑误判条件下,则该样本的平均误差比其他总体的平均误差小,则在[Gi]类。

4 贝叶斯判别法实现分类

文章对音乐特征信号分类是在Matlab环境下实现的。在其环境下主要有[fit]和[predict]函数[12-14]。[fit]格式是[y=NaviveBayes.fit(training,class)]。[training]是输入参数,[N×D]训练样本观测值,行对应的是一个观测值,列对应的是变量;[class]是分组变量,它是所对应的所属类别。[z=predicty,test],主要功能是根据[y]中对[test]的样本进行分类,返回所属类别。

根文章按照流派进行分类,选取了四种不同音乐作为研究对象,对这四类音乐进行有效分类。设计流程如图2。

对音乐预处理,采用Mel倒谱系数进行特征值提取,提取共100组的特征信号,每种共25组,每组24维。前80组数据作为训练数据,后20组作为测试数据。特征值数据如表1。

经过数据预处理和创建贝叶斯等步骤后,实现训练数据判断结果如表2。

从表中可以看出,类别I和类别IV中20个样本均得到正确判断准确;类别II中有18个样本得到了正确判断,还有两个被判断到了类别III,错误的编号是45和53;类别III中有20个也得到了准确判断。通过实验,判别准确率达到了97.5%,说明贝叶斯判断是可以接受的。

利用所建的贝叶斯分类器对20组测试数据(每种样本4个)进行判别,得到图3的判断结果。

从图3看出,第一类的第五个样本是被判到了第二类,其他类别均判断准确。与其他不同的分类算法对比结果如表3。由此可见,贝叶斯判别法的准确率較高,误差在接受的范围之内。

5 总结与展望

本文基于Matlab实现贝叶斯的分类研究,采用MFCC特征提取技术提取四种不同音乐类型的24维特征信号作为特征值,利用贝叶斯分类算法对80组样本进行分类研究,判别准确率为97.5%;通过20组测试数据,比较贝叶斯判别法、BP神经网络、SVM神经网络、Fisher判别法、距离判别法共五种不同分类算法下的音乐流派分类准确率,结果表明,贝叶斯分类有较高的分类准确度,运行的速度也有很好的呈现,该检测方法适用于按照音乐流派分类的音乐分类技术中。

参考文献:

[1] 颜景斌,伊戈尔·艾杜阿尔达维奇.基于支持向量机音乐类型分类方法[J].计算机应用与软件,2009,26(11):221-222,245.

[2] 朱健康.基于支持向量机的音乐自动分类[D].天津:天津大学,2010.

[3] 孙辉,许洁萍,刘彬彬.基于多核学习支持向量机的音乐流派分类[J].计算机应用,2015,35(6):1753-1756.

[4] 李智文.数据挖掘在音乐分类中的应用[D].长沙:中南大学,2012.

[5] 向毅,陈振宇,彭雨明,等. 人工蜂群算法优化支持向量机及其在音乐流派自动分类中的应用[J]. 数学的实践与认识,2013,43(23):44-49.

[6] 鲁晓倩.基于VP树和GMM的说话人识别研究[D].合肥:中国科学技术大学,2014.

[7] 高铭,孙仁诚.基于改进MFCC的说话人特征参数提取算法[J].青岛大学学报(自然科学版),2019,32(1):61-65.

[8] A novel approach for MFCC feature extraction[C]//2010 4th International Conference on Signal Processing and Communication Systems.IEEE,2010:1-5.

[9] 张钰莎,蒋盛益.基于MFCC特征提取和改进SVM的语音情感数据挖掘分类识别方法研究[J].计算机应用与软件,2020,37(8):160-165.

[10] 王小川,史峰,郁磊,等.Matlab神经网络43个案例分析[M].北京:北京航空航天大学出版社,2013.

[11] 孙青,刘智勇.基于朴素贝叶斯分类模型的车型识别方法[J].五邑大学学报(自然科学版),2008,22(3):22-25.

[12] 谢中华.Matlab统计分析与应用:40个案例分析[M].北京:北京航空航天大学出版社,2010.

[13] 刘劲隆.基于朴素贝叶斯分类方法的校园网络入侵行为检测[J].信息与电脑,2016(19):173-174.

[14] 王勇,李净.基于改进的朴素贝叶斯分类的手机垃圾短信识别研究[J].江西科学,2008,26(5):724-726.

【通联编辑:谢媛媛】

猜你喜欢

分类音乐
分类算一算
垃圾分类的困惑你有吗
分类讨论求坐标
音乐从哪里来?
数据分析中的分类讨论
音乐
秋夜的音乐