基于模糊神经网络的播音信号识别技术研究

2020-08-04何艳萍

现代电子技术 2020年3期

何艳萍

摘要：播音信号识别对于提高播音质量具有十分重要的意义，当前播音信号识别方法存在误识率高，播音信号识别效率低等不足，为了获得更优的播音信号识别结果，设计基于模糊神经网络的播音信号识别技术。首先分析当前播音信号识别技术的研究进展，指出各种播音信号识别技术存在的不足;然后采用空间变换和奇异值分解算法提取播音信号识别特征，并采用模糊神经网络建立播音信号识别分类器;最后在Matlab 2017平台上进行播音信号识别仿真实验，结果表明，模糊神经网络获得了理想的播音信号识别，播音信号识别正确率要高于当前其他播音信号识别技术，减少了播音信号的误识率，缩短了播音信号识别的时间，提升了播音信号识别速度，具有较高的实际应用价值。

关键词：播音信号; 信号识别; 模糊神经网络; 奇异值分解算法; 识别特征; 识别速度

中图分类号： TN911.73?34; TP391 文献标识码： A 文章编号： 1004?373X（2020）03?0054?04

Research on broadcast signal recognition technology based on fuzzy neural network

HE Yanping

（School of Literature and Journalism， Baoji University of Arts and Sciences， Baoji 721013， China）

Abstract： Broadcasting signal recognition is of great significance to improve the quality of broadcasting. At present， there are some shortcomings in the methods of broadcasting signal recognition， such as high misrecognition rate and low recognition efficiency. In order to obtain better results of broadcasting signal recognition， a broadcasting signal recognition technology based on fuzzy neural network is designed. Firstly， the research progress of the current broadcasting signal recognition technologies is analyzed， and the shortcomings of various broadcasting signal recognition technologies are pointed out. Then， the spatial transformation and singular value decomposition algorithm are used to extract the recognition features of broadcasting signals， and the fuzzy neural network is used to establish the recognition classifier of broadcasting signals. Finally， the simulation experiment of the broadcasting signals is performed on the platform of Matlab 2017. The simulation results show that the broadcast signal recognition technology based on fuzzy neural network achieves ideal recognition of broadcasting signals， and its correct recognition rate of broadcasting signals is higher than that of other current recognition technologies. It reduces the error recognition rate of broadcasting signals， shortens the recognition time of broadcasting signals， and improves the recognition speed of broadcasting signals， which proves that it has a high practical application value.

Keywords： broadcast signal; signal recognition; fuzzy neural network; singular value decomposition algorithm; recognition feature; recognition speed

0 引言

隨着我国经济的不断发展，人们收听播音节目的手段和方式越来越多，如手机、电视、电脑等，它们对播音信号的质量要求越来越高，因此播音信号识别技术的研究引起了人们的高度重视和关注[1?3]。

多年來，许多学者对播音信号识别问题进行了深入的研究，提出了许多播音信号识别技术[4?7]。传统方法主要包括：改进子空间匹配追踪导波的信号识别技术、基于同源性检验的信号识别技术、基于对信号功率谱拟合的信号识别方法等[8?10]，它们有自己的应用领域，但是它们具有比较明显的缺陷，如通用性差、不易实现，误识率比较高。近几年来，有学者提出了基于BP神经网络的信号识别方法、基于支持向量机的信号识别方法，其信号识别结果要优于传统方法，但是在实际应用中，BP神经网络收敛速度慢、识别时间长、支持向量机的信号识别效率低[11?13]。

为了获得更优的播音信号识别结果，设计了基于模糊神经网络的播音信号识别技术，并通过具体语音信号识别仿真实验验证了其有效性和优越性。

1 模糊神经网络的播音信号识别技术

1.1 播音信号的预处理

由于原始播音信号变化十分复杂，为此首先对其进行预处理，便于后面播音信号特征提取，本文采用空间变换技术中的[S]变换算法。对于连续播音信号[h（t）]，连续[S]变换定义为：

式中：[f]为频率;[τ]为窗函数中心点。

[w（t，f）]表示[S]变换算法的高斯窗函数，对于变换窗函数需要满足归一化条件：

逆变换为：

由于播音信号识别都在电脑中完成，因此需要将连续的播音信号进行离散化处理，得到离散化的播音信号为[H（kT）， k=0，1，2，…，N]，离散[S]变换为：

离散化的播音信号[H（kT）]经过[S]变换后，得到了其幅值和相位信息，它们组成一个矩阵，分别采用行向量和列向量表示。离散[S]变换算法的逆变换为：

采用[S]变换算法对原始播音信号进行处理后，可以消除其中的噪声，将非平稳信号变为平稳信号，改善播音信号质量。

1.2 提取播音信号的特征

采用奇异值分解算法提取播音信号的特征。[A]表示一个实矩阵，可以分解为两个正交矩阵[Um×m]和[Vn×n]，则有：

奇异熵可以对播音信号的信息量、信息组成进行描述，在此本文采用奇异熵播音信号的特征，奇异熵计算公式为：

式中：[λmax]和[λsum]分别为奇异值的最大值与和。

1.3 模糊算法

设共有[c]类播音信号，有[m]个识别特征，[m]个识别特征和对应的[c]类播音信号构成如下矩阵[14]：

式中[yij]为第[i]个识别特征的第[j]类识别值。

设有[n]个待识别的播音信号样本，那么待识别矩阵为[X]：

由于播音信号识别结果具有一定的模糊性，采用隶属度描述播音信号的模糊程度，第[i]个特征的第1类播音信号的相对隶属度为[Pi1=0]，[c]播音信号的相对隶属度[Pic=1]，那么处于[1～c]间的第[i]项特征的第[j]类的相对录属度[Pij]计算公式为：

对于各个待识别播音信号，其特征的相对隶属度确定方式为：如果[rikyic]，那么[rik=]1;处于[yi1]～[yic]时，[rij]计算公式为：

那么，可以建立标准特征和待识别样本相对隶属度矩阵[p]和[R]，具体如下：

1.4 神经网络

本文选择BP神经网络建立播音信号识别的分类器。神经网络第[q]层的神经元个数为[nq]，第[q]层、第[i]个神经元的权重系数为[wqij]，则输入输出变换关系为[15]：

1.5 模糊神经网络的播音信号识别原理

基于模糊神经网络的播音信号识别原理为：首先采用空间变换对原始播音信号进行处理，去除播音信号中的噪声，使播音信号更加平衡，然后通过奇异值分解算法提取播音信号的奇异熵作为识别特征，最后采用模糊神经网络建立播音信号识别分类器，具体如图1所示。

2 播音信号识别性能测试

2.1 测试平台

为了分析模糊神经网络的播音信号识别效果，采用Matlab 2017作为测试仿真平台，采用5种类型的播音信号作为测试对象，每一种播音信号的样本数量如表1所示。为了分析模糊神经网络的播音信号识别优越性，在相同测试平台下，采用传统BP神经网络的播音信号识别技术、支持向量机的播音信号识别技术进行对比实验，采用播音信号识别正确率、播音信号的误识率、播音信号识别时间作为评价指标，分析它们的优劣。

2.2 播音信号识别结果分析

统计3种播音信号识别技术的识别正确率和误识率，分别如图2和图3所示。从图2和图3可以看出：

1） BP神经网络的识别正确率和误识率平均值分别为83.92%和16.08%，而且播音信号识别结果不稳定，个别类型的播音信号识别正确率极低，这主要是因为BP神经网络存在过拟合的缺陷，无法获得理想的播音信号识别结果。

2）支持向量机神经网络的识别正确率和误识率平均值分别为90.81%和9.19%，播音信号识别结果要优于BP神经网络，这主要是因为支持向量机克服了BP神经网络的过拟合缺陷，获得了更优的播音信号识别结果。

3）模糊神经网络的识别正确率和误识率平均值分别为95.06%和4.94%，播音信号识别结果明显好于BP神经网络和支持向量机，克服了当前播音信号识别技术存在的局限性，降低了误识率，获得了理想的播音信号识别结果。

2.3 播音信号识别效率分析

统计3种播音信号识别技术的识别时间，结果如图4所示。

从图4可以看出，模糊神经网络的播音信号识别时间要明显少于BP神经网络和支持向量机，加快了播音信号的识别速度。

3 结语

信号识别是播音领域一个重要的研究方向，为了提高播音信号识别正确率，设计了基于模糊神经网络的播音信号识别技术。在Matlab 2017平台上与其他方法进行了播音信号识别对比实验，结果表明，模糊神经网络的播音信号识别正确率要高于对比技术，提升了播音信号识别效率，实际应用价值更高。

参考文献

[1] 翁佳.智能语音技术对播音主持专业与行业影响探究[J].电视研究，2017（12）：57?59.

[2] 陈竹，林妤.基于艺术符号论的播音情感新探[J].现代传播（中国传媒大学学报），2018，40（2）：164?165.

[3] 战迪.传媒艺术视野中播音主持多质性主调的重建[J].现代传播（中国传媒大学学报），2017，39（2）：103?105.

[4] 黄莹，郝新红，孔志杰，等.基于熵特征的调频引信目标与干扰信号识别[J].兵工学报，2017，38（2）：254?260.

[5] 帅师，王翦，吴红艳，等.一种分布式光纤传感系统的信号识别方法[J].复旦学报（自然科学版），2018，57（5）：611?618.

[6] 刘莹，单洪，胡以华，等.基于双谱二次特征的通信信号识别算法研究[J].计算机应用研究，2017，34（6）：1835?1837.

[7] 申传俊，王悦民，徐海成，等.改进的子空间匹配追踪导波信号识别方法[J].华中科技大学学报（自然科学版），2012，40（8）：39?43.

[8] 许春香，许海涛，林伟国.基于同源性检验的干扰信号识别方法[J].传感器与微系统，2019，38（1）：36?40.

[9] 田昊旻，尹良，马跃，等.基于对信号功率谱拟合特征提取的信号识别方法[J].北京邮电大学学报，2018，41（2）：114?118.

[10] 张海川，雷迎科.基于MUSIC算法的OFDM信号识别方法[J].计算机科学，2017，44（3）：114?117.

[11] 董庭亮，唐向宏，馬丹丹，等.基于支持向量机的小波包调制信号识别[J].计算机工程与应用，2013，49（18）：223?226.

[12] 朱兆彤，邹哲光，许肖梅，等.基于BP神经网络的海洋声学仪器信号识别方法[J].厦门大学学报（自然科学版），2012，51（4）：709?713.

[13] 邓理文，刘晓军.基于模糊神经网络的智能火灾探测方法研究[J].消防科学与技术，2019，38（4）：522?525.

[14] 李彦瑾，罗霞.基于模糊神经网络的混合交通流路阻测算模型[J].吉林大学学报（工学版），2019，49（1）：53?59.

[15] 金阳忻.基于模糊神经网络的电能表误差超差风险预测模型[J].电网技术，2019，43（6）：1962?1968.

现代电子技术

2020年3期

基于模糊神经网络的播音信号识别技术研究

杂志排行

现代电子技术的其它文章