APP下载

基于MEMS麦克风阵列的定向拾音系统设计*

2018-09-29许向阳王晓琳韩欣宇

通信技术 2018年9期
关键词:声源麦克风扬声器

张 政,许向阳,王晓琳,吴 鸣,韩欣宇

(1.河北科技大学 信息科学与工程学院,河北 石家庄 050018;2.中国科学院声学研究所 噪声与振动重点实验室,北京 100190)

0 引 言

相对于单个麦克风在噪声源识别、语音提取和分离等方面的不足,多阵元麦克风阵列不仅可以获得声信号的时域信息,还可以获得空域信息,使得能够在提取有用信号的同时抑制其他方向的噪声[1]。麦克风阵列使用多个麦克风对信号进行测量,而这种测量实际上是一种冗余,可利用这种冗余提高信号的信噪比。麦克风阵列还可以实现“电扫”,可以在不改动位置的前提下,通过对采集信号的延时来改变阵列的指向。正是基于麦克风阵列的这些优点,它广泛应用于国防军事领域、工业生产领域、生物医学领域以及消费电子领域。当前,麦克风阵列技术在声源定位、语音增强、声场的可视化以及目标追踪等领域迅速发展。因此,设计一套多通道信号采集系统显得尤为必要。

目前,对于麦克风阵列信号处理的研究仍然是热点。现有的麦克风阵列拾音系统中,大多只支持16通道以内的声信号拾取[2-4],对于更多通道的研究较少。本文采用FPGA+DSP的设计方案,实现了对36路MEMS麦克风阵列声信号的定向拾取和处理。实验证明,该系统稳定可靠,采集数据量大,同步性好,拥有较高的信噪比,适合作为多通道麦克风阵列的信号采集系统。

1 麦克风阵列技术

1.1 麦克风阵列模型

人们在使用麦克风阵列对语音信号进行处理的发展历程中,产生了许多阵列结构,包括结构相对简单的直线阵、平面阵以及复杂的三维球阵列[5-7]。图1给出了N个麦克风等间距直线阵列的模型,θ为声源的方位角。图2为本系统采用的等间距36阵元的平面阵模型,阵元间距为4 cm。假设远场平面波方向为(θ,φ),其中φ为水平方位角,θ是垂直俯仰角,选择坐标原点为参考点。

图1 等间距线阵模型

图2 等间距36阵元模型

1.2 定向拾音问题模型

声音是由声源振动产生。声音传递过程导致声压的周期性变化,麦克风就是通过传感器感知声压并将其转换为电信号进行声音拾取的。麦克风接收信号模型如图3所示。假设位于r0处的声源信号为s(t),则位于rn处的麦克风接收到的频域信号模型为:

其中:

称为稳态格林函数,是位于r0处的稳态点声源激发的声场,表示声源与麦克风之间距离引起的延时和衰减。U(ω,r0)表示麦克风的指向性,由于MEMS麦克风是全向麦克风,其频率响应通常在20~20 000 Hz范围内是平坦的,因此U(ω,r0)通常为常数。A(ω)为放大器和ADC的频率响应。高性能放大器在通带内的频率响应应该是平坦的。此外,ADC通常采用噪声整形技术,使得通带内的噪声很小。因此,在大多数情况下,可以假设A(ω)≡1。N(ω)为噪声,通常包括相关噪声和非相关噪声两个部分。

2 硬件系统设计

该拾音系统前端使用36通道麦克风阵列拾取声信号,将声信号存储到FPGA内部的RAM中,使用DSP读取RAM内部数据并进行处理,最后由FPGA进行数据输出,如图4所示。

2.1 MEMS麦克风简介

MEMS麦克风的发展已有30多年的历史[8]。与其他麦克风相比,MEMS麦克风具有明显优点:(1)工艺一致性好,同一批次的MEMS麦克风生产在同一块硅片中,敏感度和频率响应一致性好;(2)简单易用,MEMS麦克风通常是毫米数量级,内部集成了前置放大电路和ADC,因此在实际应用中不必考虑放大电路和ADC芯片的布局布线问题;(3)具有很强的抗干扰能力,不易受射频干扰和电磁干扰;(4)价格低。

图3 麦克风接收信号模型

图4 系统设计

本设计采用Knowles型号为SPM0423HD4HWB的MEMS麦克风,主要由前端声学传感器、低噪声输入缓冲器以及Sigma-Delta调制器组成。输出信号为PDM(脉冲密度调制)信号,具有很强的抗干扰能力和优秀的宽带信号性能。该麦克风的工作电压为3.3 V,工作电流500 μA,内部电路框图如图5所示。其中,MEMS麦克风外围电路设计如图6所示。

图5 MEMS麦克风内部

图6 麦克风工作电路

2.2 电源设计

电源设计主要是给FPGA采集板和MEMS麦克风提供电源,其中FPGA需要5 V供电,而MEMS麦克风需要3.3 V电源。这里采用5 V电源给FPGA供电,使用AMS1117芯片将5 V电压转换为3.3 V电压给麦克风阵列供电。此外,利用四个整流二极管组成电桥保护电路,电路设计如图7所示。

2.3 MEMS麦克风与FPGA接口设计

麦克风与FPGA的接口设计主要是将麦克风的时钟引脚(CLK)和数据(DATA)输出引脚与FPGA的IO口相连。其中,CLK是由FPGA提供的,需要输出给MEMS麦克风;DATA是MEMS麦克风采集到的数据,需要传递给FPGA。

图7 系统电源设计原理

2.4 脉冲密度调制与解调

MEMS麦克风的输出信号多采用脉冲密度调制(PDM)的方式[9]。与PCM不同,PDM的幅值由多个脉冲的平均值决定。1Bit PDM由于只用“1”和“0”1Bit数据来表达音频信号,因此抗干扰能力更强。

经过PDM调制的信号只要通过低通滤波器进行解调即可。扬声器本身具有低通滤波的性质,通常可以直接通过扬声器进行输出。但是,由于PDM采用了过采样技术,因此当系统的时钟频率很高时,会使得数字系统的功耗变大。因此,需要降低系统的采样频率来减小功耗。这里,采用FPGA集成的CIC滤波器进行降采样。级联积分梳妆滤波器(Cascaded Integrator CombFilter)是一种FIR滤波器,最早由Eugene Hogenaue[10]提出,可以实现抽值与插值[11],并可以看成是一个加权系数为1的FIR滤波器。

CIC的幅频响应为:

式中:R为降采样因子,M为差分延时,N为CIC滤波器级数。

2.5 FPGA与DSP的接口设计

选择TMS320C6747型号的DSP作为核心处理器。TMS320C6747是TI公司生产的C6000系列中高性能的定点/浮点数字信号处理器,内部采用改进的哈佛结构,工作频率最高可达456 MHz。它具有丰富的外设接口,其中包括不受CPU干预的增强型直接存储访问(EDMA)控制器和能与SRAM、EPROM、FLASH、SDRAM等无缝连接的32b的外部存储器接口(EMIF)。

因此,本系统使用EMIF接口对FPGA中双口RAM的数据进行读取和传输,利用EDMA控制。DSP与FPGA之间的接口连接图,如图8所示。

图8 DSP与FPGA之间的接口连接

3 仿真与实验验证

为了验证该系统的实时性和有效性,将整套装备在全消声室进行实验。全消室为中科院声学所重点实验室,性能指标如下:净空6.5 m×4.8 m×4.7 m;自由半径1.1 m;截止频率70 Hz;A计权本底噪声小于15 dBA。

将阵列与扬声器分别放置在高为1.2 m的支架上,相距2.2 m。阵列面对扬声器垂直放置,由扬声器发出一段60 s的白噪声,入射声源的俯仰角分别为-90°、-85°、…、0°、…、85°、90°。使用常规波束形成算法对采集的数据进行处理,比较其实验波束图与仿真波束图,如图9和图10所示。

图936 元平面阵仿真波束

图1036 元平面阵实验波束

由图9与图10对比可知,实验结果与仿真基本一致,在水平方位角为0°、垂直俯仰角为0°的信号增益约等于1,且该阵列在1~7.5 kHz有较好的波束指向性。

4 结 语

本文设计了一种基于MEMS数字麦克风阵列的36通道声信号定向采集系统,采用TMS320C6747作为DSP核心处理单元,使用FPGA对声信号进行采集,并且介绍了FPGA与麦克风阵列以及FPGA与DSP的接口设计,能够实现实时高速的数据传输和处理,为后续研究多通道麦克风阵列算法和应用奠定了基础,具有较高的实用性。

猜你喜欢

声源麦克风扬声器
GRAS发布新12Bx系列、支持TEDS的测量麦克风电源模块
虚拟声源定位的等效源近场声全息算法
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
像乐高一样的扬声器,还能为手机无线充电!
大地震 正式发布Cinenova系列扬声器
泉州大剧院选用L-ACOUStiCS、DiGiCo
基于GCC-nearest时延估计的室内声源定位
麦克风的艺术
讯飞输入法也能离线语音输入
智能自动避障与追踪声源小车的设计