基于TDOA 算法的分布式阵列麦克风定位研究

2020-10-27艾炎

中国电气工程学报 2020年5期

艾炎

语音是人类进行交流沟通最主要的方式之一，他能方便快捷的承载这巨大的信息。随着社会的迅速发展，进入了高度信息化，语音也室作为重要的信息载体之一，语音数据处理的整个过程可以分为两个部分：A/D转换，即把原始声音的模拟输入转化为数字化信息;D/A转换，即把数字信息转化为模拟数据。他的传送、存储、识别、合成和增强室现代信息数字化中非常重要、基础的组成部分之一。而现在人工智能技术的发展，尤其是自然语言处理技术的高速发展，语音处理已经成为现在智能家居、交通、办公、通信等新兴领域中的核心技术之一。尤其像现在线上教育、云会议等方式的流行，语音信号处理是一个非常具有价值及必要的研究技术。

麦克风阵列（Microphone Array），从字面上，指的是麦克风的排列。也就是说由一定数目的声学传感器（一般是麦克风）组成，用来对声场的空间特性进行采样并处理的系统。麦克风按照指定要求排列后，加上相應的算法（排列+算法）就可以解决很多房间声学问题，比如声源定位、去混响、语音增强、盲源分离等。语音增强是指当语音信号被各种各样的噪声（包括语音）干扰甚至淹没后，从含噪声的语音信号中提取出纯净语音的过程。声源定位技术是指使用麦克风阵列来计算目标说话人的角度和距离，从而实现对目标说话人的跟踪以及后续的语音定向拾取，是人机交互、音视频会议等领域非常重要的前处理技术。去混响技术能很好的对房间的混响情况进行自适应的估计，从而很好的进行纯净信号的还原，显著的提升了语音听感和识别效果。声源信号的提取就是从多个声音信号中提取出目标信号，声源信号分离技术则是将需要将多个混合声音全部提取出来。

近场模型和远场模型

根据声源和麦克风阵列距离的远近，可将声场模型分为两种：近场模型和远场模型。近场模型将声波看成球面波，它考虑麦克风阵元接收信号间的幅度差;远场模型则将声波看成平面波，它忽略各阵元接收信号间的幅度差，近似认为各接收信号之间是简单的时延关系。显然远场模型是对实际模型的简化，极大地简化了处理难度。一般语音增强方法就是基于远场模型。

近场模型和远场模型的划分没有绝对的标准，一般认为声源离麦克风阵列中心参考点的距离远大于信号波长时为远场;反之，则为近场。设均匀线性阵列相邻阵元之间的距离（又称阵列孔径）为d，声源最高频率语音的波长（即声源的最小波长）为λmin，如果声源到阵列中心的距离大于2d2/λmin，为远场模型，否则为近场模型，示意图如下图1所示。

麦克风阵列的拓扑结构

麦克风阵列的拓扑结构可以分为线性拓扑、平面拓扑，还有三维拓扑，如下图2麦克风的三种拓扑结构，其中线性阵列的结构简单、容易分析、算法复杂度相对较低，但是他的估计有效性估计是一维的，只能定位信号源的方向角度。平面阵列中常见的是均匀圆阵，如下图3京东公司推出的叮咚mini的就是4颗麦克风均匀按圆形排列。

图3京东叮咚mini的麦克风均匀圆阵

定位原理

TDOA定位是一种利用时间差进行定位的方法。通过测量信号到达监测站的时间，可以确定信号源的距离。利用信号源到各个监测站的距离（以监测站为中心，距离为半径作圆），就能确定信号的位置。但是绝对时间一般比较难测量，通过比较信号到达各个监测站的绝对时间差，就能作出以监测站为焦点，距离差为长轴的双曲线，双曲线的交点就是信号的位置。

假设测得声源到第n个麦克风接收到声源所发出的声音信号的时刻分别为ti（i=1，2，3，4...n），且假设标签到第n个基站的距离为ri（i=1，2，3，4...n）如下图4声源到麦克风的传输示意图。

在基站之间完全同步的情况下，得出定位标签相对于四组定位基站（假设1#、2#为第一组，2#、3#为第二组，3#、4#为第三组，4#、1#为第四组）的距离差di12～di14为：

假设空间布有N个基站，同时利用多个TDOA 测量值可以构成关于标签位置的双曲线方程组，求解此方程组即可得到标签坐标。

TDOA估值进行声源定位，三颗麦克风阵列可以确定空间声源位置，增加麦克风会增高数据精度。定位的方法有MLE最大似然估计，最小方差，球形差值和线性相交等，TDOA相对来讲应用广泛，定位精度高，且计算量最小，实时性好，可用于实时跟踪，在目前大部分的智能定位产品中均采用TDOA技术作为定位技术。

广州大学华软软件学院省级“创新强校工程”科研项目《基于人工智能的自然语言交互设备研究》（2017KQNCX274）

参考文献：

[1]张芳.基于STM32的麦克风阵列声源定位系统研究[D].河北：燕山大学，2014.

[2]邓承韵.基于麦克风阵列的语音分离算法研究[D].北京：北京邮电大学，2019.

[3]高健; 陆阳; 李庆巧; 卫星.采用三次通信的TOF与TDOA联合定位算法[D].安徽：电子测量与仪器学报，2020.

[4]郝张红; 段羽浩; 韩彬彬.基于TDOA的声源定位算法研究及实现[D].安徽：信息系统工程，2020.

[5]高健;陆阳;李庆巧;卫星.基于UWB技术的无人机室内飞行测试平台设计[D].湖南：传感器与微系统，2019.