APP下载

双扬声器近场声源重放实验研究*

2020-06-08吴彦琴桑晋秋郑成诗李晓东

应用声学 2020年2期
关键词:方位角声源扬声器

魏 彤 吴彦琴 桑晋秋 郑成诗 李晓东

(1 中国科学院声学研究所 北京 100190)

(2 中国科学院大学 北京 100049)

0 引言

多通道扬声器声重放技术通过适当设计扬声器布置和信号馈给而在一定的区域内产生期望的听觉感知,以满足听音者临场感听音需求。该技术主要包括基于人耳感知特性的虚拟声场重建和基于声场合成特性的物理声场重建,目前已广泛应用于电影院、音乐厅和会议室等诸多场合,其中有代表性的矩阵环绕声技术包括5.1、7.1、9.1、22.2 通路系统等。分析表明,目前多通道扬声器声重放技术主要侧重于声音的方向感、包围感、音色等,对于声音的距离感仍缺乏研究。

现有少量研究通过数量庞大的扬声器实现对近场声源的物理声场重建。Spors 等[1]采用频谱相除法(Spectral division method,SDM)利用直线形扬声器阵列重放近场声源,但是该方法无法合成全方位角的近场声源。随后,基于基尔霍夫-亥姆霍兹方程的波场合成(Wave field synthesis,WFS)技术和基于球谐函数的近场补偿的HOA(Near-field compensated higher order ambisonics,NFC-HOA)

技术采用圆形扬声器阵列来合成全方位角的近场声源。然而,此类方法要求扬声器数量庞大,成本高,复杂度高,且要求放音房间的混响时间短,在实际放音环境下难以达到理想的效果。

如何利用较少数量的扬声器实现近场声源重放,可基于人耳感知特性来实现。心理声学研究结果表明,对于较远距离的声源(距离受试者超过1 m),受试者对距离感知主要依靠单耳因素,包括幅度、直达混响能量比及一些角度因素和谱因素[2];对于较近距离的声源(距离受试者小于等于1 m),受试者的躯干、肩、头等身体结构对波阵面产生严重的影响,在偏离中垂面的方向,会引起低频段很高的双耳声级差(Interaural level differences,ILDs)[3],并且为受试者提供了近场声源距离感知的因素[4]。而头相关传递函数(Head related transfer function,HRTF)能够较完整反映上述的单耳因素和双耳因素。基于HRTF的双耳声重放技术可通过HRTF 数据库合成双耳信号,在双耳处实现声压信号重建[5-7]。早期HRTF的测量主要基于远场条件下,主要包括1994年测量的MIT 库和2000年测量的CIPIC 库[8-9]。针对HRTF 测量复杂和耗时的问题,董秋洁等[10]提出了一种利用双扬声器的HRTF 动态测量方法,但对HRTF 的近场测量数据库较少;1998年,Duda 等[11]使用Bose Acoustimass 扬声器声源近似点源完成了近场HRTF 的测量,然而普通扬声器在近场条件下无法满足点源条件;2004年,Nishino 等[12]使用十二面体扬声器声源近似点源完成了近场HRTF的测量,但是十二面体扬声器近似点源时,在一些频率范围内存在较低的信噪比的问题;2009年,中国科学院声学研究所和北京大学合作采用KRMAR 人工头测量了近场HRTF 数据库[13],该数据库利用特殊的电火花作为激励声源,具有较好的全指向性和高信噪比;2018年,华南理工大学发布了不同距离的个性化近场HRTF数据库[14]。

基于HRTF 的双耳声重放技术具有实现简单、计算复杂度低等优点。但该双通道信号通过双扬声器重放时,双耳处声场存在串音,从而模糊虚拟声像的方位信息,干扰聆听者对虚拟声像的判断,降低重放效果[15]。针对这一问题,1961年,Bauerd[16]提出了串声消除系统(Cross-talk cancellation system,CCS);1963年,Schroeder 等[17]将串声消除系统实现并应用到研究之中。双扬声器系统的串声路径可看作一个两输入两输出的系统,用2×2 的空间响应传递矩阵表示。相应的处理串音干扰的串音消除器(Cross-talk canceller,CTC)是直接测量或者建模得到的空间响应传递矩阵的逆[17-18],对输入扬声器之前的信号进行预滤波处理,从而消除系统的串音干扰。对基于串声消除技术的虚拟立体声声场重放,Ward 等[19-21]使用参数加权的方法扩大了声场甜点区范围,提高其鲁棒性;Kirkeb 等[22]引入了最小二乘的方法求解CTC,同时提出了声偶极子(Dipole)布放方式;Bai 等[23-25]针对CCS 在扬声器阵列和手机等实际重放系统中的应用,进行了大量实验性的工作。但已有的双扬声器串声消除系统着重研究远场声源的方向感、环绕感,尚未涉及近场声源的重放及距离感研究。

本文以串声消除原理为理论基础,展开双扬声器配置下近场声源不同方向、不同距离条件下虚拟声源重放实验研究。研究了多种典型双扬声器配置下的近场虚拟声像的方向感知和距离感知效果,包括Dipole 配置、立体声配置、环绕声配置以及扬声器分别位于双耳两侧以考察前后混淆现象。实验分两部分依次展开:实验一用于测试近场距离下的虚拟声像方向辨别准确性,分析方向辨别准确区域和方向辨别模糊区域;实验二排除方向辨别模糊区域,在方向辨别准确的区域内,测试分析近场虚拟声像的距离辨别效果。实验结果表明,在方向角判断准确的区域,受试者能够较准确地分辨声源的不同距离,同时声源在侧方时受试者的距离判定结果更准确。

1 虚拟声源的重放模型

1.1 模型建立

基于串声消除的双扬声器重放系统,其实质是改变扬声器的信号输入,使得扬声器重放时的双耳声压等于单声源的情况,也称这种方法为听觉传输方法[26]。因此,双扬声器系统近场声源的重放是通过调节两路扬声器信号的馈给,使得扬声器重放的双耳声压等于距离受试者1 m 范围以内的单声源的情况。图1给出了双扬声器系统的近场声源重放的示意图,声源信号S经过两个单输入单输出的系统,将幅度和相位调节后的信号输入到左右两扬声器播放,最后信号到达受试者双耳产生与声源信号S在近场情况下相同的效果。假设声源信号S经过预滤波器Hpre处理后形成两扬声器的输入信号X,可表示为

图1 双扬声器系统近场声源重放示意图Fig.1 Diagram of near field source reproduction with dual speaker system

信号X经过扬声器系统(系统包括声卡、音箱)形成重放信号Y,假设扬声器系统的频率响应为H0,则此过程可以表示为

扬声器重放信号Y经空间传播后到达受试者双耳,形成双耳信号E。则数学形式可表示为

另一方面,假设空间中某一单声源位于图中虚拟声源V 的位置,产生信号S经空间传播后到达受试者双耳,形成双耳信号E′。则数学形式可表示为

要使得扬声器系统重放的声像与单声源产生相同的听觉效果,则需满足条件E′=E。根据上述条件,将式(1)、式(2)代入式(3),并结合式(4)可以得到

在实际应用中,扬声器系统的频率响应通常会做均衡处理,从而实现两扬声器系统的理想匹配。因此,在本文的研究中扬声器系统的频率响应H0可以忽略,则式(5)可简化为

此时,预滤波器Hpre可以表示为

其中,H-1表示扬声器到受试者双耳的系统传递矩阵的逆矩阵。

实际中布放的扬声器离受试者的距离一般在1.5 m以上(满足远场条件),因此需要选择远场的传递函数HLL、HLR、HRR和HRL。根据重放虚拟声源的位置信息,选择近场的传递函数HVL和HVR。根据式(7)可以得到预滤波器Hpre。

1.2 模型求解

预滤波器Hpre的求解,核心问题是对系统传递矩阵H进行求逆,一般采用伪逆法。即使使用伪逆法,在某些频率范围也会出现病态问题,通常在求逆过程中加入归一化代价函数(Tikhonov 正则化),使得逆矩阵逼近真实的系统传递矩阵的逆。那么,系统传递矩阵H的逆矩阵可以表示为[22,27]

其中,HH表示系统传递矩阵H的转置矩阵,β表示正则化代价因子,用于限制滤波器增益和补偿奇异值以保证该矩阵可逆,该参数可为常数或与频率相关。如果β取值太小,式(8)的结果H-1在某些频点上出现尖锐的峰值;反之,式(8)的结果相比于理想结果存在较大误差。在实际的求逆过程中,一个精确的β值不是至关重要[22],但是β要保证足够的通道分离度,即串声与直达声之间的幅度比足够小[27]。

本文取β= 0.005 作为求解逆矩阵过程中的正则化因子,客观结果表明通道分离度足够,虽然引入β值会带来信号音色的轻微改变,但能满足受试者测听定位实验的要求。接着将式(9)代入式(7)可求得预滤波器的形式为

将式(9)得到的结果Hpre代入式(1)可求得声源信号S经过预滤波器之后的信号X,即为扬声器的输入信号。

2 测听实验

2.1 实验配置

实验在中国科学院声学研究所的音频声学测听室中完成,室内装饰吸声材料和吸声板,尺寸为4.22 m×4.05 m×3.28 m,混响时间约为0.16 s,本底噪声平均值为14.8 dB(A)。如图2所示,实验使用的扬声器为两只Genelec 8030B 有源音箱,声卡选用Antelope Orion 32,其中扬声器离受试者的距离为1.5 m,且声卡与扬声器之间使用专业Canare 音频线连接。实验中模拟声源的信号为单通道click信号(图3为信号片段的短时傅里叶功率谱),信号频率主要在2 kHz,采样率为44.1 kHz。

在双耳处输入信号的计算中,选择MIT 数据库[8]中的HRTF 作为左右两扬声器到受试者双耳的传递函数,来代表传递函数HLL、HLR、HRR和HRL;选择IOA-PKU数据库[13]中的HRTF 来代表虚拟声源到受试者双耳的传递函数HVL、HVR,最后根据式(9)求得预滤波器。将click 信号通过预滤波器的处理,可以得到左右扬声器的输入信号X。两数据库在测量HRTF时都是在全消声室采用kemar 人工头进行测量,头部的衍射和耳廓耳道的声滤波特性近似一致,可以避免近远场数据库由于测量条件的较大差异带来的负面影响。但由于两数据库测量环境、测量条件和测量方法存在一定差异,而且没有采用个性化的HRTF,近远场数据库代入公式(9)后仍然会带来一定的感知误差。

图2 音频声学测听实验室Fig.2 Audio acoustic listening test room

图3 click 信号的短时傅里叶功率谱Fig.3 Spectrogram of click signal

2.2 实验设计

测听实验使用上文描述的测听环境和实验器材。听力正常的6位受试者(3男3女)参加了测听实验。根据双扬声器的夹角大小展开了不同的扬声器配置模式下的测听实验:

(1)扬声器夹角为10°(声偶极子);

(2)扬声器夹角为60°(标准立体声);

(3)扬声器夹角为180°(扬声器与中垂面的夹角为直角);

(4)扬声器夹角为220°(标准5.1声道中的环绕声道)。

实验分两部分依次展开,分别进行对虚拟声源方位角和距离的判定。

实验一安排受试者进行虚拟声源方位角的判定,以确定虚拟声源方向判定的准确区域和模糊区域。虚拟声源方位角的判定在虚源距离等于20 cm、75 cm两种情形下完成。图4给出了在4种不同的扬声器配置模式下需要受试者辨别的虚拟声源的方向(用虚线表示)。当扬声器夹角为10°时,如图4(a)所示,要求每位受试者辨别水平面全方位采样间隔为30°的虚拟声源的方向。在此过程中,实验员随机重放图4(a)中虚线所示的不同方向的虚拟声源,并要求受试者将感受到声源的方向与图4(a)中虚线所示的12个方向对应并反馈给实验员,实验员随即记录反馈结果。

根据初步的测听实验结果,图4(b)~图4(d)三种配置下受试者对在左半平面和右半平面的虚源感知定位具有近似对称性。因此为了减少受试者的疲劳感对实验结果的影响,图4(b)~图4(d)三种配置下要求每位受试者完成右半平面采样间隔为15°的虚拟声源的方向角判定。在此过程中,实验员随机重放上述不同方位的虚拟声源,并要求受试者将感受到声源的方向与图4(b)~图4(d)中虚线所示的13个方向对应并反馈给实验员,实验员随即记录反馈结果。要求每位受试者连续完成虚拟声源距离等于20 cm、75 cm 两种情形下的测听,在此过程中,受试者每完成一种距离情形下的测听之后,安排5 min 时间的休息。当受试者完成实验一虚拟声源方位角的判定之后,安排15 min 时间的休息,以便排除测听疲劳对后续实验过程的影响。

图4 实验一扬声器配置模式及虚源待测方位角示意图Fig.4 Schematic diagram of loudspeaker configuration and virtual source azimuth to be measured for Experiment One

实验二安排受试者进行声源距离的判定。在实验中,受试者可以用声源在肩部、肘部或手部去衡量感知的声源距离,实验员随后记录判定结果,根据每位受试者的肩部、肘部和手部的实际距离将判定结果等效为测量距离。这种方式对距离的判定更精确,因为没有限定受试者必须把感知距离判定成2 cm、50 cm 和75 cm 几个离散距离选项。因此,在实验之前,需要完成对每位受试者的肩、肘、手3 个位置的距离的测量。表1给出参加实验的受试者肩、肘、手3个位置的测量距离。

表1 受试者肩部、肘部、手部距离的测量结果Table1 The shouder length,elbow length and hand length

根据实验一受试者对虚拟声源方位角的判定结果,当扬声器夹角为180°(图4(c))时,受试者出现严重的前后混淆现象(如图6(e)、图6(f)所示)。因此,在实验二测听辨别距离时,只测听另外3 种配置下受试者对虚拟声源距离的感知,即扬声器之间夹角为10°、60°和220°三种情况(图5)。图5给出了在3 种不同的扬声器配置模式下方位角判断准确的区域内需要受试者判断的虚拟声源的距离(用×表示)。当扬声器夹角为10°时,如图5(a)所示,在虚拟声源方位角为0°、30°、60°、300°和330°五种情形下,要求受试者感知实际距离为20 cm、50 cm 和75 cm 的虚拟声源的距离。当扬声器夹角为60°时,如图5(b)所示,在虚拟声源方位角为0°和30°的情形下,要求受试者感知实际距离为20 cm、50 cm和75 cm 的虚拟声源的距离。当扬声器夹角为220°时,如图5(c)所示,在虚拟声源方位角为120°、150°和180°三种情形下,要求受试者感知实际距离为20 cm、50 cm 和75 cm 的虚拟声源的距离。图5(b)和图5(c)两种扬声器配置模式在预实验中的声像感知效果呈左右近似对称性,且为减少受试者疲劳,实验仅测试了虚源在右侧的区域。

图5 实验二扬声器配置模式及虚源待测距离示意图Fig.5 Schematic diagram of loudspeaker configuration and virtual source distance to be measured for Experiment Two

3 实验结果分析

3.1 方位角判定结果分析

在扬声器夹角不同的情况下,图6根据6 位受试者的测听结果分别绘制了虚源距离为20 cm 和75 cm时的角度辨别散点图。如图6所示,横轴表示目标方位角,纵轴表示判断方位角,虚线表示方位角判断的理想结果,圆点的大小代表所有受试者角度判断结果的重合次数。圆点越大判定结果重合的次数越多,也表明受试者对该方位的虚拟声源的角度感知结果越一致。

图6(a)和图6(b)分别给出了受试者在扬声器夹角为10°时,对距离为20 cm和75 cm的虚拟声源方位角的测听结果。从两图中可知,大部分受试者可以准确判定前半水平面的虚拟声源,但对于正前方和正后方的虚拟声源,受试者存在严重的前后混淆现象。对于右侧区域的虚拟声源,受试者基本将其判定为30°或者60°方向的虚拟声源,但似乎结果存在较大的离散性(例如最为明显的120°方向,散点分散度很高)。然而,对于左侧区域的虚拟声源,受试者完全将其判定为300°或者330°方向的虚拟声源,结果集聚性很强。这说明偶极子布放方式重放的声像左侧区域比右侧区域明显。

图6(c)和图6(d)分别给出了受试者在扬声器夹角为60°时,对距离为20 cm和75 cm的虚拟声源方位角的测听结果。从两图中可知,当重放虚拟声源位于前半水平面时,受试者基本都能准确判定其位置。当重放虚拟声源位于后半水平面时,受试者将实际的后方虚拟声源判定为前方虚拟声源,出现后前混淆问题。当重放虚拟声源位于扬声器夹角区域之外时,受试者很难区别这个区间的虚拟声源的具体方向。因此,本文称这个区间为方向辨别模糊区间。比较两图可知,当虚拟声源距离增大时,受试者的方向辨别模糊区间变小。

图6 实验一受试者方位角测听结果Fig.6 Results of the azimuth localization in Experiment One

图6(e)和图6(f)分别给出了受试者在扬声器夹角为180°时,对距离为20 cm 和75 cm 的虚拟声源方位角的测听结果。从两图中可知,当重放虚拟声源位于前半水平面时,受试者前后混淆问题严重。当重放虚拟声源位于后半水平面时,混淆问题减弱。其中重放虚拟声源位于90°时,受试者都能准确判定其方位角。比较两图可以看出,当虚拟声源距离增大时,受试者的测听结果的准确度提高。

图6(g)和图6(h)分别给出了受试者在扬声器夹角为220°时,对距离为20 cm 和75 cm 的虚拟声源方位角的测听结果。从两图中可知,当重放虚拟声源位于后半水平面时,受试者基本都能准确判定其位置。当重放虚拟声源位于前半水平面时,受试者基本完全将前方虚拟声源判定为关于前平面对称的后方虚拟声源,出现前后混淆问题。比较两图,当虚拟声源距离增大时,受试者的测听结果准确度提高。

对于前后混淆现象,文献[6]中指出,耳廓对声波的反射和散射所引起的谱因素对前后方向的声源定位非常重要。但耳廓引起的谱因素极具个性化特征,且仅对高于5 kHz~6 kHz 的高频声波有效,而且由于头部偏移耳廓难以带来稳定可靠的定位因素。而对于1 kHz~2 kHz 以下的低频情况,HRTF 是近似前后对称的,难以分清前后。由于上述原因非个性化HRTF极易产生前后混淆现象。

总之,当虚源与扬声器同处于前半水平面或同处于后半水平面时,受试者可以准确判定虚拟声源的方向;当重放虚拟声源位于扬声器夹角之外时,受试者无法准确判定虚拟声源的方向;当虚拟声源距离增大时,受试者的测听结果准确度提高。

3.2 距离判定结果分析

在扬声器夹角为10°、60°和220°的情况下,图7~图9根据受试者对于不同方向虚拟声源距离的感知结果绘制了散点图。其中,横轴表示目标距离,纵轴表示判定距离,虚线表示距离判定的理想结果,圆点代表每位受试者对虚拟声源距离的判定结果。图7~图9显示的主观距离判定是受试者感知的实际结果,而不是把距离判定成离散的某几个目标距离,一定程度上可以更准确地衡量受试者的实际距离感知。由于不同受试者肩部、肘部、手部的测量长度存在相同的情况,因此对于感知距离结果重合的情况采用较大的圆点表示。

图7 扬声器夹角10°,受试者虚源距离测听结果Fig.7 The angle between the two speakers is 10°,and the results of the distance localization

图8 扬声器夹角60°,受试者虚源距离测听结果Fig.8 The angle between the two speakers is 60°,and the results of the distance localization

图9 扬声器夹角220°,受试者虚源距离测听结果Fig.9 The angle between the two speakers is 220°,and the results of the distance localization

当扬声器夹角为10°时,距离感知散点图如图7所示。其中,图7(a)表示虚源位于0°方向时不同受试者虚源距离的判断结果,从图中可看出受试者对0°方向虚拟声源的距离感较差。当虚拟声源的方向偏离0°时,受试者对不同目标距离的虚拟声源定位准确度明显提高,其中最明显的为侧方声源,即60°方向和300°方向。将右侧与左侧的测听结果对比,可以看出受试者对左侧虚拟声源的感知距离较近。

当扬声器夹角为60°时,距离感知散点图如图8所示。其中,图8(a)表示虚源0°方向时不同受试者虚源距离的判断结果,从图中可看出受试者对0°方向虚拟声源的距离感较差,所有受试者都存在多次判断错误的情况,尤其当虚拟声源的目标距离为20 cm 时,受试者完全无法正确判定。图8(b)表示虚源30°方向不同受试者虚源距离的判断结果,从图中可看出受试者对30°方向虚拟声源的距离判定结果分布更靠近图中理想虚线两侧,大部分受试者可以正确感知目标距离为20 cm 处的虚拟声源,所有受试者可以正确感知目标距离为75 cm的虚拟声源。总体而言,受试者对稍远距离声源和侧方声源的距离感知更准确。

当扬声器夹角为220°时,距离感知散点图如图9所示。其中,图9(a)表示虚源120°方向时不同受试者虚源距离的判断结果,从图中可看出受试者对120°方向的虚拟声源距离感较好,判定结果分布靠近图中理想虚线两侧;图9(b)表示虚源150°方向时不同受试者虚源距离的的判断结果,从图中可看出大部分受试者可以正确判断不同距离的虚源,相比120°方向虚拟声源的判定结果,其结果更偏离于理想虚线两侧;图9(c)表示虚源180°方向时不同受试者虚源距离的判断结果,相比于120°和150°方向虚拟声源的判定结果,图9(c)中受试者的判定结果最偏离于理想虚线两侧,受试者存在多次判断错误的情况。因此,受试者对侧方虚拟声源的距离感优于180°方向虚拟声源的距离感,其中对120°方向的虚拟声源的距离感最好,基本可准确区分不同距离的虚源。同样说明受试者对侧方声源的距离感更准确。

4 结论

本文基于不同距离的HRTF,通过串声消除的方法实现在多种典型的双扬声器配置下近场虚拟声源的重放,并对其完成了实验测听研究。测听结果表明该双耳合成技术存在前后混淆现象,一对前方左右扬声器布置难以产生后半水平面范围的虚拟源,一对后方左右扬声器不能产生前半水平面的虚拟源。但在方位角判断准确的方向上,可对虚拟源感知距离进行控制,特别是当方向角越偏离中垂面时,对感知距离控制的准确度越高。该测听结果也验证了所采用的近场HRTF数据库的有效性。如何在双扬声器重放近场声源时增强距离控制准确度也值得进一步研究。

猜你喜欢

方位角声源扬声器
虚拟声源定位的等效源近场声全息算法
考虑桥轴线方位角影响的曲线箱梁日照温差效应
Focal&Naim同框发布1000系列嵌入式扬声器及全新Uniti Atmos流媒体一体机
像乐高一样的扬声器,还能为手机无线充电!
近地磁尾方位角流期间的场向电流增强
大地震 正式发布Cinenova系列扬声器
泉州大剧院选用L-ACOUStiCS、DiGiCo
基于GCC-nearest时延估计的室内声源定位
基于停车场ETC天线设备的定位算法实现
无处不在的方位角