APP下载

音强在声纹鉴定中的作用分析

2018-01-29王春兰

科技创新与应用 2018年36期
关键词:频率

王春兰

摘 要:音强在声纹鉴定中往往被忽略。实验采集了男女各一百人的语音样本,首先从音强随着频率、时间等的变化规律进行定性分析,接着测量各人发音时音强的数值进行定量分析,通过分析发现,语音的音强分布状态虽然不具有不同话者间本质差异和同一话者自身同一性,但是,音强的变化规律的确与频率、时间、共振峰有关,所以音强可以在特定情况下作为声纹鉴定的辅助性参数来使用。

关键词:声纹鉴定;音强;频率;共振峰

中图分类号:D918.9 文献标志码:A 文章编号:2095-2945(2018)36-0019-03

Abstract: Sound intensity is often neglected in voiceprint identification. The speech samples of 100 men and 100 women were collected in the experiment. First, qualitative analysis was carried out from the change of sound intensity with frequency and time, and then quantitative analysis was carried out by measuring the value of sound intensity when each person was pronounced. Through the analysis, it was found that although the distribution of phonetic intensity does not have the essential difference between different speakers and the identity of the same speaker, the change of phonetic intensity does have something to do with frequency, time and formant. Therefore, sound intensity can be used as an auxiliary parameter for voiceprint identification under certain circumstances.

Keywords: voiceprint identification; tone intensity; frequency; formant

引言

在声纹鉴定过程中主要运用的鉴定方法有听觉辨认、声纹鉴定和言语分析这三种鉴定方法,其中在法庭上最具有说服力并且运用最广泛的是声学分析,而这种分析与声音的物理属性息息相关。音强,作为声音的一种基本物理属性,在声纹鉴定活动中发挥着一定的作用[1]。

声纹鉴定是运用计算机科学、物理学、心理学、生理学、语言学、语音学等学科相关知识,通过对已经获取的可能成为证据的声音进行听觉感知、频谱这两方面的同一性和差异性的综合分析,可以为办案人员在办案过程中和审判过程中提供线索和审判依据的一种技术手段[2,3]。声纹鉴定过程中运用语音的许多声学特征,通常有共振峰、基频、音高,音长、音强、音质等特征。音强是指声音的强弱。它取决于声波的振幅,振幅越大声音越强;振幅越小声音越弱[4]。在犯罪现场犯罪分子紧张程度和被害人的恐惧感都可以用在声音的强弱中体现出来[5]。

1 实验

实验通过对同一个体和不同个体的语音材料进行音强的同一性与差异性的对比,采用定性分析和定量分析两种方法,分析说明声纹鉴定中音强的变化规律和它的应用价值。本次实验对男女各一百人采集语音,录音语句“你到底有没有做”,“这就是我做的”。

(1)实验仪器设备:VS99和专业语音分析软件Praat,版本型号2007-5.0。

(2)采集声音规则

发音人嘴与手机保持5~8cm,标准普通話发音,采集捏鼻伪装和正常情况下两种发音,录音语段为前面设计的内容,采样频率48000Hz,录制格式wav,录制语音时确保录制环境不变,对每一份录音编号。

2 实验数据分析

首先将得到的语音样本进行降噪处理并将其按音节截取保存。对每个音节进行强度分析,计算不同个体发相同的音节时的强度数据的变异系数。最后对比不同个体和同一个体的强度数据进行分析。

2.1 声纹鉴定中音强的定性分析

(1)音强随频率的变化规律

如下图1是实验样本中选取的A、B两人在发“这就是我做的”中的音节“做”的宽带语图A1、B1,和B在发“你到底有没有做”中的音节“做”的宽带语图B2。

观察这男女各一百人的“做”的宽带语图,可以看出随着频率的升高语图逐渐变淡。可以说明音强随着频率的升高而降低,频率在2000-5000Hz之间不同个体发相同句子中的“做”时宽带语图的浓淡程度不一样,说明不同个体发音时音强随频率下降的程度不一样。观察同一个体在分别发“你到底有没有做”和“这就是我做的”中音节“做”的宽带语图可以看出浓淡变化的趋势接近,说明同一人在不同话语中发相同音节时音强随频率变化趋势相同。所以可以得出结论同一个体在发同一音节时音强随频率变化的趋势是一致的,这可以作为声纹鉴定过程中同一性认定的辅助性指标来使用。

(2)音强按时间分布状态不同

如下图2中A1、B1、C1分别是A、B、C三人在发“这就是我做的”的音节“做”的宽带语图。

从时间角度可以看出在不同个体的宽带语图基本呈现出三种状态:浓淡程度分布均匀、前面浓后面淡、前面淡后面比较浓。由此可以说明不同的个体在发相同音节时音强按照时间的分布都是不同的。造成这种不同的原因是每个个体在发音时他的用力的时间段不同。例如,对于图 2中发音人A在整个发音过程中肌肉基本保持在一个稳定用力的状态,发音人B在发音开始用力,0.09s后放松并依靠肌肉正常的收缩将发音完成;而发音人C则是在一开始比较放松,在0.05s后用力。

(3)不同个体之间共振峰处的音强

如图3的 F1、G1、H1分别是F、G、H三人发“你到底有没有做”中的音节“底”的宽带语图。

观察不同个体在发“底”时的宽带语图时发现它们各共振峰处的浓淡程度并不都是随着频率的升高而逐渐变淡的。例如,图B1中的共振峰F2与F3基本浓淡程度相同,F4则浓于F2与F3。宽带语图G1中F2、F3与F4明暗程度基本相同暗于F1。宽带语图H1中F4与F3远远浓于F2。而这些浓淡程度可以代表音强的强弱,共振峰处越浓音强越强。而从这些宽带语图观察可得音强随着频率的升高而降低并不是一成不变的。

2.2 声纹鉴定中音强的定量分析

表1是五位女生、五位男性分别发“你到底有没有做”各音节的音强随时间变化前、中、后三阶段音强平均值以及变异系数(变异系数范围为音强最小差值与最大差值变异系数百分数)。

从男性和女性总体数据来看,十位发音人在发“你”和“底”时的音强都普遍弱于其他音节的音强,这是由单韵母组成音节的普遍规律,也是人在正常状态下的表现,这可作为声纹鉴定中伪装声音识别的一个辅助性判定依据,比如个体在故意伪装自己声音时就会将有些音故意重读。男性G的相邻音节之间的音强差距较大,这说明G在发音时在音节过渡不够平缓,这个特征可以作为某一类人的个体特征。

表2是五位女生、五位男性分别发“这就是我做的”各音节的音强随时间变化前、中、后三阶段音强值的平均值以及变异系数范围(变异系数范围为音强最小差值与最大差值变异系数百分数)。

从表1和表2来看样本的音强总体变化趋势可分为稳定、上升和下降三种趋势,从这两百个发音人发不同的音对比发现同一个体的音强总体变化趋势稳定。这个规律可以作为个体同一性认定和差异性认定的辅助性指标。

观察表1和表2变异系数可以发现,不同的个体在发相同音节时男性音强最低变异系数为0.3%,最高为28%,女性音强最低变异系数为0.4%,最高为19%。实验表明这个变异系数的数值是不确定的,说明同一个体在发音时音强变化很大,不具有稳定性,所以音强不是本质差异,不可作为同一鉴定的重要依据。

3 結束语

在司法环境中获取的语音是在不同的语境比如相关上下文和不同的心理情绪下产生的,而不同语境下同一人发同一音节时音强大小差别可能会很大,不同人发同一音节时音强的大小反而可能很接近。通过实验数据的定性和定量分析表明,语音的音强分布情况并不具有较强的个体差异性和自身同一性。所以不能作为声纹鉴定中的一项重要指标来使用,但是它可以在声纹鉴定过程中作为一项辅助性指标使用。

参考文献:

[1]崔金旭,王世全,张长明.视听资料检验[M].中国人民公安大学出版社,2009.

[2]王英力,李敬阳,曹洪林.声纹鉴定技术综述[J].警察技术,2012.

[3]林焘,王理嘉.语音学教程[M].北京大学出版社,1992:25-52.

[4]王力英,潘子勤,蓝长山.声纹鉴定中的音强特征研究[J].中国司法鉴定,2011(5):9-10.

[5]王永全,施少培,周琳娜.声像资料司法鉴定实务[M].法律出版社,2012.

猜你喜欢

频率
处理器频率天梯
处理器最高频率
振动与频率
无线电频率管理办法9月实施
例析频率分布直方图
一类非线性离散动力系统的频率收敛性
问:频率梳是什么?
频数和频率
一般现在时
显示器的画面不停地抖动等2则