APP下载

网络语音聊天与真人语音的比较

2010-03-11

电信科学 2010年2期
关键词:元音共振聊天

张 颖

(信息网络安全公安部重点实验室公安部第三研究所 上海 201204)

1 引言

随着计算机互联网络的不断发展和壮大,网络语音聊天工具因此也逐渐得到广泛的应用和普及。但因其便利性、匿名性和普遍性,它在为广大网络用户提供方便快捷的交流方式的同时,也为部分违法犯罪分子利用其进行交流或者实施违法犯罪行为埋下了隐患。根据公安部2006年8月24日颁布的《公安机关办理行政案件程序规定》第4章第23条,电子证据已经明确被纳入到公安机关办理行政案件的证据中来。而其他相关法令条款例如《中华人民共和国电子签名法》和《合同法》等,也已经承认并接纳了电子证据的存在。这也就意味着,作为电子证据的一种,通过合法途径取得的网络语音聊天音频记录在侦破工作中可以作为证据使用。而以事实为例,在我鉴定中心受理的案件中,便不乏委托方提供网络语音聊天音频作为检材的情况出现。从这个角度上来说,网络语音聊天音频对侦破工作的进行以及司法鉴定工作的展开,有着相当重要的意义。

但由于不同的网络语音软件造成的传输信道差异,以及同一网络语音软件的不同版本等种种原因,都会造成网络语音聊天和真人语音间响度、音高、音色的些许差别,这就会为语音鉴定工作的进行带来一定困难。

为了进一步讨论这个问题,在这篇文章中,我们将借助相关软件对网络语音聊天音频进行辨析,从宽带语谱图和共振峰频率两方面,通过各组数据具体分析了其与真人语音的差别。此文只讨论使用Skype和QQ两种软件进行语音聊天的音频。

2 网络语音聊天原理实现原理

网络语音聊天,又称VoIP (voice over internet protocol),指的是在使用了互联网协议的网络上进行语音传输,其中的IP是代表互联网协议,它是互联网的中枢,互联网协议可以将电子邮件,即时讯息以及网页传输到成千上万的PC或者手机上[1]。其最大的优势是能广泛地采用Internet和全球IP互连的环境,提供比传统业务更多、更好的服务[2]。

VoIP模型的基本结构图如图1所示。图1展示了VoIP设备将语音信号转换为IP数据流,接着把数据流发送到IP目的地,最后IP目的地又将这些数据流转换回语音信号的过程。具体而言,VoIP的传输过程分为语音-数据转换,原数据到IP转换,传送,IP包—数据的转换和数字语音转换为模拟语音5个阶段[3]。在此便不作详细阐述。

图1 VoIP的模型结构

3 实验条件与声样采集

3.1 实验设备

硬件:语音鉴定工作站,麦克风,耳机。

软件:VS5.0语音工作站,TotalRecorder录音软件,QQ2009,Skype简体中文3.8正式版。

3.2 说话人

随机抽取6名说话人,年龄于20岁到40岁之间,其中3人为女性,其余3人为男性,录音时说话人语音清晰正常,未受感冒等其他不良因素影响。

3.3 声样内容

声样内容为一段接近25 s的文字,词量充足。

3.4 实验过程

说话人登录网络聊天软件,拨通实验组织者的用户号码。连接成功后,双方均在各自的鉴定工作站上打开TotalRecorder软件,记录所有聊天内容。声样内容读完后,双方分别在各自的鉴定工作站上保存原声以及经过聊天软件后输出的音频。其中,对于QQ软件,原声及输出音频均为使用TotalRecorder录制,而对于Skype软件,输出音频由Skype软件自带录音功能录制。

3.5 实验参数

3.5.1 采样参数

TotalRecorder采样率8000 Hz,16位,单声道。

3.5.2 长时平均LPC实验参数

帧长20 ms,分析阶数14阶,运算点数512点。

3.5.3 宽带语谱图实验参数

带款 300 Hz,动态范围 35 dB,衰减 10 dB,高频提升系数0.65,纵向网格宽2000 Hz,横向网格宽1000 ms,哈明窗。

4 实验结果

我们从6名说话人中抽取一位男性说话人,选取“报”、“为”、“审”、“标”4 个字的元音部分,其实验结果如下所示。

4.1 QQ语音聊天

图2中显示的是使用VS5.0软件后,分别产生的“报”、“为”、“审”、“标”4 个字原声的元音部分的宽带语谱图以及共振峰图谱,以及经过QQ软件传输后输出音频的元音部分的宽带语谱图以及共振峰图谱。其中共振峰图谱为长时平均LPC谱,实线的为原声语谱图,虚线的为经过QQ软件传输后输出音频的语谱图。

图2 “报”、“为”、“审”和“标”共振峰和宽带语谱图比较(QQ语音聊天)

图3 “报”、“标”、“审”和“为”共振峰和宽带语谱图比较(skype语音聊天)

4.2 Skype语音聊天

图3中显示的是使用VS5.0语音工作站后,分别产生的“报”、“为”、“审”、“标”4 个字原声的元音部分的宽带语谱图以及共振峰图谱,以及经过Skype软件传输后输出音频的元音部分的宽带语谱图以及共振峰图谱。其中共振峰图谱为长时平均LPC谱,实线的为原声语谱图,虚线的为经过Skype软件传输后输出音频的语谱图。

5 结果分析

5.1 QQ相似性分析

首先,我们通过听觉来对原音和经过QQ传输的音频进行初步的比对和检验,发现二者在语音的声调模式、韵律特征,音节内和音节间的过渡特征上反映一致,通过纯听觉未能发现其中的差别。

其次,通过VS5.0语音工作站进行分析,我们可以得到所选每个词元音部分的长时平均LPC谱。导出VS5.0产生的相关数据后,我们进行统计分析并通过Excel软件绘制比对图谱。我们发现,总体来说,QQ网络语音聊天音频的长时平均LPC谱的共振峰走向和原音趋向于一致。以“报”字的元音部分/ao/为例,相关具体频率和幅度值如图4所示。

从图4可以清晰看出,就“报”字而言,2500 Hz之下原音和经过软件输出的音频共振峰走向以及峰谷频率值几乎完全吻合。

图4 “报”在网络语音聊天和真人聊天中的相似性

5.2 QQ差异性分析

通过以上各种数据分析,我们发现二者间还是存在一定的差别。现分别从共振峰频率值和共振峰缺失两个方面进行说明。

5.2.1 共振峰频率值差别

表1中分别列出了对于 “报”、“标”、“审”、“为”4 个字的元音部分,原音和经过QQ传输后音频的共振峰的比较。

从表1中可以看出,经过QQ软件传输之后的音频共振峰产生了变化。总体来说,即使对于同一个人所说的同一段话,经过QQ传输后的音频共振峰频率也不会完全一致,以上述4个字的元音部分为例,频率发生了基于-4.01%至5.4%之间的变化。

5.2.2 共振峰缺失

从表1我们同样可以看出,在部分情况下经过QQ软件传输过后的音频会发生共振峰缺失的现象。例如在发“标”的/iao/音时,QQ语音聊天出现了第三共振峰缺失的现象,而宽带语谱图中也有频率减弱的情况发生。但在实验中我们也发现,共振峰缺失的现象并不是对于所有元音都会发生的,至于这种现象的发生是随机的还是有一定的规律性,我们将在以后的实验中进一步研究。

表1 “报”,“标”,“审”和“为”在网络语音聊天和真人聊天中共振峰的差异性

5.3 Skype相似性分析

首先,我们通过听觉来对原音和经过Skype传输的音频进行初步的比对和检验,发现二者在语音的声调模式、韵律特征,音节内和音节间的过渡特征上反映一致,通过纯听觉未能发现其中的差别。

其次,通过VS5.0语音工作站分析,我们可以得到所选每个词元音部分的长时平均LPC谱。导出VS5.0产生的相关数据后,我们进行统计分析并通过Excel软件绘制比对图谱。我们发现,总体来说,Skype网络语音聊天音频的长时平均LPC谱的共振峰走向和原音趋向于一致。以“报”字的元音部分/ao/为例,相关具体频率和幅度值如图5所示。

从图5可以看出,就“报”字而言,原音和经过Skype输出的音频之间共振峰走向虽然趋于一致,峰谷频率值比较接近还是有细微的差别。

5.4 Skype差异性分析

5.4.1 共振峰频率值的差别

图5 “报”在网络语音聊天和真人聊天中的相似性

由以下图谱我们可以清晰地看出,与QQ软件输出类似,经过网络语音聊天软件传输后的声音同样出现了共振峰频率差异的情况。特别是对于个别文字,例如“报”字的/ao/的第二共振峰,“标”字的/iao/的第4共振峰等都出现了频率差异较大的现象。

5.4.2 共振峰缺失

从表2我们同样可以看出,在部分情况下经过Skype软件传输过后的音频会发生共振峰缺失的现象。例如在发“标”的/iao/音时,Skype语音聊天出现了第3共振峰缺失的现象;发“审“的/en/音时,Skype语音聊天出现了第4共振峰缺失的现象。

表2 “报”在网络语音聊天和真人聊天中共振峰的差异性

6 结束语

在前面所有实验的基础上,我们对所有6名参与者的原音和经过QQ以及Skype输出的音频分别进行了比较。得出的结果表明,对于经过上述两种网络语音聊天软件传输后输出的音频,从纯听觉上来判断的话基本可以判断为同一人,但是从长时LPC谱以及宽带语谱图看来,经过传输的语音在共振峰频率上均发生了变化,期间伴随共振峰缺失的现象发生。至于引起变化的具体原因,将在今后的实验中进一步研究。

1 乔佳飞.VoIP技术简介.http://www.dingshengcn.com/bbs/MINI/Default.asp?100-2246-0-0-0-0-a-htm,2010

2 雷庆勇.浅谈网络宽带电话VoIP的发展.今日科苑,2009,2(25)

3 朱海毅,周春楠.VoIP基本原理.信息技术,2003,27(5)

4 郭桂林,陈礼永.电子聊天记录作为电子证据的认定.泰山学院学报,2008,30(4)

5 熊志海.网络证据的特殊性及研究价值.河北法学,2008,26(6)

猜你喜欢

元音共振聊天
元音字母和元音字母组合的拼读规则
ZJP56型组合绳锯组锯机超谐共振分析
元音字母和元音字母组合的拼读规则
安然 与时代同频共振
选硬人打硬仗——紫阳县党建与脱贫同频共振
我就是不想跟你聊天了
敞开门聊天
改革是决心和动力的共振
Playing with “ar”
The song of/i:/