APP下载

语音同一认定难点分析及解决对策

2020-02-21宦小答钟梁婷

电子技术与软件工程 2020年13期

宦小答 钟梁婷

摘要:本文通过对语音同一认定的发展现状着手,分析了语音同一认定的难点,并对此提出了相应的解决对策,以期提升鉴定工作效率。

关键词:语音同一认定;声纹鉴定;声谱;语图;自动筛选

语音同一认定即说话人鉴定。近年来,语音同一认定鉴定意见成为常见且重要的证据。但是,语音同一认定技术门槛较高,鉴定效率较低,与日益增长的鉴定业务需求难相适应。笔者认为,分析及攻克语音同一认定的难点,降低鉴定工作的门槛,提高其整体效能,是亟待解决的问题。

1 语音同一认定的发展现状

随着数字多媒体和移动互联网等领域的快速发展和深度交融,数字语音生态日趋成熟,电话通信、语音短消息、音视频聊天、监听监控、声纹锁、智能语音技术等得到越来越广泛的应用,为大众的日常生活和各行业的运转提供了便利的交互手段和高效的工具。语音数据的丰富,致使在一些案事件中,涉及语音的检材越来越多,尤其是近年电信诈骗等非接触性类型案件高发,语音成为该类案件证据链中的重要一环。

然而,目前声纹数据库的建设还欠完善,语音自动识别技术还有待突破,语音同一认定过程中需要依靠人工反复地辩听比对,且要排除说话人所处情境、情绪和身体状况的不同对发音造成的干扰,对鉴定人的能力和经验有着较高的要求,这也导致该行业入门门槛较高。据不完全统计,全国具备语音同一认定鉴定能力和资质的人员不到200人。

2 语音同一认定的难点分析

2.1 语音同一认定的过程

语音同一认定技术是利用语音工作站对未知说话人或待确认说话人的语音与已知说话人的语音进行分析检验,通过对其声纹特征的监测、比对和综合评断,判断二者是否为同一人语音的技术。根据相关标准,语音同一认定应按以下流程进行。

(1)对检材和样本进行记录、标识及加载;

(2)对检材和样本进行分别检验;

(3)对检材与样本进行听觉比对;

(4)对检材与样本进行声谱比对;

(5)综合评断并作出鉴定意见[1]。

2.2 语音同一认定的难点

在语音同一认定的这些过程中,对检材与样本进行听觉比对及声谱比对是综合评断并作出鉴定意见的依据来源,其中,声谱比对依照语音的频谱特征进行比对,具有较强的客观性,是作出鉴定意见的關键依据。

然而,声谱比对也是语音同一认定中难度最大的过程。其难度较大,一般只有经验丰富的鉴定人才能较高质量地完成声谱比对;其耗时也是最长的,一般要占据整个鉴定流程的绝大部分的时间。

2.3 声谱比对难度解析

声谱比对包含“一找、二看、三测量”三个环节,“一找”指的是先在检材和样本中寻找可供比对的特征音段;“二看”指的是观察比对特征音段的语谱图形态;“三测量”指的是测量比对特征音段的各项参数。其中,第一个环节一一寻找可供比对的特征音段是后两个环节的前提,其决定了所选择的比对目标是否具有可比性。然而,这一环节是声谱比对的三个环节中难度最大的。

这一环节的目标是筛选出调音音质相同的音段。声谱比对的原理主要是基于不同人声管(咽腔、口腔、鼻腔等)微观结构的差异性,而声管的宏观形态和微观结构均会对声谱产生影响,所以在寻找可供比对的特征音段时,必须要确保待比对的音段发音时声管的宏观形态一致(语音学中称为调音音质相同),声谱才能准确反映声管微观结构的异同,才是理想的可供比对的特征音段。这一环节的困难主要有以下几点:

(1)分辨难度大。调音音质与口腔关系最密切,由于咽腔、鼻腔等在发音时宏观形态基本保持不变,而口腔中的颚、舌、唇、齿等器官都能通过运动较大幅度地改变其形状及位置,这些器官不同的形状、位置和运动方式的组合就成为了调音音质的决定性因素。但是,口腔内的情形是很难观察到的,目前,要分辨发音时的口腔中各器官的动作最好的方法是听辨,这对于鉴定人的听觉灵敏度和经验都有较高的要求。

(2)干扰因素多。检材和样本在录制时,发音人的身体状态、情绪、所说语言、所处情境、对话对象和录音信道等均可能存在差异,这些都可能对发音造成影响,哪怕语音的内容一致,也很可能出现调音音质不同的情况。鉴定人需要尽力排除这些干扰因素,找到符合调音音质相同的标准的特征音段。

(3)工作量大。语音同一认定的过程中,鉴定人须在检材语音中选择录音质量较好且含有不同元音音素的音段进行标注,正常人的语速平均每分钟约240个音节,可选的音段数量每分钟可超百个;一般情况下,样本语音的时长为检材语音的3倍以上,须在样本中寻找与检材标注的音段对应的音段并逐一反复听辨,以找到调音音质相同的特征音段。这个工作量是很庞大的。

(4)自动识别技术难以充分发挥作用。目前,有的声纹鉴定工作站软件开发了音素自动检索功能,借助计算机智能识别技术,对语音材料进行自动扫描,将搜索到的音素进行标记。这可以在一定程度上提升鉴定工作效率,但是,目前的技术并无法替代人耳对调音音质进行自动分辨,仍需要鉴定人逐一对自动标记的音素进行听辨,工作依然繁重。

3 语音同一认定难点的解决对策

在思考语音同一认定难点的解决对策的过程中,笔者从手印鉴定中得到了重要的启发。手印鉴定与语音同一认定在原理、流程和难点等方面存在一定的相似性,而前者经过较长期的实践和发展,形成了一些对策,可以较好地解决鉴定中的困难,值得后者借鉴。

3.1 手印鉴定中的难点对策及启发

如前所述,语音同一认定的主要难点存在于寻找特征音段的环节,其与手印鉴定中分析确定检材手印的留痕部位的环节很相似。

在手印鉴定的过程中,只有找准对应的手印留痕部位,后续的对比才有意义(例如,如果检材指印是右手拇指指头所留,那么就只能选用右手拇指指头的样本指印与其进行比对)。然而,检材手印可能出现残缺、变形或检材留痕人的局部宏观特点异于常人等情形,鉴定人也可能存在能力或经验欠缺等情况,这些都可能影响检材手印留痕部位分析的准确度。故在实际鉴定工作中,遇到难以确定检材手印留痕部位的情况,为了避免造成错误和遗漏,一般的做法是,先对检材手印作粗略分析,以确定其可能的留痕部位,再将样本手印中的相应部位逐一与检材手印进行特征比对,而后进行综合评断并得出鉴定结论。例如,粗略分析确定检材手印是一枚指头印,但难以确定具体指位,此时可将嫌疑人的所有指头印样本逐一与检材进行特征比对,若样本指印中有一枚与检材的特征符合度达到认定同一的条件,便可作出认定结论;若所有样本指印与检材的特征符合度均达到否定同一的条件,便可作出否定结论。

由此可見,在手印鉴定中,检材手印留痕部位分析是得出鉴定结论的基础,但其干扰因素较多,得出准确的结论难度较大;而即使对检材手印留痕部位分析并不精准,也能依据特征符合度得出鉴定结论。这本质上是一种逆向思维一一不拘泥于固定的顺序,尽可能绕过难度较大的环节。这为我们解决语音同一认定的难点提供了思路。

3.2 语音同一认定难点的解决方案

3.2.1 思路

我们解决语音同一认定难点的思路是,调整声谱比对的各环节,构建新的声谱比对工作程序,先不对特征音段进行听辨寻找,而是通过对检材和样本中所有音段逐一进行特征比对,以期找出特征符合或接近同一认定条件的特征音段,再进行后续的同一性检验。

3.2.2 构建声谱比对的新程序

拟将原有的“一找、二看、三测量”变为“一筛、二核、三比对”,即先筛选出检材和样本中语图特征参数较为近似的成对音段,再通过听辨核查其调音音质的一致性,最后再对调音音质相同的特征音段进行特征比对。

3.2.3

新程序与原程序对比

新程序的“三比对”的环节就是原来“二看”和“三测量”环节的合并,其工作内容相同;而“二核”的对象是经筛选的成对音段,相比原来的“一找”,难度和工作量都明显减轻,是新程序的优势所在;“一筛”环节是新增的,此环节一定要快速而高效,才能实现新程序优势。见图1。

3.2.4 新程序的关键技术

“一筛”须对检材和样本语音进行完整而全面的检测和对比,显然难以靠人工完成。但是,其筛选的依据是可量化的图形特征参数,完全可以开发相应的计算机软件,进行语图特征参数的自动化筛选。参见图2。

语图特征参数自动化筛选技术,要在认定或倾向认定同一的检材和样本语音中,筛选出足够数量的准特征音段,其中大部分是要符合同一认定条件的特征音段。为达到此效果,开发语图特征参数自动化筛选技术之前,须开展一些基础研究。先要对大量的符合同一认定条件的特征音段的各项参数的稳定性进行分析,选择稳定性较强的参数作为筛选条件;其次应对这些参数的偏差程度进行统计,得出较合理的参数偏差闽值,作为筛选依据。依据这些研究的结果,再进行相应的开发工作。

3.3 须注意的事项

3.3.1 参数偏差阈值的设定

筛选参数是影响筛选结果的关键因素,如前所述,须通过研究确定参数的类型并得出合理的偏差阈值。但是,案件中的语音条件千差万别,实验研究得出的参数偏差阈值不一定适合具体的个案。所以,参数偏差闽值应设计成可调节的形式。在实际鉴定中,可先用默认阈值(实验得出的闽值)进行筛选,当筛选结果不理想时,可以自行调高或调低阂值,直至获得较理想的筛选结果。

3.3.2 鉴定结论的得出

须特别注意的是,新程序仅适用于结论为认定同一或倾向认定同一的情况,如果要作出否定同一、倾向否定同一或无法判断的结论,依旧须采用原程序。在实际鉴定中,可先用语图特征参数自动化筛选工具进行筛选,如果经反复调节偏差阈值依然无法获得理想的筛选结果时,则要切换回原程序,采取传统的听辨方法寻找特征音段。此种情况下,可以认为是特征音段的参数偏差太大或是特征音段不足,不再符合认定同一或倾向认定同一的条件,视情作出否定同一、倾向否定同一或无法判断的结论。

4 结语

新程序对原程序的各环节进行调整和改变,开发并利用语图特征参数自动化筛选技术,先筛选特征音段,再进行后续比对,在一定程度上绕过了原程序中最困难的环节,有利于降低语音同一认定的技术门槛,提升鉴定工作效率,是突破语音同一认定发展瓶颈的可期之路。

参考文献

[1] GA/T 1433-2017,法庭科学语音同一认定技术规范[S].北京:中国标准出版社,2018.

作者简介

宦小答(1984-),男,湖南省长沙市人。硕士学位,实验师。研究方向为声纹鉴定技术、痕迹检验技术。

钟梁婷(2001-),女,湖南省郴州市人。大学本科在读。研究方向为刑事科学技术。