APP下载

上海方言语音司法鉴定中的难点问题探析*

2010-04-04刘阳生

电信科学 2010年2期
关键词:声纹检材自动识别

刘阳生,潘 祺

(华东政法大学刑事司法学院 上海 200042)

1 声纹司法鉴定的定义

声纹鉴定是指:使用同一鉴定原理把未知人的语音(检材)与已知人的语音(样本),通过语图仪分别制成声纹图谱,再依据声纹图上的特征进行分析、比较和判断,确定二者是否为同一人的判断过程。

狭义的声纹鉴定只包括鉴定人员将样本与检材制作成语音图谱从而进行比对,判断样本与检材是否为同一人的鉴定。随着鉴定技术的不断发展,声纹鉴定的概念也不断扩充,广义上的声纹鉴定还包括说话人同一性鉴定、语音人身特征分析、语音内容辨识、录音真实性检验、提高语音信噪比、噪声分析、音源同一性鉴定和录音器材鉴定等多种鉴定内容。现在,计算机自动识别系统也有了较大的发展,比如西班牙BATVOX系统,鉴定人只要按照要求输入样本与检材,计算机就能自动计算出样本与检材的相似度,从而得出鉴定结论。

因为中国地域广阔,方言在各个地区普遍存在。各个地区说话的语音、发音习惯、重音位置不尽相同。在司法鉴定的案件中有很大一部分的语音鉴定属于方言内容的甄别。上海是全国经济发展的龙头,也是全国案件纠纷发生较多的城市。在这些纠纷中,就有一部分需要对当事者的语音进行司法鉴定。而针对上海方言的语音司法鉴定因为上海的特殊地域特征给司法鉴定的进行带来了多种难题。

2 研究上海话声纹鉴定的意义

2.1 声纹鉴定的研究有利于推动鉴定技术和侦查技术的发展

近几年,随着录音录像技术的迅速发展,录音录像仪器已在全国普及,声纹鉴定的案件也在增多;另外,视听资料作为法定证据种类中的一种,可以作为证据在法庭上使用,当事人在进行民事活动时大多注意搜集这方面的证据,因此对声纹鉴定进行系统研究就显得十分必要。

2.2 针对上海方言声纹鉴定的研究有助于填补方言司法鉴定方面的的技术空白

上海市地域并不算大,但是在这么小的区域内却存在着多种多样的方言形态。对上海方言进行研究不但方便取材而且在人力物力投入上也较其他地区少。因此,在上海进行方言研究有其自身优势。

在上海,目前要求进行声纹鉴定的案件中,涉及到方言鉴定的案件越来越多。而我国针对上海方言鉴定的专门研究几乎没有,对上海话司法鉴定的研究有助于填补这一方面的空白。

2.3 针对上海方言声纹鉴定的研究有助于推动其他学科的发展

声纹鉴定研究需要很多其他学科的支持,如语言学中对方言的研究,物证技术学中对声纹鉴定的研究成果。随着人工智能的发展,语音自动识别系统在国外已经开发成功。对上海方言的研究可以推动语言学、物证技术学和计算机科学等学科的发展。

对上海方言在司法鉴定领域的研究还可以推广到全国方言的研究,以丰富我国的证据领域,推动我国的司法公正。

2.4 针对上海方言声纹鉴定的研究能验证语音自动识别系统的科学性

我国许多鉴定机构已经引进了外国的语音自动识别系统,但是语音自动识别系统却是广受质疑的系统。通过对上海方言的研究,我们可以验证语音自动识别系统是否科学。

上海方言多样化,语言变化复杂,在上海地区进行验证工作的条件可谓得天独厚。

3 上海话语音鉴定中的难点问题分析

3.1 声纹取样中的难点问题

3.1.1 声纹鉴定取样要求

被检测人的语音样本中应尽量减少声音伪装,或者改变语音、语速,改变清晰度、流畅度,添加重音以及其他改变。

样本取样时应尽可能采取与检材形成时所使用的线路相同的形式取样。比如,如果检材是在打电话过程中的电话录音,则样本应尽可能采用同一部电话进行录音取样。

样本应尽可能与检材一致,包括语速、语音停顿、重音、口音以及沙哑的语音效果都应该尽可能与检材一致。为此,应对被检测人多次取样。如果还不能达到所需效果,可以让一人模仿检材中的人说话语气,让被检测人跟读。

样本取样应该尽量接近检材中说话人当时的心理环境,避免出现因为心理影响造成的颤音、弱音现象。

3.1.2 上海地区特定语言环境会给声音取样带来的难点

现在的上海人几乎都能说两种方言,会说上海话的同时又会其祖籍所在地的方言,而大部分人现在都会说普通话。像有些原籍苏北的上海人在自己的社区里说苏北话,而与别的人或在比较正式的交际场合说上海话。这种根据说话的不同场合或不同对象,可以不断地转换双语或多语的现象,在上海社会交际中已司空见惯。可以说是上海地区独特的语言环境造成了这种一人会多语的独特现象。

上海的方言混杂,有些样人的方言并不是正统的方言,而是经过说话者本人对多种方言进行演变的或者学习而形成的方言混合体。

如果被检验者故意说不同的方言,则很难根据鉴定人的个人经验进行判断。多种方言和普通话之间的自由转换给声纹鉴定带来了难题。对上海人来说,他的语音更容易伪装。

3.1.3 多种方言的组合形式给取样带来的难点

一个人在可以说不同方言时,受不同方言语言习惯的影响,其使用时会出现不同程度的方言混合现象。即一个人在说话时可能存在不同的语言组合形式。如,前一句是正宗的上海话,而后一句就可能是苏北话。

如果说话人在检材或者样本中有意识地改变自己原来的语言习惯,而这种习惯的改变有可能超出可检验的范围。如果对此类声纹进行鉴定,肯定不能得出正确的鉴定结论。

3.1.4 上海话的多义性和方言的多样性给鉴定带来的难点

上海有19个区县,目前还没有任何文献详细说明或解释上海各个区县的上海方言的异同性。上海话不但多样而且复杂,上海话一个词汇多种意思或者一种读法因为音调不同而造成词义不同的现象较多。比如在上海话中的苏北话里面,“你”和“我”是一样的发音,但意思不同。又比如,“阿拉”在上海话里既可以表示我,也可以表示我们。

上海话词义的多样性,特别是虽同一种读法但所使用的词汇不同的语言现象,要求鉴定人员要对上海方言有充分的了解,否则无法完成司法鉴定过程。

3.1.5 心理因素影响样本取样的难点

被检测人与检材中说话人的心理环境不可能达到相同状态,在取样时不应该刻意模仿检材中说话人说话的环境。

被检测人在被取样时,由于心理环境不同,取样时的声音习惯与检材中的声音习惯不尽然相同。有些人在被取样时甚至出现颤音、失音和音调突变等现象,而这些改变都会影响鉴定结果。因此,鉴定人员在取样时,应该尽量让被检测人保持放松。

3.2 进行声纹比对时的难点

在实践中,方言特征是一个人发音最稳定的特征。上海是一个外来人口较多的城市,上海人在成长过程中会接触到多种方言。上海人在特殊的生活环境下通晓多种方言并可以在多种方言之间的自由转换,这种地域特征在我国并不多见,而这种现象也给声纹比对带来了难题。

3.2.1 上海地区的方言特征对鉴定人员的条件要求提高

上海各个地域方言种类不同,而且每个区域都没有特定的方言形式,只是某一种方言是主流,其他方言的影响也不容忽视。上海方言地域特征要求鉴定人员必须充分了解上海各区域的方言特征,特别是上海方言读法和词义的细节特点。鉴定人员对上海话的了解程度影响着声纹鉴定的准确度。

3.2.2 上海人能说多种方言给声纹比对带来的难点

上海人的生活环境使一人会多种方言的特殊现象在上海普遍存在。多种方言相互融合形成多种语言表达形式,更增加了上海方言的多样性。

各种方言的地方音、语音、语速、方言语法都有较大差别,同一句话在不同方言中的表达方法互不相同。由于上海人通晓多种方言,他们可以随时改变其使用的语言语法,给鉴定人员的鉴定带来困难。

3.2.3 检材与样本受环境影响较大

检材中说话人的声音会受外界环境会影响,如空气湿度、所在空间的大小(会产生回音等干扰)、声音传播的介质、记录器与发音者的距离、相对于发音者的位置、杂音的干扰,还有记录声音的仪器本身等都会对记录的声音的质量产生影响,而在样本取样时很难做到与记录时的环境一致。

3.3 制作鉴定结论时的难点问题

3.3.1 语音自动识别系统在上海方言司法鉴定中应用的可能性

人工智能的发展使语音自动识别系统开始出现在各大司法鉴定机构,但是相当多的老一辈学者对此类系统的科学性持怀疑态度。

现在我国使用的的语音自动识别系统来自国外。从外国引进的仪器是不是需要一个中国化的过程;原来的算法是基于英文环境设定的,能不能在中国多样的方言环境下适用的问题,都需要在中国进行验证。另外利用语音自动识别系统进行的鉴定,鉴定的结论的科学性、代表性,也有待验证。

3.3.2 语音自动识别系统在上海方言鉴定上要解决的难点

相对上海方言来说,利用语音自动识别系统最大程度地概括出上海地区各个地域方言的不同特点,是语音自动识别系统在应用上的难点。利用语音自动识别系统进行精确认定时,系统是否能避免相近地区的方言混淆认定;是否能对说话人所在地区进行认定等,都是能够较好地检验自动识别系统本身科学性的检验方法。

语音自动识别系统在上海方言上的应用,首先要解决的就是可能存在的声音伪装,然后是对多种不同特征的方言进行认定的准确度检验。

4 上海方言司法鉴定的研究方向

4.1 对上海方言进行系统研究

对上海话进行系统化分析,可以从多种角度进行研究。纵向可以对比上海某一区县的老一代上海人和新一代上海人语言特征进行比较分析;横向可以对上海的各个区县以及上海周边地区的方言特征进行比较研究。

4.2 语音自动识别系统在上海方言鉴定中的应用

语音自动识别系统的运行是以数据库为基础的,在语音自动识别系统的基础上建立足够大的数据库,给声纹比对提供便利,提高声纹比对的准确度。

建立数据库是进行语音司法鉴定的前提,但是应该正确定位语音自动识别系统在司法鉴定中的地位。司法鉴定主要应该根据司法鉴定人员的经验为主,语音自动识别系统应该放在辅助位置。语音自动识别系统得出的结论,不应成为司法鉴定人员得出鉴定结果的完全依据。

4.3 上海话语音司法鉴定鉴定方法的改良

采用语音自动识别系统与司法鉴定人员相互协助的方法提高司法鉴定的效率。

重视利用司法鉴定过程中讲话人的微小语言习惯。因为讲话人对自己下意识的语言是没有办法伪装的。针对上海本地语言特征,对检材与样本中讲话者的下意识语言活动的分析或能取得更好的鉴定效果。

1 寥翔,赵志强,庞业光等.声像资料鉴定技术概述.现代法学,2005,4(27)

2 阎萍.声纹鉴定及其在侦查破案中的作用.辽宁警专学报,2008(1)

3 杜小西,赵燕婷,刘云译.语言鉴定标准.美国录音证据委员会.贵州警官职业学院报,2009(19)

4 贾玉文,邹明理著.刑事技术大全—文件检验.北京:中国人民公安大学出版社,2002

5 刘文主编.中国刑事科学技术大全—文件检验 (第二版).北京:中国人民公安大学出版社,2002

6 陈光中主编.司法鉴定学.北京:中国民主法制出版社,2003

7 何家弘主编.证据学论坛.北京:法律出版社,2007

8 廖根为著.监控录像系统中人像鉴定问题研究.上海:上海人民出版社,2010

猜你喜欢

声纹检材自动识别
基于数据挖掘的船舶航迹自动识别系统
基于卫星遥感图像的收费站位置自动识别与校核
屏幕即指纹识别
自动识别系统
疑难生物检材DNA的检验探究
接触性生物检材DNA提取方法的比较
基于IEC61850的配网终端自动识别技术
直接扩增法提取脱落细胞DNA
基于数字水印的人脸与声纹融合识别算法
接触性DNA及其现场发现