APP下载

数字音频文件篡改的被动检验方法

2019-10-10姜忠姣王蕴丽陈德佳

科技传播 2019年18期
关键词:音频文件数字音频检材

姜忠姣,王蕴丽,陈德佳

随着互联网技术及数字音频技术的飞速发展,越来越多的数字音频文件在传播过程中承载着关键信息,在司法取证、新闻报道、科学发现等领域中扮演着重要的角色,但频繁出现的各种数字音频篡改伪造的事件以及各种数字音频编辑软件的普及和广泛使用,使人们对数字音频的真实性和完整性提出了质疑。针对不存在任何预先嵌入信息的数字音频文件的恶意篡改,研究出切实可行的数字音频篡改被动检测方法已经是当务之急,对维护社会秩序,打击违法犯罪,保证司法公正以及新闻诚信等具有重大的现实意义。

本文的研究对象为数字音频文件,其是以数字化形式存在于硬盘、移动介质等载体设施上用以记录音频信息的文件。本文针对数字文件及语音信号原理,介绍了基于文件属性检验方法、听觉检验和声谱分析方法、波形分析、频谱分析、直流偏移、本底噪音分析、实验分析等数字音频文件篡改检验的系统方法,以期提高数字音频文件篡改被动检验的有效性和准确性,同时也展望了数字音频文件篡改分析检验的未来发展方向。

1 检验技术方法

1.1 文件属性检验方法

文件属性检验主要包括:

1)检材录音的文件名、格式、大小、时长、采样率、声道数、创建时间、修改时间、哈希值等文件属性信息,截图保存。

2)检材文件的属性与声称的录制情况是否存在矛盾。

3)检材与录制设备中其他音/视频的文件属性的一致性。

图1 插入不同采样位数文件片段的检验图

每款录音设备均有其固定的录制参数,其录制形成的数字音频文件一定符合该设备的相关录制参数。音频文件属性检验是通过提供的录音器材录制语音样本获取录音设备参数,再通过查看音频文件属性信息获取音频语言文件参数,将两项参数进行分析比对,以二者参数的一致性来证明音频文件是否经过改动。音频文件属性检验方法一般作为音频文件篡改分析检验的初始步骤。例如,某检材为16 位的音频采样位数,通过波形图检验,发现这个16 位音频文件中的一小段语音表现出8 位的语音量化特征,分析这一小段8 位量化的语音是经过后期编辑插入篡改形成的,不是原始录音器材录制形成(如图1)。

1.2 听觉检验和声谱分析

实际检验过程中,一般是听觉检验和声谱分析相结合进行的,通过听语音、看声谱图,对检材语音文件进行全面检验分析。依据“GA/T 1430-2017《法庭科学录音的真实性检验 技术规范》”,听觉检验、波形分析和频谱分析的主要内容为:

1)录音的起始和结束信号情况。

2)检材的总体情况,如录制方式、信道、录音内容、说话人、环境等。

3)噪声、背景声的来源及变化情况,噪声、背景声的连续性和一致性,以及与语音的混叠情况。

4)录音中出现的信号异常和信号丢失情况。

5)语音的连续性、同一性,语音的自然度,语义的关联性和逻辑性。

6)频谱范围是否一致。

7)是否有音节丢失、缺损现象。

8)是否有异常空白段。

9)是否有片段复制现象。

10)是否有噪声、场景声不一致和/或不连续现象。

11)是否有信号激变现象。

12)是否有其他异常现象。

听觉检验时要反复认真听辨全部检材语音,对语音的连续性、同一性,语音的自然度,语义的关联性和逻辑性以及录音中断,背景噪音突变等可疑现象要进行记录。声谱分析需注意检材语音的背景噪声是否一致,对话语声、背景声是否连续有无异常,检材录音中是否存在频谱范围不一致、异常空白段、片段复制、信号覆盖、脉冲信号、信号激变等异常现象,对存疑部位要进行记录并分析其形成原因。检验之前要向送检人详细了解录音设备情况和语音的录制过程,发现音频文件与陈述的形成过程之间的矛盾,同时也可对声控、关机、暂停或误操作等形成的异常情况进行解释鉴别。

1.3 波形分析

1.3.1 采样直方图检验

采样分布直方图可以直观的表示音频文件采样点的总体分布情况,可通过采样直方图的检验,发现音频文件中插入的不同采样方式录制的语音片断。图2 为一篡改语音文件的采样直方图,在图中出现3 种不同疏密采样分布情况,选取2 个可疑片断,其采样直方图的所示的采样方式与整个文件都不同。

1.3.2 DC 偏移检验

直流偏移指录音设备在模拟信号转换数字信号过程中存在直流分量,将信号偏离中轴线,在音频文件检验中可利用直流偏移的现象来检测文件是否异常,例如录音器材的直流校正,或不同录音设备的电路板的直流偏移量不同。虽然人耳听辩不出二者的明显的区别,但通过对直流分量中心位置的检验,可以发现插入的语音片段。通常,当不同设备录制的音频组合在一起时会发生这种情况。

1.3.3 重复采样搜索

一些数字录音机在录制暂停到恢复期间,由于设备存在响应时间,会在恢复时生成若干个采样数值持续为零的采样点。同时也针对有意将选取的片段设置为静音的情况。

图2 不同疏密采样分布情况

1.4 频谱分析

频谱检验是针对音频文件中插入不同频谱成分语音片段进行的分析检验。频谱反映了随机信号各频率成分功率能量分布情况,因此可以揭示信号中隐含的周期性及频谱峰值等信息。未经篡改的音频文件中,各语音片段频谱图与整个语音频谱图均符合该录音器材频率响应特性。不同信道其频率响应范围存在差异,可以通过两部分语音片断的对比发现音频文件是否经过篡改。图3 中绿色谱线为电话录音,该电话信号经过200Hz~3 400Hz 的带通滤波器,红色谱线的语音片段为手机直接录音,可以发现二者录音信道功率谱有明显区别,因此可确定这两个语音片断不是同一录音方式所录制。

图3 录音笔与电话录音的频谱图差异

1.5 环境噪音及本底噪音的检验

一定条件下,录制音频的环境噪声也具有稳定性,因此可以作为篡改检测的依据。声音信号经过录音设备A/D 转换由模拟信号变为二进制信号,在采集、转换、量化的过程中必然会引入特定的噪声,称之为设备本底噪声。不同的设备的本底噪声存在差异,通过分析音频文件本底噪声的差异性可以判断音频信号是否经过篡改。由于设备的各自在生产、组装、使用过程的不同,会形成设备的差异性,可以将设备本底噪声理解为这款设备录制的音频所具有的一种特殊水印,可以借鉴数字音频主动取证的相关技术方法检验。但是对于使用相同录音设备录制的音频信号的检测就无能为力。同时针对环境的背景噪声检验中,频谱检验作用明显,通过对背景噪声的语谱观察比较,以发现二者的异同。

1.6 相同信号的筛选

在编辑期间,通常使用相同的背景噪声样本来代替语音信号。经过比对查找可发现相同的语音信号,互相复制粘贴的情况。

2 存在的问题及展望

1)当前,数字音频文件真实性检验方法不断发展,多数数字音频篡改被动检测方法针对性太强,通用性不高。音频篡改检验还没有系统的理论模型和方法体系,已有的检测算法较分散,对音频篡改检测方法的研究仍然缺乏整体性的考虑。另外从数字音频的产生过程可知,在音频录制过程中说话人的状态、传播介质的性质、录音设备的质量和录音环境的复杂性等都可能对最后的结果产生影响。大部分篡改检测只判断是否有篡改事实存在,而对篡改点的准确定位研究较少。

2)数字音频篡改被动检测技术融合了语音信号分析、数字信号处理,信息安全、数值分析、模式识别和机器学习等相关领域的知识,是一个多学科综合的研究课题。随着相关技术的发展,未来对数字音频篡改被动检测技术的研究可以参考以下几个方面。

(1)完善数字音频篡改检验的理论性研究。数字音频篡改被动检验的研究刚起步,还没有形成系统的有针对性和有效性的检验方法,还处在探索求证阶段。今后应不断完善数字音频篡改检验研究的概念、理论、研究方法等相关理论;

(2)建立有效的篡改检验特征表示与描述机制。即找寻具有与目标语音信号相关联的真实而完整的特征集,同时构建合理、有效的表示描述机制;

(3)构建基于多方法融合的数字音频文件被动检验技术,即将已知的并已成功推广应用的技术和方式进行分析整理,融合应用,各方法之间互补互相印证。

3 结束语

总之,上述文章中所论述的数字音频篡改被动检验方法是一种不基于预先嵌入的水印信息来进行判断音频文件是否被篡改的方式方法,已知证据所具备的可靠而充分的现状特性则成为该技术的一个关键点,也是判断和证明目标数字音频是否发生篡改的重要依据。本文介绍的几种检验方法能够解决部分数字音频文件的完整性、真实性的问题,以期数字音频文件篡改被动检验方法在案件侦查和法庭诉讼中发挥更大的作用。

猜你喜欢

音频文件数字音频检材
基于FPGA的多协议数字音频信号发生方法
疑难生物检材DNA的检验探究
基于Android手机的音频文件取证技术研究
数字音频广播信号接收系统及其软件架构
数字音频广播的特点
微量接触类生物检材的游离DNA问题分析
直接扩增法提取脱落细胞DNA
数字水印在音频文件篡改检测中的应用
科技手段在优质检材获取中的应用