APP下载

数字水印在音频文件篡改检测中的应用

2014-12-02李景丽

黄河水利职业技术学院学报 2014年2期
关键词:音频文件数字音频数字水印

李景丽,高 玲

(黄河水利职业技术学院,河南 开封 475003)

0 引言

网络的迅速发展及多媒体技术的日益成熟使得各种数字化作品的制作、编辑、存储与传播变得简单易行。数字音频产品在数字化多媒体产品中占据相当地位,是人们生活中最为普遍的数字化产品之一。随着MP3、VQF等新一代数字音频压缩格式的广泛应用,数字音频产品在网络上的传播和应用迅猛增长。人们可以越来越方便地拾取音频数据,并对其进行篡改。这一方面导致音频数据的真实性、完整性无法得到保证,另一方面也极大损害了音频制作者和发行者的权益。为了维护数字音频的安全应用,对音频文件的恶意篡改进行有效的检测已成为一个亟待解决的问题。

加密技术和数字水印技术是解决这个问题的两种不同的途径[1]。数字水印技术是近年来兴起的前沿研究领域,主要应用于隐蔽通信、版权保护和完整性认证领域。它凭借对音频文件篡改操作敏感,对正常音频处理操作鲁棒的优势,被广泛用于各种音频文件篡改检测的场合中。

1 篡改音频文件水印检测的设计要求

用于音频文件篡改检测的数字水印算法应能够在保证原始音频文件一定听觉质量的前提下,将与原始音频内容相关或不相关的标志信息作为数字水印嵌入到音频文件中。为了能够可靠的检测对音频文件的篡改情况,要求数字水印一般应具备不可感知性、脆弱性与健壮性、准确性、盲提取等特征。

1.1 不可感知性

水印的不可感知性又称透明性、隐蔽性,是指将水印信息嵌入到原始音频文件中之后,不会导致音频文件产生人耳可感知的质量下降现象。人类听觉系统不仅是一个极端灵敏的声音接收器,还具有选择性,可以起分析器的作用[2]。所以,音频数字水印对不可感知性有很高的要求。在设计音频数字水印算法时,应结合原始音频文件的特性,并充分考虑人耳的掩蔽效应(弱音在强音的掩蔽下会不为人耳所觉察)。

1.2 脆弱性与健壮性

音频文件的改变是属于正常操作还是恶意篡改,不同的应用场合对此会有不同的区分标准(一个应用场合下的正常操作有可能在另一个应用场合下被视作恶意篡改)[3]。在多数场合下,无损压缩、音频格式转换、重采样、低通滤波、高比特率有损压缩、去除噪声等一些标准的音频信号处理操作被认为是正常操作,而所有会对原始音频内容造成影响的操作,如剪裁重组、添加、替换、删除、低比特率有损压缩等均视为恶意篡改。用于音频文件篡改检测的数字水印既要对正常音频信号处理操作呈现较强的健壮性,又要对认定的恶意篡改呈现灵敏的脆弱性。

1.3 准确性

数字水印用于音频文件的篡改检测时,水印信息变化与否等价于音频文件篡改与否。当含水印的音频文件受到篡改攻击时,如果水印信息依然是完整的,就会直接造成检测失败。为保证检测的准确性,除要求能够有效识别篡改外,还要求能够对篡改进行精确定位,最好可以通过篡改分析,大致还原被篡改的部分。

1.4 盲提取

在提取水印信息时,盲水印既不需要原始音频文件,也不需要原始音频数字水印。由于音频文件篡改检测的绝大多数场合都是难以获得原始音频文件的,所以,在不提供原始音频文件的情况下,要求实现水印信息的提取,即实现盲提取。

2 音频数字水印的嵌入与篡改检测

2.1 水印的嵌入检测

要检测对音频文件的篡改,并能够准确定位篡改,一般是将所提取的原始音频文件的特征信息(作为水印内容)与密钥一起经过某种音频数字水印算法,嵌入到原始音频文件中,得到已嵌入水印的音频文件。其嵌入过程如图1所示。

图1 检测水印的嵌入过程Fig.1 Embedded process of detecting watermark

2.2 音频文件的篡改检测

对音频文件做篡改检测时,先要从待检测音频文件中提取水印信息,然后将所提取的水印信息与原始水印信息进行比较。如果两者一致,就认为音频文件没有被篡改;否则,认为音频文件已被篡改,并给出篡改的具体信息。音频文件篡改检测过程如图2所示。

图2 音频文件篡改检测过程Fig.2 Detection process of audio file tampering

3 典型音频文件篡改检测水印算法

用于音频文件篡改检测的数字水印属于半脆弱数字水印。迄今为止,学术界发表的针对多媒体文件篡改检测的数字水印相关的文献大多数都集中在数字图像领域,针对数字音频文件篡改检测的相关文献较少,比较典型的有以下几个。

Chung-Ping Wu 等[4]提出了基于指数级量化的离散傅立叶变换 (DFT)域半脆弱音频数字水印算法。该算法复杂度低,能够有效检测音频文件的恶意内容篡改。由于无需附加数据,所以篡改检测过程相对于诸如传输过程中的编码转换等保持内容操作是透明的。本算法基于改进的指数级量化奇偶调制技术和本地频率掩蔽模型,以保证用于水印嵌入和提取的量化步骤之间相匹配。采用该算法添加水印,对音频文件引入的噪声小于语音编码器。实验结果表明,该算法能够以非常低的错误概率区分恶意篡改和一些保持内容操作(如重采样、白噪声干扰、G.711语音编码和G.721语音编码等)。

Bin Yan等[5]提出了通过对线性预测系数进行量化实现的半脆弱音频数字水印算法。该算法通过把参数估计误差模型化为拉普拉斯分布噪声,对水印译码性能进行分析。水印检测阈值是根据对错误概率的要求和预期的信号噪声比 (SNR)推断得到的。实验结果表明,该水印算法对幅度伸缩操作具有鲁棒性,对添加白噪声操作具有半脆弱性,因此该算法适用于音频文件篡改检测。

Fang Chen等[6]提出了基于音频质量的使用小波包分解和最优树选择的音频文件篡改检测算法。该算法把小波包分解系数作为与音频质量相关的特征信息,通过在最小熵下的最优树算法选择小波包系数,从而保证在少丢失重要音频信息的情况下,最小化水印编码量。实验结果表明,根据PEAQ(音频质量感知评价)标准,除了各种比特率的MP3压缩操作外,大多数音频文件处理操作都不是质量保持操作。因为它们引入了各种特殊的听觉效果。另外,该算法能够有效识别随机裁剪和篡改等恶意操作。

上述3种算法都有着自身的一些优势,但都还不尽完善。理想的用于音频文件篡改检测的算法应满足对恶意操作具有脆弱性,对正常音频处理操作具有鲁棒性,能够对被篡改的音频片断进行精确定位和大致恢复,具有非常低的错误检测率等各项要求。

4 音频文件篡改检测实验

实验中,原始音频文件选用取样频率为11.025kHz、位深为 16 Bit、持续时间为 40 s 的单声道Wave波形文件,其时域波形如图3(a)所示。由于图像水印在表现形式上更为直观,故本实验中嵌入音频文件中的水印选用像素为93×93的BMP格式的单色二值图像,如图4(a)所示。采用相应的数字水印嵌入算法 (本实验中使用的是基于振幅差值比较的音频数字水印算法)将水印嵌入到原始音频文件中,得到的含水印的音频文件时域波形,如图3(b)所示。将图 3(b)与图 3(a)的波形对比可见,嵌入水印对原始音频的改变非常小。对含水印的音频文件进行影响语义的篡改,篡改之后的音频文件时域波形如图 3(c)所示。

采用与水印嵌入算法相对应的水印提取算法,对篡改后的音频文件进行水印的提取,所提取的水印图像如图4(b)所示。将原始水印和所提取的水印进行对比,可判断出音频文件已被篡改,再结合具体的水印嵌入算法,即可定位篡改位置,如图5所示。如果以原始音频文件的特征信息作为水印内容,还可进一步近似恢复音频文件被篡改的片断。

图3 音频文件时域波形图Fig.3 Time domain waveform of audio file

图4 原始水印和提取的水印Fig.4 Original watermark and selective one

5 结语

数字水印技术是音频文件篡改检测的一种有效手段。但是,目前数字水印在音频文件篡改检测方面的应用和研究成果均非常少见,是一个远未成熟的研究领域[7],尚有很多协议方面和技术方面的问题有待解决。在实际应用场合,要求嵌入水印之后,不可对音频听觉质量造成明显影响,对音频文件进行篡改检测除了要能够准确判断出是否有篡改,还应能够进一步确定篡改位置并近似恢复篡改之前的内容。把音频文件的重要特征作为水印内容,并与人类听觉系统的掩蔽效应相结合,是数字水印技术在音频文件篡改检测领域今后的主要发展方向。

[1]冯英,林土胜,谭启祥.基于音频特征的自嵌入数字水印技术[J].计算机工程与应用,2007,43(1):192-194.

[2]杨义先,钮心忻.数字水印理论与技术[M].北京:高等教育出版社,2006:200-201.

[3]李伟,汪竹蓉.数字音频认证研究综述[J].计算机科学,2009,36(10):21-24.

[4] Chung -Ping Wu, C.-C.J. Kuo.Fragile speech watermarking based on exponentialscale quantization for tamper detection [C].Proceedings of the IEEE InternationalConference on Acoustics, Speech, and Signal Processing.Orlando, Florida, May 2002:205-212.

[5] Bin Yan, Zhe-Ming Lu, et al.Speech Authentication by Semi-fragile Watermarking [J].Lecture Notes in Computer Science Volume 3683, 2005: 497-504.

[6] Fang Chen, WeiLi, etal.Audio Quality -Based Authentication Using WaveletPacketDecomposition and Best Tree Selection[J].International Conference on IntelligentInformation Hiding and MultimediaSignal Processing (IIH-MSP 2008).August 2008:1265-1268.

[7]宋玉杰,谭铁牛.基于脆弱性数字水印的图像完整性验证研究[J].中国图像图形学报,2003,8(1):1-4.

猜你喜欢

音频文件数字音频数字水印
基于网屏编码的数字水印技术
音频录编任我行
基于FPGA的多协议数字音频信号发生方法
基于Android手机的音频文件取证技术研究
基于FPGA的数字水印提取系统设计研究
数字音频及其嵌入技术在广播电视工程的应用
数字音频广播信号接收系统及其软件架构
数字音频广播的特点
提取APP中的音频文件
基于数字水印的人脸与声纹融合识别算法