APP下载

基于稳健特征点的平稳小波域数字水印算法

2019-12-03牛盼盼杨思宇王丽杨红颖李丽王向阳

通信学报 2019年11期
关键词:数字水印子带数字音频

牛盼盼,杨思宇,王丽,杨红颖,李丽,王向阳

(1.辽宁师范大学计算机与信息技术学院,辽宁 大连 116029;2.大连理工大学电子信息与电气工程学部,辽宁 大连 116023)

1 引言

数字水印是一种可以在开放的网络环境下保护版权和认证来源及完整性的新技术,目前已成为网络与信息安全领域的一个研究热点。不可感知性、稳健性及水印容量是数字水印系统必须满足的基本要求,也是近年来数字水印领域的主要研究内容[1]。用于版权保护的数字水印系统必须具有高度稳健性。现有大多数稳健音频水印算法能够抵抗简单的常规音频信号处理攻击(如叠加噪声、重新量化、重新采样、MP3压缩等),尚无法有效抵抗破坏性较强的去同步攻击(desynchronization attack)[2-3]。去同步攻击能够改变水印信号嵌入位置,即破坏水印信号分量的同步性,使水印检测器找不到有效的水印信号[4]。数字音频水印系统中的去同步攻击可以分为2类:简单的全局去同步攻击和复杂的局部去同步攻击。其中,全局去同步攻击是针对整段音频信号的攻击方式,如时间缩放、幅度伸缩、音调伸缩、DA/AD 转换等,即对音频整体内容进行了破坏;局部去同步攻击是针对局部音频信号的攻击方式,如随机剪切、局部变调、抖动攻击等,即对音频信号的一部分内容进行了破坏[5]。

到目前为止,人们主要采纳5种策略解决数字音频水印领域的去同步攻击问题,包括穷举搜索、构造同步不变特征、扩频水印扩频码相结合、同步码、利用音频重要特征等。

1)基于穷举搜索的稳健音频水印

穷举搜索是数字音频信号遭受时域去同步攻击后恢复水印信息的最简单方法[6]。该类水印算法存在2个致命问题,一是对数字水印检测器的多次操作会显著增加虚警率;二是计算复杂度太高,其计算量将随着搜索空间的扩大而迅速膨胀。因此该类方法只适用于小数据量水印检测,且无法有效抵抗诸如时间缩放、随机剪切、抖动等去同步攻击。

2)基于同步不变特征的稳健音频水印

同步不变特征方案以其原理简单、性能稳定等优点而受到人们普遍重视。该类水印方案的基本思想是将水印信息隐藏在原始载体音频信号具有同步不变性的量中,而目前所使用的同步不变量主要包括二进小波变换(DYWT,dyadic wavelet transform)、几何不变矩、直方图、奇异值、向量范数等[7-9]。在含水印音频遭受各种攻击后,同步不变量由于具有同步不变特性不会发生变化,因此隐藏于其中的数字水印信号得以保存。但目前该类水印方案仅仅能够抵抗轻微的全局音调伸缩和整体时间缩放,尚不能有效抵抗诸如抖动、局部变调、随机剪切等较复杂的局部去同步攻击。

3)基于扩频水印扩频码相结合的稳健音频水印

扩频数字水印技术往往先利用纠错编码技术,对水印信号进行编码预处理;然后利用正交频分复用、相移键控、移频键控等调制方法,对数字水印信号进行频谱扩展;最后在原始载体音频的变换系数中叠加扩频水印信号[10-11]。扩频水印扩频码相结合算法的优势在于不需要额外同步信号,且能够有效抵抗诸如幅度伸缩等轻微全局去同步攻击。但其仍然存在2个问题,一是由于其缺乏必要的同步保护机制,故普遍难以抵抗局部变调、随机剪切、抖动等破坏性较强的局部去同步攻击;二是无法实现数字水印信号的盲检测,不利于应用。

4)基于同步码的稳健音频水印

基于同步码的音频水印方案需同时嵌入数字水印信号和同步码信息。进行水印检测时,首先检测到同步码信息,然后再根据同步码信息确定出水印信号的嵌入位置。显然,这类数字音频水印方法的稳健性和安全性主要依赖于同步码信息。总体说来,基于同步码的音频水印方案具有一定的抵抗诸如整体时间缩放等轻微去同步攻击能力,但其无法有效抵御诸如局部变调、随机剪切等局部去同步攻击,且数字水印容量受到一定限制。此外,同步码音频水印算法还会产生2个严重问题,一是安全性问题,二是虚警问题。原因是当一个同步标记被用于一系列不同数字音频作品时,其很容易被敌人发现和去除[12-13]。

5)基于音频重要特征的稳健音频水印

基于载体内容局部特征的数字水印方案,其基本思想为,利用相对稳定的载体特征点(也称显著点,salient point)来标识水印嵌入位置并确定相对应的特征区域用以嵌入水印信息。在检测含水印音频信号时,同样利用载体特征点进行定位和提取水印信息,从而有效抵御破坏性较强的去同步攻击。Wang 等[14]结合人类听觉掩蔽特性,提出了一种基于载体音频内容的新能量特征点提取方法。该算法具有一定的抵抗噪声干扰等常规攻击能力及轻微剪切攻击能力,但无法有效抵抗时间缩放、音调伸缩、DA/AD 转换等去同步攻击能力。Li 等[15]首先提取出原始载体音频包络的峰值点,然后以此作为音频特征点并从原始载体中选取4096个局部音频片段用于水印信号嵌入,最后利用FFT 在每个局部音频片段内独立嵌入数字水印信号。该算法可抵抗轻微的时间缩放、随机剪切等去同步攻击,但对高通滤波等常规音频处理比较敏感,而且无法有效抵御联合攻击。Ma 等[16]结合独立分量分析理论,选取数字音频能量峰值点作为特征标识并依此确定数字水印嵌入位置,而数字水印信号被嵌入子采样后的音频载体内,该算法对噪声添加、重新采样等常规音频处理非常敏感。鲍德旺等[17]首先利用非下采样小波分解所得的低频信息重构出新载体数字音频,然后根据数字音频的局部能量特征,从新载体中提取出稳定的音频特征点,并以音频特征点为标识提取出长度固定的局部音频段,最后利用量化调制方法将水印信息嵌入局部音频段内。该算法具有较好的抗噪声干扰能力,但其抵抗时间缩放、音调伸缩、DA/AD 转换等攻击能力较弱。Pun 等[18]提出了一种自同步小波域数字音频水印方案,该方案利用音频载体信号的局部方差不变特性来定位水印嵌入位置,具有较好的抵抗常规音频信号处理及轻微剪切攻击能力,但对DA/AD 转换、音调伸缩、时间缩放等比较敏感。Pun 等[19]提出了一种基于稳健不变音频特征点的检测方法,利用SWT(stationary wavelet transform)系数的平移不变性、不可感知性和稳健性嵌入水印信息。该算法在空域内提取特征点,与频域相比抵抗攻击能力较差,并且该算法是选取特征点周围的固定长度作为待嵌入水印特征区域,而不是根据特征点周围的局部特征从而自适应确定待嵌入水印特征区域大小,水印容量与其他算法相比也相对较小。Yuan 等[20]首先在空间域内提取出载体音频的局部能量峰值点,并将其作为稳定的数字音频特征点,然后以音频特征点为标识,确定固定尺寸的局部音频段,最后对局部音频段进行小波变换,并利用量化调制技术将水印信息嵌入低频子带内,该方法计算简单、容易实现,但其抵抗噪声干扰、时间缩放、音调伸缩等攻击能力均较差。Xiang 等[21]提出了一种基于DCT(discrete cosine transform)域的大容量稳健水印检测方法,利用DCT 系数的不可感知性和稳健性嵌入正交PN 序列作为水印信息,该算法在提高算法稳健性的同时,保证了较高的水印负载能力。

此外,近年来已有学者将深度学习方法应用到数字水印技术中,对基于深度学习的水印方法进行了深入的研究,以寻求不可感知性及同时抵抗常规信号处理操作和去同步攻击的稳健性之间的平衡为优化目标,利用粒子群优化等技术设计音频水印优化过程,自动确定水印算法的最优水印参数和搜索最合适的嵌入位置等,为所设计的水印系统提供了更大的灵活性[22-23]。

综上所述,穷举搜索、构造同步不变特征、扩频水印扩频码相结合、同步码等方案难以有效解决诸如抖动、局部变调、随机剪切等较复杂的局部去同步攻击问题,而基于音频重要特征的数字音频水印方案为去同步攻击问题提供了一些可行而有效的解决方向,但现有该类方案普遍存在诸如特征点稳定性差且分布极不均匀、计算量偏大、时间复杂度较高等一系列问题,从而严重影响了数字水印的稳健性和不可感知性,大大降低了整个数字音频水印系统的工作性能。鉴于此,本文提出了一种基于稳健特征点的平稳小波域音频水印算法。该算法首先利用高斯滤波技术计算出平稳小波域低频子带的一阶平滑梯度响应,并结合平滑梯度响应分布确定基准阈值,进而提取出分布均匀且性能稳定的音频特征点;然后以音频特征点为标识,结合短时能量[24]自适应确定适合于水印嵌入的局部特征音频段;最后利用扩展抖动调制方法[25]将水印信息嵌入局部特征音频段中。实验结果验证了该算法不仅不可感知性良好,并且对常规音频信号处理和局部去同步攻击均具有较好的稳健性。

2 平稳小波变换简介

与DWT 相比,平稳小波变换(SWT,stationary wavelet transform)[26]具有平移不变性和冗余性等特性,可以对连续小波变换做出更加近似的估计。在音频信号进行分解时,DWT 采用下采样抽样,并采用差值补0的方法对音频信号进行重构;而SWT在进行音频信号分解时采用非下采样抽样,将信号分解成一系列与原信号长度相同的近似系数和细节系数,同时在每2个滤波器系数之间插入零值以实现滤波器的延拓,从而避免在音频信号进行重构时产生Gibbs 震荡现象。

其中,a J(u)为近似系数或低频系数,d j(u)为细节系数或高频系数。对于j≥0,则有

其中,h(n)、g(n)为小波函数ψ(t)对应的共轭镜像滤波器组,hj(n)为在h(n)相邻两项之间插入2j-1个0得到的扩展滤波器。不同于DWT,SWT 并未将每个分级得到的近似系数和细节系数纳入到下采样范围中,故变换后的近似系数和细节系数能够保持与原始信号相同的长度。进行SWT 操作可以得到每个分级的低通和高通滤波系数,此操作相当于扩频操作。随着分级层数的增加,SWT 系数的分辨率随之下降,利用滤波器,可以均匀地进行下采样操作并进一步分级低通系数(二次分级)。SWT的结构如图1所示。

图1 SWT 的结构

为证明SWT 的有效性,图2给出了数字音频的3级SWT 分解/重构示意。其中,图2(a)为原始音频,图2(b)为3级小波分解的低频子带,图2(c)~图2(e)分别为3级小波分解的尺度3、尺度2和尺度1高频子带,图2(f)为小波重构音频,图2(g)为小波重构音频与原始音频的差值。

图2 数字音频的3级非下采样小波分解/重构示意

观察图2可以看出,数字音频经过3级SWT 分解后再重构,重构波形与原始音频波形基本保持一致。

3 基于平滑梯度的音频特征点提取

特征点提取是基于载体内容局部特征的数字音频水印方案的关键环节之一。目前,可应用于数字音频水印领域的音频特征点检测算子包括样本峰值法、包络峰值法[14-22]。然而,以上音频特征点检测算子均直接采用音频样本值刻画局部数字音频性质,其不可避免存在2个方面的问题:一方面,特征点检测算子对音程跳跃幅度较大的“高”音调区很敏感,会在“高”音调区域检测出很多“噪声”特征点;另一方面,特征点过于集中在高频泛音充分的“尖”音色区。也就是说,利用现有检测算子所提取出的音频特征点,普遍存在稳定性差且分布极不均匀的问题,严重影响数字音频水印对DA/AD 转换、随机剪切、抖动等攻击的抵抗能力。尽管Dessein 等[27]结合最大似然参数估计理论,提出了一种基于广义似然比极值的数字音频特征点检测算法,但由于其所采纳的样本指数分布假设并不适合大多数实际音频,故该算法的音频特征点检测性能较低。此外,该特征点检测算法的时间复杂度较高,不利于实际应用。

本文将利用描述能力强且性能稳定的平滑梯度刻画局部数字音频性质,进而提出一种基于平滑梯度的平稳小波域音频特征点提取方法,可以很好地满足音频水印的要求。

假设A={a(x),1≤x≤L}表示原始数字音频信号,其中L为音频的样本数,a(x)∈{0,1,2,…,(2p-1)}表示每个样本的幅值,p表示每个样本的量化位数,则基于平滑梯度的音频特征点提取方法如下。

步骤1SW 变换。对原始载体音频A进行3级SWT 分解,以得到一个低频子带F和若干个高频子带。本文选取抗噪能力较强的低频子带提取音频特征点。

步骤2音频梯度计算。利用式(2),计算出低频子带F(x)={f1,f2,…,fx,…,fL}的一阶梯度其中,音频梯度值

步骤3平滑处理。利用式(3),对一阶音频梯度进行高斯滤波处理,以得到性能稳定的一阶平滑梯度

步骤4响应计算。利用一阶平滑梯度幅值,计算出原始音频样本a(x)的响应值R(x),并以此刻画局部数字音频性质。音频样本a(x)的局部响应值R(x)为

这里,b为任意常量,实验中b=0.5。

步骤5特征点提取。对音频样本响应值R(x)={r1,r2,…,rx,…,rL}进行降序排列得到PR={Pr_L,Pr_L-1,···,Pr_1},滤掉位于首尾两端的音频样本,确保有足够的空间可以嵌入完整水印信息,即不满足

其中,X代表相邻特征点之间的基本间距,本实验中,X=1.5×104。

以最高响应值Pr-x为基准设置阈值,滤掉与其相邻过近的特征点,从而确保提取出的特征点分布均匀,即不满足

其中,Pr_y∈{Pr_x-1,Pr_x-2,···,Pr_1},选取前Y个点Pr∈{P1,P2,···,PY}作为本方法的音频特征点即同步标记,本实验中,Y=13。

图3给出了本文特征点提取方法抵抗常规信号处理和去同步攻击的部分实验结果。其中,“○”表示正确提取,“●”表示错误提取(本实验中,特征点位置偏移5个样本以上即视为错误点)。

4 数字水印嵌入与检测算法

4.1 数字水印的嵌入

本文采用冗余嵌入策略,提出了一种基于稳健特征点的平稳小波域数字音频水印算法,水印嵌入的关键步骤可描述如下。

图3 各种攻击下的音频特征点提取

步骤1数字水印产生。由密钥K产生一个伪随机序列C={c(i),i=1,···,s}作为数字水印信息,其中,s为水印大小,c(i)∈{0,1}。

步骤2音频特征点提取。利用基于平滑梯度的平稳小波域音频特征点检测算子,从原始音频载体A中提取音频特征点,以得到音频特征点集Pr∈{P1,P2,···,PY}。

步骤3局部特征音频段构造。所谓局部特征音频段,是指以数字音频特征点为标识,从原始载体音频中分割出的一部分子音频,以其作为水印信号的嵌入和检测区域。本文局部特征音频段的具体构造过程如下。

1)将载体音频信号A进行降序排列,得到载体音频数据最大值Amax与最小值Amin,并归一化到[-1,1]的范围,具体计算式为

其中,Anorm是归一化后的音频信号。

2)对Anorm进行3级SWT 分解,以得到一个低频子带F1和若干个高频子带。

3)在低频子带F1下,以特征点Pr为标识,循环统计每个特征点Pr左右窗口长度为M范围内的能量和,用以代表特征点周围音频短时能量。于是,短时能量可表示为[24]

其中,En表示n时刻音频信号a1(n)的短时能量,w(n-m)表示窗函数,h(n)=w2(n),n=1+2M。本文选取的窗函数为汉宁窗w(n),即

其中,N表示窗长,特征点Pr周围的音频信号集可表示为

4)利用特征点短时能量集E∈{E1,E2,…,EY}再次计算

5)计算自适应局部特征音频段,其中,待嵌入水印音频段长度Dr=E1sK,s为水印大小,K为常数,Dr∈{D1,D2,···,DY}。于是,得到用于水印嵌入的局部特征音频段集为

步骤4数字水印嵌入。本文采用量化调制方法,数字水印的具体嵌入过程如下。

1)对载体音频信号A进行3级SWT 分解,以得到一个低频子带F和若干个高频子带。本文选取性能稳定的SWT 域低频子带嵌入水印信息。

2)在低频子带F内,依据特征点Pr和待嵌入水印音频段长度Dr找到对应的特征区域,并根据水印位的长度s对待嵌入水印的局部特征音频段进行分段,每段长度为可得到音频子段

3)量化调制音频子段a2内的t1个低频系数,每个音频子段嵌入一个水印位。首先根据水印信息的值,使用2种不同的抖动量化[25],自适应确定水印嵌入强度。

①当C=0时,抖动量化Q0为

②当C=1时,抖动量化Q1为

然后将水印信息利用STDM(spread transform dither modulation)量化方法嵌入音频子段,量化调制方法为[25]

其中,p为投影向量,为嵌入水印后的音频段。

4)用含水印音频子段内的低频系数代替原低频系数,并进行逆SWT,即可得到含水印局部特征音频段。

步骤5含水印音频获得。重复步骤1~步骤4,直到所有局部特征音频段都按照上述步骤处理完毕。最后,用含水印局部特征音频段替换原始的局部特征音频段,得到含水印数字音频Aw信号。

4.2 数字水印的检测

步骤1使用与嵌入过程相同的密钥K产生原始数字水印序列C={c(i),i=1,···,s}。

步骤2利用基于平滑梯度的平稳小波域音频特征点检测算子,从含水印数字音频Aw中提取音频特征点,以得到音频特征点集Prw∈{P1,P2,···,PYw}。

步骤3以所提取的音频特征点为标识,利用本文局部特征音频段构造方法,计算出短时能量E2,并根据E2计算出含水印特征音频段长度Drw=E2sK,s为水印大小,K为常数,Drw∈{D1,D2,···,DYw},从而得到用于水印提取的局部特征音频段集为

步骤4对含水印数字音频Aw进行3级SWT分解,并按照如下过程提取水印信息。

1)在低频子带Fw内,依据特征点Prw和含水印特征音频段长度Drw找到对应的特征区域,并根据水印位的长度s对待提取水印的局部特征音频段进行分段,每段长度为,得到音频子段∈(每个音频子段提取一个水印位)。

3)重复上述步骤,即可检测出局部特征音频段内所隐藏的数字水印序列为

重复步骤4,直到检测完所有局部特征音频段。只要有2个以上的局部特征音频段能够成功检测到水印信号,即可认为数字水印检测成功;否则,水印检测失败。

5 仿真实验与结论

本节分别给出了检测性能测试以及抗攻击能力测试的仿真实验结果。实验中,选用采样频率为44.1 kHz、量化精度为16 bit、长度为15 s 的单声道数字音频信号作为原始载体,数字水印采用了128位的伪随机序列。另外,量化步长Δ=73,检测阈值Ts=24(即虚警率PF-A ≈5×10-4)。

5.1 不可感知性测试

图4给出了本文算法的不可感知性能测试结果,包括原始音频、含水印音频、差值音频。从图4(a)与图4(b)中可以明显看出,原始音频与含水印音频的波形区别很小,而差值图4(c)也充分证明了这一观点。另外,本文算法的PSNR 值为39.8312 dB,客观结果充分证明了本文算法的不可感知性良好。

图4 数字音频水印的不可感知性能测试结果

5.2 稳健性测试

为了验证本文数字音频水印算法的稳健性能,仿真实验分别对本文算法和文献[19-21]算法的含水印音频进行了一系列攻击。其中,文献[19-20]算法均是利用了平滑梯度刻画了局部数字音频性质,针对如何有效解决数字音频水印算法的局部去同步攻击问题展开研究,因此本文首先与文献[19-20]算法进行了性能比较。文献[21]算法为较新的具有代表性的基于扩频水印扩频码相结合的数字音频水印方法。图5和图6分别给出了本文算法抵抗常规信号处理和去同步攻击的实验结果。其中,分子表示从攻击后含水印数字音频中成功检测到水印信号的局部特征音频段数目,分母表示原始载体音频中嵌有水印信号的局部特征音频段数目。这里,定义每个完整水印信息正确提取位数多于,即视为该自适应特征音频段的水印被正确提取。本实验中,利用RCES(the ratio of correctly extracted segment)表示自适应特征音频段水印的正确提取率,正确提取的含水印局部特征音频段选用浅色填充“”,错误提取的含水印局部特征音频段选用深色填充“”。表1和表2、图7和图8给出了本文算法和文献[19-21]算法的稳健性能对比。

表1和表2给出了各种攻击下本文算法与文献[19-20]的对比结果,图7和图8显示了本文算法与文献[21]算法在相同原始音频载体条件下,抵抗常规攻击和去同步攻击的对比结果。从对比结果可以看出,本文算法实验结果整体好于文献[19-21],进一步证明了本文算法具有良好的稳健性。

图5 本文算法抵抗常规音频信号处理的实验结果

图6 本文算法抵抗去同步攻击的实验结果

表1 本文算法和文献[20]算法的稳健性能对比结果

表2 本文算法和文献[19]算法的稳健性能对比结果

图7 本文算法和文献[21]算法的稳健性能对比结果(’Piano.wav’)

6 结束语

数字水印是解决数字作品版权保护与内容认证的有效办法之一,稳健性是数字水印算法的重要性能指标之一。但现有绝大多数音频水印在经受去同步攻击后难以生存。因此,研究可有效抵抗去同步攻击的强稳健数字音频水印理论与方法仍是一项富有挑战性的工作。本文提出了一种基于稳健特征点的平稳小波域音频水印算法,实验结果表明,本文数字音频水印算法不仅具有较好的不可感知性,而且对常规音频信号处理(包括重采样、重量化、MP3压缩、均衡化等)和去同步攻击(包括随机剪切、幅度伸缩、局部变调、抖动等)均具有较好的稳健性。

图8 本文算法和文献[21]算法的稳健性能对比结果(’Heart.wav’)

猜你喜欢

数字水印子带数字音频
超高分辨率星载SAR系统多子带信号处理技术研究
一种基于奇偶判断WPT的多音干扰抑制方法*
基于遗传优化的自然语言文本数字水印方法
子带编码在图像压缩编码中的应用
基于网屏编码的数字水印技术
高分辨率机载SAR多子带合成误差补偿方法
数字音频广播业务和航空无线电导航业务的兼容研究测试
基于FPGA的多协议数字音频信号发生方法
数字水印技术及其在电力系统中的应用
一种基于三维小波变换的鲁棒视频水印方案