基于扩频DCT变换的数字音频水印算法
2015-03-15王晓盼
王晓盼,王 梅,王 洁
(河北科技大学信息科学与工程学院,河北石家庄050000)
0 引 言
数字音频水印技术就是将标志版权所有者信息的标识(如图像、音频、文字以及作品的相关信息),在不影响原始音频载体的前提下嵌入到数字音频载体上,嵌入之后水印信息和音频信息结合在一起,通常水印是不可感知的,能够抵抗各种非正常攻击的干扰。本文给出了基于DCT域的数字音频水印算法,采用扩频技术对水印信号进行预处理,并选用DCT域的中频系数作为水印嵌入位置,按照水印和音频1∶8的比例进行水印的嵌入[1],同时实现水印的非盲提取。
1 算法原理
1.1 扩频技术
为了进一步提高水印图像的抗干扰能力,利用伪随机序列(PN码)对水印图像进行扩频调制。PN码的自相关特性和白噪声类似,是由0和1组成的编码序列。
利用扩频技术的数字音频水印算法就是在宿主信号中传送水印信息,宿主信号为音频,可以把音频视作宽带的信道,水印信号是标识版权所有者的信息,视为窄带信号。数字音频水印算法利用了扩频通信的思想,即将水印的频谱进行扩展,在一个宽带信道中传送频谱扩展的水印信号。
1.2 离散余弦变换(DCT)
音频信号是一维的,可以采用一维DCT变换对数字音频信号进行处理。由于DCT变换除了具有正交变换的性质外,它的变换域还能很好的描述语音信号的相关特性,所以说DCT变换被认为是准最佳变换。
在数字音频处理中应用一维DCT,对于一维信号f(x),其DCT和IDCT[2]变换为:
一维DCT变换的正交核定义为:
式中,u,x=0,1,2,…,N-1。
对应的离散余弦变换表示为:
式中,u,x=0,1,2,…,N-1。
一维DCT的逆变换IDCT定义为:
式中,u,x=0,1,2,…,N-1。
可见一维DCT的逆变换核与正变换核是相同的。
2 数字音频水印算法
数字音频水印(Digital Audio Watermarking)算法就是将标志版权所有者的一些隐秘信息(即水印信息)在不影响原始音频的前提下,通过一定的方式嵌入到数字音频载体上。嵌入的水印信息与数字音频载体紧密结合并隐藏在其中,通常水印是不可感知的且不会影响原始音频载体的自身使用价值,能够抵抗各种非正常的攻击,也不容易被非法检测和修改重构,即具有较强的鲁棒性和安全性。本文采用大小为64×64的二值灰度图像作为水印信号,原始音频信号为单声道、长度为40 s、采样率为32 k Hz、量化位数为16 bit。
2.1 水印嵌入
水印嵌入的步骤如下:
(1)对大小为64×64的二值灰度水印图像进行降维处理,得到一维水印序列;
(2)为了进一步提高抗干扰能力,利用PN码对降维后的水印序列进行扩频处理;
(3)对原始数字音频信号作分段处理,即待嵌入水印音频信号(Ae)和与水印嵌入无关部分(Ar);
(4)在原始数字音频信号中嵌入水印图像:
a.对待嵌入水印音频信号作离散余弦变换(DCT);
b.在离散余弦变换域内确定数字音频信号的中频系数[3,7];
c.修改选定的中频系数,利用加法策略嵌入水印[4,8],按照水印和音频为1:8的比例进行水印的嵌入;
d.对嵌入水印序列元素的音频信号进行离散余弦反变换(IDCT),得到含有水印信息的音频信号部分;
e.将含有水印信息的音频信号部分代替原始的音频信号,得到了含有水印信息的数字音频信号。
2.2 水印提取
水印提取时需要原始音频信号,实现水印信息的非盲提取:
(1)对于待提取水印的音频信号分段为(Te和Tr)和原始音频信号分段为(Ae和Ar);
(2)在离散余弦变换域内利用基于阈值的方法提取出水印序列[5];
(3)对提取出的水印序列进行解扩频和解密处理;
(4)将解密后的水印图像进行升维处理,最终得到提取的水印图像。
图1、图2为数字音频水印嵌入和提取原理框图。
图1 水印图像的嵌入
图2 水印图像的提取
3 攻击实验结果分析
3.1 试验参数
实验中采用大小为64×64的二值灰度图像作为水印信号,原始音频信号为单声道、长度为40 s、采样率为32 k Hz、量化位数为16 bit。将水印图像嵌入到音频载体离散余弦变换后的中频系数上,在Matlab2008a上运行,对于提取出的恢复水印图像,用峰值信噪比(PSNR)和归一化相关系数(NC)[6]比较以评价文中算法的稳健性。PSNR和NC的表达式分别为:
式中,MAX为图像灰度级数,通常为255。
式中,w(i,j)为原始水印图像;w′(i,j)为提取的水印图像;M1×M2为水印图像的大小。
3.2 仿真实验图
原始音频信号和嵌入水印后的音频信号以及嵌入和未受攻击时提取的水印图像如图3所示,此时PSNR=18.6417,NC=0.9351。实验中还对嵌入水印图像的音频信号进行常见的攻击实验,实验结果如图4所示。
通过实验检验水印算法鲁棒性,图4(f)所示为对嵌入水印后的音频信号进行攻击后提取出的水印。攻击实验对应的PSNR和NC,说明水印的鲁棒性,如表1所示。
图3 原始水印和提取水印以及原始音频信号和嵌入水印的音频信号的波形图
图4 常见的攻击实验
表1 攻击实验数据
从表1中可以看出,NC值接近于1,PSNR值较高,而低通滤波、上采样还有dct压缩等攻击实验的NC值都接近1,说明了文中算法水印的鲁棒性好。
综上所述,在水印嵌入音频信号后,人耳感知不到明显的失真,即具有不可感知性;在水印嵌入前先对其进行扩频加密处理,目的是增强其抗干扰能力;在水印提取时要正确的密钥才可以把水印顺利地提取出来;对于攻击实验有较好的鲁棒性。
4 结 论
本文给出了一种基于DCT域数字音频水印算法,采用扩频技术对水印图像进行预处理提高其抗干扰能力,选用DCT域的中频系数作为水印嵌入位置,按照水印和音频1:8的比例进行水印的嵌入。实验结果表明该算法有较好的不可感知性和鲁棒性;同时对于水印图像进行扩频加密处理,提高了水印的安全性。
[1]谈华斌.数字音频水印算法的研究[D].吉林:吉林大学,2004.
[2]姚 磊,王 冰.一种基于DCT中频的数字水印算法[J].计算机技术与发展,2008,18(1):192-195.
[3]Mauro B,Franco B,Vito C,et al.A DCT-domain system for robust image watermarking[J].Singnal Processing,1998,66(3):357-372.
[4]黄继武,SHI Y Q,程卫东.DCT域图像水印:嵌入对策和算法[J].电子学报,2000,28(4):57-60.
[5]李 慧.基于变换域的数字音频零水印算法研究[D].江西:江西理工大学,2013.
[6]闫丽君,康宝生,岳晓菊.改进的基于DCT的自适应水印算法[J].计算机工程与应用,2011,47(8):197-200.
[7]刘雪梅,苏广州.基于扩频序列嵌入水印的音频信号[J].重庆邮电学院学报(自然科学版),2006,(1):9.
[8]刘 芳.基于离散小波变换的音频数字水印研究[D].北京:北京化工大学,2010.