基于扩频DCT变换的数字音频水印算法

2015-03-15王晓盼

通信电源技术 2015年6期

王晓盼，王梅，王洁

（河北科技大学信息科学与工程学院，河北石家庄050000）

0 引言

数字音频水印技术就是将标志版权所有者信息的标识（如图像、音频、文字以及作品的相关信息），在不影响原始音频载体的前提下嵌入到数字音频载体上，嵌入之后水印信息和音频信息结合在一起，通常水印是不可感知的，能够抵抗各种非正常攻击的干扰。本文给出了基于DCT域的数字音频水印算法，采用扩频技术对水印信号进行预处理，并选用DCT域的中频系数作为水印嵌入位置，按照水印和音频1∶8的比例进行水印的嵌入［1］，同时实现水印的非盲提取。

1 算法原理

1.1 扩频技术

为了进一步提高水印图像的抗干扰能力，利用伪随机序列（PN码）对水印图像进行扩频调制。PN码的自相关特性和白噪声类似，是由0和1组成的编码序列。

1.2 离散余弦变换(DCT)

音频信号是一维的，可以采用一维DCT变换对数字音频信号进行处理。由于DCT变换除了具有正交变换的性质外，它的变换域还能很好的描述语音信号的相关特性，所以说DCT变换被认为是准最佳变换。

在数字音频处理中应用一维DCT，对于一维信号f（x），其DCT和IDCT［2］变换为：

一维DCT变换的正交核定义为：

式中，u，x=0，1，2，…，N-1。

对应的离散余弦变换表示为：

式中，u，x=0，1，2，…，N-1。

一维DCT的逆变换IDCT定义为：

式中，u，x=0，1，2，…，N-1。

可见一维DCT的逆变换核与正变换核是相同的。

2 数字音频水印算法

数字音频水印（Digital Audio Watermarking）算法就是将标志版权所有者的一些隐秘信息（即水印信息）在不影响原始音频的前提下，通过一定的方式嵌入到数字音频载体上。嵌入的水印信息与数字音频载体紧密结合并隐藏在其中，通常水印是不可感知的且不会影响原始音频载体的自身使用价值，能够抵抗各种非正常的攻击，也不容易被非法检测和修改重构，即具有较强的鲁棒性和安全性。本文采用大小为64×64的二值灰度图像作为水印信号，原始音频信号为单声道、长度为40 s、采样率为32 k Hz、量化位数为16 bit。

2.1 水印嵌入

水印嵌入的步骤如下：

（1）对大小为64×64的二值灰度水印图像进行降维处理，得到一维水印序列；

（2）为了进一步提高抗干扰能力，利用PN码对降维后的水印序列进行扩频处理；

（3）对原始数字音频信号作分段处理，即待嵌入水印音频信号（Ae）和与水印嵌入无关部分（Ar）；

（4）在原始数字音频信号中嵌入水印图像：

a.对待嵌入水印音频信号作离散余弦变换（DCT）；

b.在离散余弦变换域内确定数字音频信号的中频系数［3，7］；

c.修改选定的中频系数，利用加法策略嵌入水印［4，8］，按照水印和音频为1：8的比例进行水印的嵌入；

d.对嵌入水印序列元素的音频信号进行离散余弦反变换（IDCT），得到含有水印信息的音频信号部分；

e.将含有水印信息的音频信号部分代替原始的音频信号，得到了含有水印信息的数字音频信号。

2.2 水印提取

水印提取时需要原始音频信号，实现水印信息的非盲提取：

（1）对于待提取水印的音频信号分段为（Te和Tr）和原始音频信号分段为（Ae和Ar）；

（2）在离散余弦变换域内利用基于阈值的方法提取出水印序列［5］；

（3）对提取出的水印序列进行解扩频和解密处理；

（4）将解密后的水印图像进行升维处理，最终得到提取的水印图像。

图1、图2为数字音频水印嵌入和提取原理框图。

图1 水印图像的嵌入

图2 水印图像的提取

3 攻击实验结果分析

3.1 试验参数

实验中采用大小为64×64的二值灰度图像作为水印信号，原始音频信号为单声道、长度为40 s、采样率为32 k Hz、量化位数为16 bit。将水印图像嵌入到音频载体离散余弦变换后的中频系数上，在Matlab2008a上运行，对于提取出的恢复水印图像，用峰值信噪比（PSNR）和归一化相关系数（NC）［6］比较以评价文中算法的稳健性。PSNR和NC的表达式分别为：