基于降维共生特征的JPEG通用隐写分析*

2015-01-04李薇欧继山张舒

火力与指挥控制 2015年12期

关键词：降维分类器共生

李薇，欧继山，张舒

（海军工程大学理学院，武汉430033）

基于降维共生特征的JPEG通用隐写分析*

李薇，欧继山，张舒

（海军工程大学理学院，武汉430033）

针对JEPG图像隐写检测问题，提出了一种基于降维共生特征和单类分类器的通用隐写分析方法。采用共生矩阵挖掘图像DCT块内、块间以及图像小波层内、层间相邻系数的相关性特征，并对特征进行校准和LPP降维处理，利用SVDD分类器进行训练和分类。实验结果表明：该方法相比传统二类隐写分析方法，具有更强的泛化能力，检测率相比几种单类隐写分析方法有明显提高；而且，LPP降维相比PCA降维对提高算法的分类精度具有更好的效果。

隐写分析，共生矩阵，支持向量数据描述，局部保持投影

0 引言

隐写分析是隐写术的逆向技术，利用隐写过程不可避免地会改变载体数据的统计特性这一事实，对可能隐藏在载体中的秘密信息进行检测，在防止隐写工具滥用、维护网络完全等方面具有重要的现实意义。由于JPEG图像在互联网中被广泛的使用并且具有很高的数据冗余性，以JPEG图像为载体的隐写术和相应的隐写分析技术已经成为研究的热点［1］。

隐写分析可分为专用隐写分析［2］和通用隐写分析［3］两类：前者针对某一特定的隐写术设计检测器，但是对其他隐写术无能为力；后者则不然，通过挖掘载体图像和载密图像之间的统计差异构造特征向量集，结合分类器进行训练，实质上是多维特征空间的模式分类器，因此，具有更强的通用性，应用也更为广泛。Farid等［4］根据这种模式分类的思想，提取小波高阶统计特征进行分类器训练，实现了JPEG隐写术的通用检测。罗向阳等［5］在这基础上改用小波包分解，提高了检测性能。张敏情等［6］利用马尔可夫模型挖掘小波系数层内和层间的相关性，提出了一种空域通用隐写分析方法，但没有对JPEG隐写术进行分析。Penvy等［7］提取空域和DCT域共274维特征，采用支持向量机进行训练，能有效检测F5、MB等多种隐写术。Chen等［8］采用Markov模型来挖掘DCT块内和块间的相关性特征，而Kodovsky等［9］改用共生矩阵来反映DCT系数的相关性，并设计了快速的集成分类器进行训练，效果优于文献［7-8］。进一步，他们还提出了空域通用隐写分析的复合模型［10］，并将复合模型推广到JPEG通用隐写分析［11］，取得非常好的检测效果，缺点是特征维数较高。

文献［4-11］均采用二类分类器进行训练，需要载体图像和载密图像两类训练样本。由于训练样本无法涵盖所有的隐写术，这类方法对未训练的隐写术的检测效果有时不理想，无法有效检测未知或未公开的隐写术。针对这一不足，Lyu等［12］提出了采用单类分类器进行隐写判别的新思路，利用OC-SVM对载体图像的小波高阶统计特征进行训练。进一步的，郭艳卿等［13］设计集成的多超球面OC-SVM分类器，提出了一种基于共生特征的JPEG通用检测方法，效果优于文献［12］。毛家发等［14］提取纹理特征和虚特征值分解特征对载体图像进行描述，设计了一种与特征匹配的超椭球体单类分类器进行隐写判别。此外，他们还建立DCT系数对称α稳态分布模型，利用B氏距离构造隐写特征，提出了一种新的单类隐写分析方法［15］，但对Outguess等直方图补偿隐写算法检测率较低。文献［12-15］提出的单类隐写分析方法取得了一定的检测效果，但仍然存在一些不足之处：①特征不够敏感。Outguess等隐写术能保证图像的一阶统计特性基本不发生变化，提取图像的高阶统计特征，能有效提高算法的检测效果。同时，Fridrich等［16］指出，图像校准技术能显著提高特征的有效性。可以考虑对提取的特征进行校准，降低图像内容对特征的影响，从而使特征能更敏感的捕获隐写前后图像的统计变化；②特征空间缺乏多样性。不同类型（空域或频域）的隐写术对载体图像统计特性的改变一般存在较大差异，从单一的DCT域或DWT域提取特征具有一定的局限性，融合多域的特征能更全面地对载体图像进行描述，从而提高算法的通用性和检测率；③特征空间冗余度较高。高维的特征空间具有较大的特征冗余度，影响了分类器的检测性能，结合特征降维方法对特征空间进行降维，可以使特征空间更加紧凑和高效，在降低算法时间复杂度的同时提高分类精度［17］。

结合以上想法，本文提出了一种基于DCT域和DWT域相关性特征的单类JPEG通用隐写分析方法。首先利用共生矩阵挖掘DCT块内、块间系数的相关性特征以及小波系数层内、层间的相关性特征，通过校准技术得到324维共生特征；然后利用局部保持投影方法对校准特征进行降维处理，最后采用SVDD分类器进行训练和分类。

1 特征空间设计

1.1 图像共生特征的计算

图像共生特征是图像的二阶统计特征，利用图像两个位置的联合概率密度来定义，反映了图像的统计相关性，在隐写分析中被广泛应用于设计对嵌入操作敏感的特征空间。对大小为M×N的图像矩阵D（D为图像空域的像素矩阵或频域的系数矩阵），其共生特征可以通过如下步骤计算得到：

首先，计算水平、竖直、对角线和反对角线4个方向上相邻系数的差分矩阵：

然后，考虑到差分矩阵中大部分元素的绝对值较小，引入阈值T对Ah、Av、Ad、Am进行阈值处理得到新的差分矩阵分别计算相应的共生矩阵：

其中：u，v∊{-T，…，T}，δ（x，y）=1当且仅当x= y，否则为0。最后定义以上4个共生矩阵D的均值为矩阵D的共生特征，维数为（2T+1）×（2T+1）：

1.2 DCT域共生特征

JPEG图像DCT块内的相邻系数和相邻块间的系数均具有很强的相关性［7］，在隐写操作之后这种相关性不可避免会被破坏，本文采用共生矩阵挖掘DCT系数块内和块间的相关性，以捕获图像隐写前后统计相关性发生的变化。

1.2.1 块内相关性特征

1.2.2 块间相关性特征

1.3 DWT域共生特征

实际上，JPEG隐写术除了改变DCT系数的统计特性，同样也会造成小波系数的统计特性发生变化，文献［5］就是提取小波高阶统计量进行隐写分析，对F5、Jsteg等JPEG隐写术取得了较高的检测率。在本文中，先对图像像素矩阵进行Harr小波分解，再利用共生矩阵挖掘小波系数层内和层间的相关性特征。

1.3.1 层内相关性特征

先将图像解压至空域，对任一颜色通道T∊{R，G，B}，进行2级Haar小波分解，记H1、V1、D1、H2、V2、D2分别为LH1、HL1、HH1、LH2、HL2、HH2的子带系数矩阵。由式（1）～式（9）计算每个子带系数矩阵的共生特征CH1、CV1、CD1、CH2、CV2和CD2，求其平均值作为T颜色通道中小波系数的层内相关性特征：

再取3个颜色通道层内相关性特征的均值作为图像小波系数的层内相关性特征：

1.3.2 层间相关性特征

其中：u，v∊{-T，…，T}，［·］表示取整，M'，N'分别为矩阵1的行、列数。进一步定义T颜色通道小波系数的层间相关性特征为：

同理，定义3个颜色通道的层间相关性特征的均值作为图像小波系数的层间相关性特征：

1.4 阈值确定

图1 不同阈值范围所占系数的比例

2 特征降维

根据前面的分析，本文324维校准特征都是通过计算图像的共生矩阵得到，特征内部不同维度之间的分布具有一定相关性，存在一定的特征冗余。为了减弱这种特征冗余性，传统做法是采用线性回归或主成分分析（PCA）等方法对特征进行降维，虽然提高了算法的计算速度，但对分类精度提高的幅度非常有限，文献［17］在PCA降维处理后检测率最高仅提高了1%～4%。这是因为特征之间的相关性具有非线性的特点，传统的PCA等降维方法都是线性的，不能准确反映特征的这种非线性关系，同时忽略了特征之间的局部信息。本文针对线性降维方法存在的不足，采用局部保持投影（LPP）［18］方法对特征空间进行降维。LPP方法是非线性方法Laplacian Eigenmap的线性近似，保持了数据中近邻点之间的结构，可以很好地保留数据的局部信息，同时解决了PCA等传统线性方法难以保持原始数据非线性流形的缺点。因此，采用LPP降维，可以使特征更加准确地反映载体图像和载密图像之间的统计差异，提高算法的检测性能。

LPP方法的目标是寻找一个转换矩阵将高维空间RP中的特征向量投影到低维空间RQ（Q＜P）中，使得在高维空间中互为近邻的两点投影到低维空间后仍互为近邻。可以通过以下步骤实现降维：

（1）记N幅JPEG图像对应的特征矩阵为M∊RN×P，采用k近邻法或ε近邻法计算权值矩阵S（其中k为正整数，t为参数，ε是一足够小的正数，定义了局部邻域的半径）：

（2）最小化如下目标函数得到局部投影矩阵W：

记D=diag（s11，…，sNN），L=D-S，则式（20）可以转换为如下的广义特征值求解问题：

取式（22）中Q个最小的非0特征值对应的特征向量就可以构成局部投影矩阵W∊RP×Q；

（3）将特征矩阵M做局部投影变换得到MLPP=MW，特征维数就从P维降至Q维。

3 实验结果与分析

3.1 实验准备

本文采用SVDD分类器［19］进行训练，它仅需载体图像一类训练样本，并不针对任何具体的隐写术。

从UCID、NRCS以及自己拍摄制作的图像库中选取5 500幅未压缩的彩色图像，图像大小均为512×384或384×512，4 500幅用于构建训练图像库，其余1 000幅用于构建测试图像库，所有JPEG图像的质量因子均为80。

由于在不同的阴性检测率（True Negative Rate，TNR）下，算法的阳性检测率（True Positive Rate，TPR）也不同，且两者呈现负相关的关系。为了准确评价算法的检测性能，定义阴性检测率和阳性检测率的均值的最大值为平均检测率（Accuracy Rate，AR），作为算法检测性能的指标：平均检测率越高，算法的检测性能越好。计算公式为：

3.2 特征降维对检测性能的影响

PCA方法在均方误差最小准则下获得数据压缩的最佳KL变换，是一种线性的降维方法。为了定量分析PCA降维和LPP降维对隐写分析算法检测性能的影响，对本文特征空间进行实验，利用PCA方法和LPP方法分别将特征空间降维至4～324维后再进行检测实验，部分实验结果如图2所示。在没有降维的情况下平均检测率分别为78.3%和78.6%，如图2中虚线所示。

图2 特征降维对检测率的影响

3.3 不同方法检测性能比较

为了进一步说明本文方法的检测性能，与其他几种检测方法进行比较：Penvy274［7］、Chen486［8］、Mao2［15］和Mao7［14］。采用以上4种检测方法和本文方法进行实验，其中Penvy274和Chen486方法对Outguess、Steghide、Jphs 3种隐写术进行训练，而不训练其他4种隐写术（即将Outguess、Steghide、Jphs作为“已知”隐写术，而将F5、MB、MME和nsF5作为“未知”隐写术，目的是比较不同算法对未知隐写术的泛化能力）；Mao2、Mao7和本文方法仅对载体图像样本进行训练，对测试图像库的部分检测结果如下页表1所示。

4 结束语

本文利用共生矩阵挖掘DCT域块内、块间相邻系数和DWT域层内、层间相邻系数的二阶统计特性，经过图像校准得到324维特征，并对特征空间进行LPP降维处理，采用SVDD分类器进行隐写判别。实验结果表明，本文方法具有较强的泛化能力，同时，通过局部保持投影降维处理，使特征空间更加紧凑和敏感，提高了算法的分类精度和计算速度，性能优于传统的PCA降维方法。

表1 不同方法对“未知”隐写术的检测结果（%）

［1］Li B，He J H，Huang J W，et al.A Survey on Image Steganography and Steganalysis［J］.Journal of Information Hiding and Multimedia Signal Processing，2011，2（2）：142-172.

［2］刘静，汤光明.基于图像像素划分的主动隐写分析［J］.电子与信息学报，2012，34（8）：1928-1933.

［3］Luo X Y，Wang D S，Wang P，et al.A Review on Blind Detection for Image Steganography［J］.Signal Processing，2008，88（9）：2138-2157.

［4］FaridH，LyuS.DetectingHiddenMessagesusing Higher-order Statistics and Support Vector Machines［C］// Processingof5thInformationHidingWorkshop，Netherlands，2002.

［5］罗向阳，刘粉林，王道顺.基于小波包分解的图像信息隐写言检测［J］.通信学报，2008，29（10）：173-182.

［6］张敏情，雷雨.基于小波系数相关性的空域隐写分析方法［J］.光电子·激光，2012，23（5）：972-979.

［7］Penvy T，Fridrich J.Merging Markov and DCT Features for Multi-class JPEG Steganalysis［C］//Processing of SPIE ElectronicImaging，Security，Steganography，andWatermarking of Multimedia Contents IX，San Jose，2007.

［8］Chen C H，Shi Y Q.JPEG Image Steganalysis Utilizing Both Intrablock and Interblock Correlations［C］//Processing of the IEEE International Symposium on Circuits and Systems，Seattle，2008：3029-3032.

［9］Kodovsky J，Fridrich J，Holub V.Ensemble Classifiers for Steganalysis of Digital Media［J］.IEEE Transactions on Information Forensics and Security，2012，7（2）：432-444.

［10］Fridrich J，Kodovsky J.Rich Models for Steganalysis of Digital Images［J］.IEEE Transactions on Information Forensics and Security，2012，7（3）：868-882.

［11］Kodovsky J，Fridrich J.Steganalysis of JPEG Images using Rich Models［C］//Processing of SPIE Media Watermarking，Security，and Forensics，Burlingame，2012.

［12］Lyu S，Farid H.Steganalysis using Color Wavelet Statistics and One-class Vector Support Machines［C］//Proceedings of SPIEElectronicImaging，Security，Steganalysisand Watermarking of Multimedia Contents VI，San Jose，2004.

［13］郭艳卿，孔祥维，尤新刚.基于共生特征和集成多超球面OC-SVM的JPEG隐密分析方法［J］.电子与信息学报，2009，31（5）：1180-1184.

［14］毛家发，林家骏.基于净图描述的通用隐写分析技术［J］.计算机学报，2010，33（3）：569-579.

［15］毛家发，钮心忻，杨义先，等.基于JPEG净图定量描述的隐写分析方法［J］.电子学报，2011，39（8）：1907-1912.

［16］Kodovsky J，Fridrich J.Calibration Revisited［C］//Proceedings of the 11th ACM Multimedia&Security Workshop，New York，2009.

［17］黄炜，赵险峰，冯登国，等.基于主成分分析进行特征融合的JPEG隐写分析［J］.软件学报，2012，23（7）：1869-1879.

［18］He X F，Niyogi P.Locality Preserving Projections［C］// Proceedings of Advances in Neural Information Processing Systems，British Columbia，2003：153-160.

［19］Tax D，Duin R.Support Vector Data Description［J］. Machine Learning，2004，54（1）：45-66.

JPEG Universal Steganalysis Based on Dimensionality-Reduced Co-occurrence Features

LI Wei，OU Ji-shan，ZHANG Shu
（School of Science，Naval University of Engineering，Wuhan 430033，China）

A universal approach based on dimensionality-reduced co-occurrence features and oneclass classifier is proposed for steganalysis of JPEG images.The co-occurrence matrix is used to capture both the intra-block and inter-block correlation features among neighboring DCT coefficients as well as the intra-scale and inter-scale correlation features among neighboring DWT coefficients. Then the calibrated features are progressed by LPP dimensionality reduction techniques and a SVDD classifier is utilized to train and classify them.Experimental results show that the method performs better at detecting capability comparing to the traditional two-class steganalysis schemes and its detection rate is significantly higher than several novel single-class steganalysis schemes at present. Furthermore，LPP is much better than PCA for improving the algorithm’s classification accuracy.

steganalysis，co-occurrence matrix，Support Vector Data Description（SVDD），Linearity Preserving Projection（LPP）

TP391

1002-0640（2015）12-0013-05

2014-12-18

2015-01-27

国家自然科学基金（61074191）；海军工程大学自然科学基金资助项目（HJGSK2014G120）

李薇（1970-），女，江苏仪征人，副教授，硕士生导师。研究方向：信息隐藏算法设计。