基于奇异值优化的图像复制粘贴篡改检测算法

2015-01-16李文龙

电子设计工程 2015年11期

李文龙，高尚

（江苏科技大学计算机科学与工程学院，江苏镇江 212003）

在数字媒体技术和计算机技术迅速发展的今天，各种图像处理软件变得越来越普及，人们可以方便的对图像进行加工和处理，而且处理后的图像逼真肉眼难以察觉。倘若这些篡改后的图像被不法分子加以利用，将造成不可估量的后果和影响。因此，针对检测数字图像真伪的技术研究变得迫在眉睫。

数字图像的真伪鉴别方法可以分为两类：主动式认证方法和被动式认证方法。在图像内容创建或生成时，通过事先嵌入相关验证信息的认证技术叫做主动认证，主要包括数字水印技术[1]和数字签名技术[2]等；通过分析图像固有属性或特征的鉴定技术称为被动取证。主动认证方法的研究起步早，较成熟，但是存在严重的缺陷，如：需要预先嵌入验证信息、破坏了原来图像、对攻击敏感等，从而导致其应用大大的受到限制。而被动取证技术，又称盲取证技术[3]可以在不需要获得图像的预处理信息（水印或签名）的前提下，仅仅利用图像本身的相关特性就可以达到认证的目的。这是图像取证领域的一种新技术，由于该种技术目前仍处在初级阶段，因此，许多被提出的检测方法都存在不足之处，需要进一步研究解决的问题还很多。

有很多种图像篡改方式，如图像重采样、JPEG双压缩、模糊润饰等，而本文只针对其中最常见的一种——复制-粘贴篡改。这种篡改方式将图像中的一部分区域复制粘贴到同幅图像的不重叠的另一个区域将原来区域覆盖，以此达到隐藏某目标或新增对象以欺骗他人的目的。最先研究复制-粘贴篡改检测的是Fridrich等[4]人，他们提出的DCT量化系数检测方法把像素点操作转化为图像块操作，在很大程度上提高了算法检测效率，但实际上计算量还是很大；Popescu和Farid等[5]人采用主成分（PCT）分析法仅提取图像块的主要特征，进一步的提高了算法检测效率，但是算法的鲁棒性不强；骆伟祺等[6]人提出一种鲁棒的检测算法，虽然有效对抗篡改后处理操作，但同样检测时间复杂度高；王俊文等[7]提出一种基于几何不变矩特征的检测算法，通过提取图像块几何不变矩特征实现篡改检测，具有较好的鲁棒性，但检测效率仍有待提高。

为了进一步减少计算量，提高检测效率，本文提出了基于改进后的奇异值分解的图像复制粘贴篡改检测算法。该算法利用奇异值的自身特性对其进行优化，在不影响检测效果的前提下，降低特征向量的维数，达到提高检测效率的目的。此外，本算法在确定篡改区域时加入特征向量相似度判别的操作，以使得检测结果更准确。

1 算法思想和流程

1.1 算法思想

本文的算法以离散小波变换和奇异值分解为基础，首先对待检测图像进行DWT离散小波变换，提取图像低频分量，缩小图像尺寸。然后对图像进行滑窗分块操作，使用奇异值分解方法来提取图像块特征向量。

奇异值分解定理[8]：设A是m×n实矩阵（不失一般性，设m≥n），则存在m阶正交矩阵U，n阶正交矩阵V，使得

其中，Λ 为对角矩阵，Λ=diag（λ1，λ2，…，λr，0，…，0），满足λ1≥λ2≥…≥λr＞0，r是矩阵 A 的秩，λi（i=1，…，r）为矩阵 A 的奇异值，式（1）叫做矩阵的奇异值分解。奇异值特征矢量中前几个值比较大，它们包含了矩阵A的大部分信息。因此，在实际应用中可以舍弃后面一些不重要的奇异值，以降低计算量。

矩阵A的秩为r，则其存在r个不为零的奇异值。按从大到小的顺序，我们将其分为前面k个和后面r－k个奇异值。由于后r－k个奇异值较小，只包含少量信息，而前面k个奇异值大，包含了大部分信息，因此前面k个奇异值起主要作用，故可以忽略后面r－k个奇异值。关于k值如何选取的问题，本文采用的是最高贡献率原则，其表示如式（2）所示，0<η<1。

在奇异值分解后，对得到的特征矩阵进行字典排序。以往算法直接默认经字典排序后特征矩阵中相邻的两个向量是满足相似度匹配条件的，但在实际情况中，由于有些图像存在大量纹理相近或者光滑均匀的区域，比如天空、海洋、草地等，如果仅仅依靠字典排序的方式判别向量相似性会产生许多误差。因此，本文算法在对特征矩阵遍历时，同时比较相邻两特征向量的相似度和图像块对的位移距离，只有同时满足向量相似度条件和位移阈值条件的图像块，才被认为是可疑的篡改块。最后，对可疑篡改区域进行面积阈值判别并用数学形态学方法进行后处理，去除孤立点，得出最终篡改区域。

1.2 算法步骤

本文算法检测流程如图1所示。

算法步骤详细描述如下：

1）对检测图像进行DWT离散小波变换：假设待检测图像I的大小为M×N，对图像进行j级DWT变换，本文选取的是最简单的haar小波进行实验，然后提取变换后图像的低频分量 LL，其大小为（M/2j）×（N/2j）。

图1 检测算法流程图Fig.1 Process of detection algorithm

2）对低频分量LL进行滑窗分块：用b×b大小的窗口模块在尺寸为（M/2j）×（N/2j）的图像低频分量上滑动来提取图像子块。每次滑动一个像素，滑动顺序是从左往右、从上往下的，提取出的图像重叠子块 Ai，i=1，2， …，（M/2j－b+1）×（N/2j－b+1），则所得图像子块总数为（M/2j－b+1）×（N/2j－b+1）。

3）使用改进后的奇异值分解方法对图像子块进行特征值提取：首先对图像子块进行奇异值分解，得到每个子块的奇异值特征向量，所有奇异值特征向量组成特征矩阵Y，如式（3）所示。Y矩阵的每一行对应着一个图像子块的奇异值特征向量y→i=（λ1，λ2，…，λr，0，…，0），Y 的行数为图像子块的个数 p，p=（M/2j－b+1）×（N/2j－b+1）。

接着用改进的奇异值分解方法对矩阵Y进行优化，并通过设定最高贡献率阈值θ，来确定k的取值，最后得到新的特征矩阵Sp×k，如式（4）所示。运用改进的奇异值分解方法对图像块进行处理之后，特征空间在原来基础上进一步下降到k维，提高了检测速度

4）特征矩阵字典排序：对特征矩阵Sp×k按行进行字典排序，得到排序后的特征矩阵为其中一行，为对应图像块的左上角坐标，用于表示图像块的位置。

5）遍历Qp×k，对其中相邻的两行向量，判别其相似度。相似度SM计算公式如式（5）：

v，u表示Qp×k矩阵中相邻的两行向量，如果满足SM≦ρ，则进一步判断其位移距离是否满足阈值条件。位移距离阈值一般要求满足下式（6）：

当同时满足SM≦ρ和L≧LT两个条件时，标记对应的图像块。若存在这种图像块，则表明检测图像中存在潜在的复制粘贴篡改区域，进入下一步，否则算法结束。

6）根据篡改面积阈值ST确定最终的篡改区域，ST一般不小于检测图像面积的0.85%。最后，利用数学形态学中的膨胀，腐蚀操作对检测结果进行后处理，去除噪声引起的孤立点，得到最终检测结果。

2 实验结果及分析

为了验证本文算法的有效性，分别对灰度图像和彩色图像进行了复制粘贴篡改区域的检测。根据经验值和相关测试，本文选取的是最简单的一级haar小波变换，滑窗块大小为8×8，最大贡献率阈值θ为0.95，向量相似度阈值ρ取0.06，位移距离阈值LT取16。对算法检测结果进行了数学形态学方法处理，如腐蚀、膨胀操作，去除噪声带来的孤立点。

2.1 灰度图像检测结果

实验用图均来自互联网并通过photoshop进行复制粘贴篡改操作。实验结果如图2所示：（a）是原灰度图像，（b）是经过复制粘贴篡改后的伪造图，图中将薯片又复制了一个在左边，（c）是使用本文检测算法的检测结果图。

实验结果表明，本文算法能有效检测针对灰度图像的复制粘贴篡改。对于多处篡改的情况，本文算法也能有效检测，在此不再举例。

图2 灰度图像检测结果Fig.2 Detection results of gray-level images

2.2 彩色图像检测结果

对于彩色图像的检测，本文选择先将彩色图像转化为灰度图像后再对其进行检测。试验结果如图3所示：（a）是原始图像，（b）是篡改图像，把后面的小球被复制了两个在草地上，前面的小球被草地覆盖了，（c）是检测结果图。

结果表明，算法对彩色图像的复制粘贴篡改也有效。

图3 彩色图像检测结果Fig.3 Detection results of color images

2.3 试验结果对比

以512×512大小的图为例，相比于文献[4]的64维特征向量和文献[5]的32维特征向量，本文提出算法的特征向量只有8维，并且图像子块的个数也只有前二者的1/4，相当大程度上减少了计算量，提高了检测效率。更直观的对比结果见表1。

表1 本文算法与文献[4，5]算法的比较结果Tab.1 Comparison results of referenced approaches of[4，5]with proposed approach

3 结束语

在数字图像取证研究领域中，本文针对最常见的复制-粘贴篡改进行了研究，提出了一种基于离散小波变换（DWT）[9]和改进的奇异值分解的篡改检测算法。该算法首先对检测图像进行离散小波变换，然后对图像的低频分量进行滑窗分块，再对每个图像块进行奇异值分解，并对所得的奇异值特征向量进一步的优化，以降低向量维度。接着对所得奇异值特征向量进行字典排序，遍历特征矩阵通过向量相似度匹配和位移距离判别初步定位篡改区域，最后通过面积阈值比较和去孤立点确定最终篡改区域。实验证明，本文算法检测准确度良好，同时有效的减少了检测消耗时间，提高了检测效率。

[1]陈利利，王向阳.基于SIFT的椭圆区域鲁棒数字水印方案[J]. 计算机工程与应用，2012，48（1）：98-101.CHEN Li-li，WANG Xiang-yang.Robust watermark scheme using SIFT in ellipse region[J].Computer Engineering and Applications，2012，48（1）:98-101.

[2]王雯娟，黄振杰，郝艳华.一个高效的基于证书数字签名方案[J].计算机工程与应用，2011，47（6）:89-92.WANG Wen-juan，HUANG Zhen-jie，HAO Yan-hua.Efficient certificate-based signature scheme[J].Computer Engineering and Applications，2011，47（6）:89-92.

[3]吴琼，李国辉，涂丹，等.面向真实性鉴别的数字图像盲取证技术综述[J].自动化学报，2008，34（12）：1458-1466.WU Qiong，LI Guo-hui，TU Dan，et al.A survey of blind digital image forensies technology for authentieity deteetion[J].Acta Automatica Sinica，2008，34（12）:1458-1466.

[4]Fridrich J，Soukal D，Luk J.Detection of copy move forgery indigital images[C]//Proc.Digital Forensic Research Workshop.August，2003:19-23.

[5]Popescu A C，Farid H.Exposing digital forgeries by detecting duplicated image regions[R].TR2004-515.Dartmouth College，2004.

[6]骆伟祺，黄继武，丘国平.鲁棒的区域复制图像篡改检测技术[J].计算机学报，2007，30（11）：1998-2007.LUO Wei-qi，HU Ji-wu，QIU Guo-ping.Robust detection of region-duplication forgery in digital image[J].Chinese Journal of Computers，2007，30（11）:1998-2007.

[7]王俊文，刘光杰，戴跃伟，等.一种检测图像Copy－Move篡改鲁棒算法[J].模式识别与人工智能，2009，22（4）:630－634.WANG Jun-wen，LIU Guang-jie，DAIYue-wei，etal.A robust algorithm for detecting image copy-move forgery[J].Pattern Recognition and Artificial Intelligence，2009，22（4）:630-634.

[8]Ientilucci E J.Using the Singular Value Decomposition.Chester F.Carlson Center for Imaging Science，Rochester Institute of Technology，2003.

[9]陈杨，方宝磊，张小华.基于图像置乱和ICA-DWT的数字图像水印算法[J].电子科技，2012（10）:128-129，133.CHEN Yang，FANG Bao-lei，ZHANG Xiao-hua.Digital image watermarking algorithm based on image scrambling and ICA-DWT[J].Electronic Science and Technology，2012（10）:128-129，133.