APP下载

一种改进的SURF古籍图像复制粘贴篡改检测算法

2021-11-10

关键词:古籍滤波阈值

王 永 飞

(铜陵职业技术学院, 安徽 铜陵 244061)

随着计算机应用技术的飞速发展,作为信息重要载体的图像使用越来越普遍,根据实际需要,对图像进行篡改也越来越普遍。古籍是学术传承的历史见证和源头活水,更是现代科技创新和学术进步的根基和依据。为加强古籍保护工作,2007年国务院办公厅发布了《关于进一步加强古籍保护工作的意见》,正式实施“中华古籍保护计划”。古籍图像是古籍文物中重要的组成部分,且是不可再生的珍贵的历史文物,若对古籍字画图像篡改,将会使这些古籍图像失去本来的价值和意义,因此对古籍图像篡改检测显得尤为重要。

古籍图像受长期自然环境和人为因素的影响,大多数已严重破损,经过篡改技术处理后,很多篡改后的图像可以达到以假乱真的地步。当前,图像篡改检测技术主要有特征点匹配和块匹配方法。文献[1]中提出了超像素分割和SURF特征点图像复制粘贴篡改检测算法,该算法以特征点匹配方法实现图像篡改检测,在检测篡改区域时提高了准确率和检测速度;文献[2]中提出了低频快速切比雪夫矩的篡改图像检测算法,该算法提取图像块特征,实现图像篡改检测,对单区域、多区域篡改区域有很好的定位结果;文献[3]中提出了基于圆域分割耦合法则的图像篡改检测算法,该算法利用邻域圆构建特征点,实现图像篡改匹配检测,检测准确性较高,鲁棒性较好。文献[4]中设计了一种SIFT(Scale Invariant Feature Transform)的复制粘贴篡改检测算法,但该算法易出现错误检测和漏检测,且存在计算量大等问题。SURF(Speed Up Robust Feature)算法改进了SIFT算法,提高了运算速度,但其匹配精度不高。针对上述各算法的不足,研究提出了一种改进的SURF算法,该算法准确度高,可快速检测古籍图像篡改的信息。

1 篡改检测算法思路

像素、纹理、结构、灰度和颜色是图像构成的主要信息。特征点是图像中具有尺度不变性的像素点或像素块。SURF算法的图像匹配检测过程是:先用高斯滤波平滑图像,找出图像的特征点,构造Hessian矩阵,定位特征点、确定特征点主方向和特征描述子;再利用欧氏距离最近的最佳匹配原则进行特征点匹配,实现图像匹配检测。改进的SURF古籍图像复制粘贴篡改检测算法(以下简称新算法)的思路是:(1) 以SURF算法为基础;(2) 分析高斯滤波的不足和像素信息,引入小波变换并改进,对古籍图像进行滤波,平滑图像并清除干扰图像特征点提取的噪声斑点;(3) 分析SURF算法全图搜索定位特征点的缺陷和图像结构、灰度和颜色特征,引入SLIC(Simple Linear Iterative Clustering)算法,对图像分块,提高图像篡改检测的定位速度;(4) 分析SURF算法特征点匹配时阈值选取方法的不足,将SURF算法特征点欧氏距离最近的最佳匹配原则的阈值选取方式改进为图像特征点匹配自适应统一阈值选取方法,减小特征点匹配误差积累;(5) 引入图像局部色彩方差,提升图像特征点的匹配准确度;(6) 根据特征点匹配情况,利用形态学腐蚀膨胀操作,实现篡改信息定位。通过上述6个步骤,以快速及准确的方式实现图像篡改信息检测。

为验证新算法的检测效果,将其与当前主流篡改算法检测效果比较,进行如下检测:(1) 对两幅古籍图像人为篡改进行检测;(2) 对两幅古籍文字篡改和缺少笔画的图像进行检测;(3) 对单幅原始图像中多出的“鸟”进行篡改检测;(4) 用主流不同算法对上述各篡改图像检测数据进行分析。通过上述实验,验证新算法的有效性、实用性、通用性和高效性。

2 基于改进的SURF古籍图像复制粘贴篡改检测算法

2.1 SURF算法简介

2.1.1 构建Hessian矩阵

Hessian矩阵是一个多元函数的二阶偏导数构成的方阵,构建Hessian矩阵是图像特征提取的起点,这些特征点就是图像稳定的关键点。图像I上的像素点(x,y)即为函数值f(x,y),因图像提取的特征点应具备尺度无关性,在Hessian矩阵构造前,图像中有很多噪声斑点,需要选用二阶标准高斯函数对其进行高斯平滑滤波,消除无关斑点。为加快卷积的速度,采用了方型滤波器(Box Filter)对高斯滤波器二阶偏导进行近似求解。滤波后像素点Hessian矩阵为[1]:

(1)

式中:σ表示像素点(x,y)对应的空间尺度;Lxx(x,y,σ)、Lxy(x,y,σ)、Lyx(x,y,σ)、Lyy(x,y,σ)是高斯函数与高斯二阶偏导数的卷积。

Hessian矩阵判别式为[1]:

Det(H)=LxxLyy-(ωLxy)2

(2)

式中:ω为加权系数,为平衡方型滤波器近似所带来的误差,一般取值为0.9;Lyy、Lxx和Lxy是yy、xx和xy方向上的二阶导数值。

2.1.2 确定特征点

在二维图像空间和尺度空间中,将Hessian与该邻域内相关性像素点进行比较,根据阈值,滤除能量弱的关键点以及定位错误的关键点,筛选出稳定的特征点;在特征点邻域内,使用Harr小波,统计60°扇形内水平方向和垂直方向所有点的Harr小波特征值之和,再统计以一定间隔旋转后该区域内Harr小波特征值,将该值最大的扇形方向确定为该特征点主方向;以特征点为中心,构造一个20 pixels×20 pixels的正方形窗口,再将该窗口划分为更小的4 pixels×4 pixels子区域,在每个子区域内再按照5 pixels×5 pixels的大小进行取样,计算子区域内水平和垂直方向Harr小波响应值∑dx、∑|dx|、∑dy和∑|dy|。产生16个子区域,每个子区域4个量值,形成64个特征描述子表达特征点[1]。

2.1.3 特征点匹配

计算两个特征点间的欧氏距离,欧氏距离越短,两个特征点匹配度越高;若两个特征点矩阵迹的正负号一样,表示该对特征点相同方向上对比度变化相同,则这两个特征点匹配,否则,即使欧氏距离为0,也认为是误匹配。

2.2 改进SUFR算法

2.2.1 引入并改进提升滤波效果的小波变换

(1) 小波变换简介

若f(t)∈L2(R),则连续小波变换为:

(3)

传统小波去噪采用阈值函数选取阈值,常用的硬阈值和软阈值函数分别为:

(4)

(5)

传统的小波选取统一阈值,λ取值公式为:

(6)

式中:σ是噪声标准差;N是图像大小[5]。

小波重构函数可定义为:

(7)

(2) 改进提升滤波效果小波阈值选取方式

由于各种原因,古籍图像都包含大量噪声,而噪声在图像中表现为孤立性很强的斑点。在图像特征点提取过程中,这些斑点容易被视为图像的特征点提取,影响图像篡改区域的定位,构建Hessian矩阵过程中需要使用高斯函数对其进行滤波,高斯函数在频域内具有图像平滑的作用,且频率点半径决定了图像边缘信息滤除多少和图像模糊程度,以及是否出现振铃现象。新算法引入小波变换算法并进行了改进,以克服高斯滤波的不足。

硬阈值去噪将噪声小波系数直接清零,容易产生伪吉布斯现象;软阈值去噪时,估计值与实际值之间存在一定偏差,影响图像重构效果;另外,还有如折中阈值去噪等方法,图像中都容易出现断点,平滑度不够。

为了更好地实现图像滤波,改进的小波阈值函数为:

(8)

式中:m是调节阈值函数的常量[5]。

改进的小波阈值选取方式如下:

(9)

式中:Ti是第i层阈值。

通过对图像添加标准差为1.6的高斯噪声,利用改进的小波变换滤波和高斯函数滤波,滤波效果图如图1所示。

图1 图像滤波效果比较

从视觉效果角度看,高斯滤波图图像过于平滑,且比较模糊;新算法滤波后,图像最接近原图,且图像信噪比达到75.32 dB,图像结构相似度为0.91,远高于高斯滤波后的图像信噪比64.57 dB和图像结构相似度0.64,为构建Hessian矩阵提供了更好的基础。

在二维图像空间和尺度空间中,将Hessian与该邻域内相关性像素点进行比较时,也采用上述小波阈值选取方式,滤除能量弱的关键点以及定位错误的关键点,筛选出稳定的特征点。

2.2.2 改进提升检索效率的超像素分割算法SLIC

将图像分割的目的是减少检测时间,提高检测效率。改进的算法中引入超像素分割方法之一的简单线性迭代聚类SLIC(Simple Linear Iterative Clustering)算法,由于SLIC分割的超像素块大小均匀,且分割前需要设定图像分割数目。图像分割数量过大或过小,会增加图像检索复杂度或降低检测精度。

(1) SLIC算法简介

SLIC算法是一种基于网格化针对像素块K-Means聚类的超像素图像分割算法。因Lab颜色空间与设备无关,将图像RGB颜色空间转换到Lab颜色空间(Lab颜色模型由亮度L、颜色通道a和b组成),每个像素点(x,y)可用5维向量V[L,a,b,x,y]表示。

(2) SLIC算法的改进

为了消除SLIC分割图像前分割数量假设的不确定性,新算法利用自适应确定超像素图像分割数量。通过小波变换,提取图像低频分量和高频分量,计算小波对角对比度P[6],计算公式为:

(10)

自适应超像素图像分割数量为[6]:

(11)

改进后的SLIC算法:在原图像素中,自适应确定超像素图像块分割数量K,选取K个图像特征点,设为K聚类中心,以每个特征点为中心,搜索全图欧氏距离最近的像素点,并归入该类,计算每类像素点平均向量值,重新得到K个聚类中心,再以这K个中心去搜索周围与其最为相似的像素,反复迭代,直至所有像素都归类后收敛。若聚类中心在边缘或是噪声点,改进为将聚类中心移动到梯度最小的区域。图2为SLIC算法图像分割过程和结果。

图2 改进的SLIC算法图像分块

2.2.3 图像匹配自适应阈值选取

传统SURF算法采用欧氏距离最近的最佳匹配原则判断特征点的匹配,判断公式为:

(12)

式中:l为两特征点间的距离;n为特征点维数;x1和x2分别为原始图像和待测图像特征点描述向量。

以最近特征点和次近特征点的距离比值为阈值,当lmin

改进的SURF算法采用统一阈值法:(1)先分别求出原图和待测图像所有特征点;(2)再用循环方式求出原图所有特征点与待测图像所有特征点之间的距离,将最近特征点和次近特征点距离值作为阈值。将该阈值作为全图匹配的统一阈值,以减小匹配过程中阈值变化产生的误差,提高图像匹配精度。

将两幅前景完全相同,背景的色调、对比度和饱和度不同的图像进行匹配检测比较。利用传统的SURF算法和改进后的统一阈值法对两幅图像进行篡改检测,结果如图3所示。

两幅图像只有背景不同,图3c是利用传统SURF算法匹配检测的结果,图中鸟的特征匹配点只有3对,与事实明显不符,表明传统SURF算法匹配检测存在很大的误差。图3d是利用新算法篡改匹配检测的结果,很明显该篡改匹配检测结果更准确。

2.2.4 引入提升匹配检测准确度的图像局部色彩方差

目前图像特征点检测算法,如Harris、SIFT和SURF等算法均忽视了图像颜色信息,检测出的特征点均存在误差。研究在SURF算法特征点匹配时引入图像局部色彩方差,除要求欧氏距离越短和两个特征点矩阵迹的正负号一样外,还要求判断对应特征点的局部色彩方差相同,以提升匹配检测的准确度。

因HSV图像模式更符合视觉效果,且空间各分量相对独立,新算法将RGB图像颜色模式转换为HSV图像模式。图像局部色彩方差反映图像细节复杂度,将其作为判断特征点匹配的第三项依据。

超像素块的局部色彩方差计算公式为[7]:

(13)

图4a是原始图;图4b是将原始图右边人脸篡改后的图像;图4c是利用传统的SURF算法对篡改后的图像匹配检测的结果,图中明显出现了肩部误匹配特征点对应线,且该匹配对应点颜色明显不一样;图4d为新算法的匹配检测结果,准确度较高。

2.2.5 篡改信息定位

将特征点匹配后的古籍图像二值化,利用形态学腐蚀膨胀操作填充匹配特征点对之间空隙形成连通区域。选用经典结构元素B,其表达式为:

(14)

针对图像I二值化后的矩阵A,利用式(15)进行篡改区域检测[1],结果如图5所示。

图5 新算法篡改检测结果

A·B=(A⊕B)ΘB

(15)

图5c是根据特征点匹配后,使用形态学腐蚀膨胀操作篡改定位的图像,因图5b中人脸篡改部分和原始图像图5a人脸部分有很多像素点完全相同,且信息完全相同部分不认为是被篡改,故图5c中显示的是被篡改部分的准确位置信息。

3 实验与分析

新算法使用的系统平台为Windows7 32位旗舰版,软件应用平台为Matlab2015b。选取真假两幅古籍图像和1幅图中有内容被篡改的图像为例,篡改方式包括复制、缩放、旋转、更换背景和删除等。利用新算法及当前其他主流算法对篡改图像进行检测、分析,验证新算法的实用性、通用性和高效性。

3.1 两幅古籍图像篡改匹配检测

3.1.1 复制篡改匹配检测

为验证图像复制篡改匹配检测效果,选用两幅古籍图像,分别利用新算法、文献[1]、文献[2]和文献[8]中算法对图像篡改进行匹配检测。图6为多种算法对图像复制篡改匹配检测结果。图6a中,右图人脸部明显破损,将左图人脸不作任何调整地复制到右图人脸处,如图6b中右图,利用4种算法对图像进行复制篡改匹配检测,结果如图6c — 图6f所示。

图6 多种算法对图像复制篡改匹配检测结果

图6 a中两个图从视觉角度上看很相似,但两个图的颜色信息完全不同。文献[1]中的篡改匹配检测效果明显优于文献[2]和文献[8];文献[1]和文献[2]中图像的匹配均出现多匹配现象,原因是没有对图像色彩进行判断;文献[8]中的篡改匹配检测效果图中人脸匹配对应点很少,这是明显的匹配错误。由此可见,新算法能精准定位匹配,效果最佳。

3.1.2 放大和旋转篡改匹配检测

图7 为多种算法对图像放大篡改匹配检测结果对比图。将两幅古籍原始图像图7a中左图人脸复制放大20%后移至图7a中右图的人脸部,结果如图7b中的右图所示。

图7 多种算法对图像放大篡改匹配检测结果

图8为多种算法对图像旋转篡改匹配检测结果。将两幅古籍原始图图8a中右图人脸复制后顺时针旋转20°并移至右图人脸位置,结果如图8b中的右图所示。

图8 多种算法对图像旋转篡改匹配检测结果

由图7和图8可知,利用新算法、文献[1]和文献[2]中的算法对图像的匹配检测结果很稳定,且新算法检测匹配准确性明显高于文献[1]和文献[2]中算法。此外,就图像篡改任意比例缩放和任意角度旋转等情况进行了实验,实验结果证明新算法实用性更强。

3.2 单幅古籍字帖文字图像篡改检测

为了验证新算法的通用性,在选取单幅古籍字帖图像时,选取了其中有重复字“樂”的图,同时,将原始图像图9a中的“如”篡改为“何”,利用新算法就篡改文字进行匹配检测,匹配检测结果如图9c所示。

图9c中,检测出了图9a中两个同样的字“樂”的匹配,因写作手法不同,同样的字只有个别的地方匹配,而篡改后的同样两个字“何”完全匹配。表明新算法通用性强。

图10a中就原始图中“綠”字少了一横,从其他图中复制缺的“横”图案粘贴到图10b中的位置,利用新算法进行篡改检测,获得篡改区域信息图像如图10c所示。从视觉效果角度分析,篡改区域图像清晰度非常高,证明新算法通用性强。

图9和图10就古籍字帖进行篡改匹配检测。为进一步验证新算法的通用性,选用单幅原始图中有多只鸟的图像进行篡改,利用新算法进行匹配检测。

图9 文字图像篡改匹配检测结果

图10 新算法对图像篡改匹配检测结果

图11a中有多只鸟,复制其最上面的一只鸟并粘贴至图中间的树枝上得到图11b,同时,将粘贴后的图像缩小5%,利用新算法进行匹配检测,检测结果如图11c所示,匹配准确度非常高。

图11 新算法对图像篡改匹配检测结果

3.3 准确率和用时

利用新算法、文献[1]和文献[2]中算法对图像10进行篡改匹配检测,结果见表1。

表1 3种算法篡改匹配数据统计表

文献[1]中算法匹配准确率较文献[2]高,但检测用时较长;文献[2]中算法检测用时最短,但准确率不高;新算法检测准确率最高,检测用时最少,说明新算法的高效性。

4 结 语

研究提出了一种改进的SURF图像复制粘贴篡改匹配检测算法,通过对单幅和多幅图像进行篡改复制、旋转、压缩和部分图像清除等进行匹配检测,验证了新算法比其他算法更具有效性、实用性、通用性和高效性。后继就图像单像素篡改检测算法进行深入研究。

猜你喜欢

古籍滤波阈值
改进的软硬阈值法及其在地震数据降噪中的研究
土石坝坝体失稳破坏降水阈值的确定方法
中医古籍“疒”部俗字考辨举隅
基于小波变换阈值去噪算法的改进
改进小波阈值对热泵电机振动信号的去噪研究
西藏大批珍贵藏文古籍实现“云阅读”
一种考虑GPS信号中断的导航滤波算法
高效LCL滤波电路的分析与设计
基于多窗口中值滤波和迭代高斯滤波的去除图像椒盐噪声的方法
我是古籍修复师