图像隐写分析研究综述

2022-05-10段明月李爽张源策李丽红

电脑知识与技术 2022年9期

段明月　李爽　张源策　李丽红

摘要：隐写术与隐写分析是信息安全领域中一个重要的课题。随着图像隐写的不断发展，为了防止技术被恶意者利用，提出了图像隐写分析技术。本文简单介绍图像隐写类别，并根据适用范围不同将隐写分析分为专用隐写分析和通用隐写分析，总结和归纳各算法的优缺点，探讨深度学习在图像隐写分析上的研究所面临的问题及发展趋势。

关键词：图像隐写; 图像隐写分析; 深度学习

中图分类号：TP18 文献标识码：A

文章编号：1009-3044（2022）09-0003-03

1引言

随着网络的不断发展，通信加密技术得到了很好的发展，然而简单的通信加密并不能满足敏感信息传递需求，随后研究者开始研究信息隐藏技术，简称“隐写术”，通过把秘密信息嵌入多媒体载体尽可能不改变载体的视觉和统计特性，以达到掩盖“正在进行秘密通讯”的目的[1]。互联网中广泛的多媒体数据可以作为载体，如视频、音频、图像、文本等，其中图像因其内容广泛、容易获取，且人们对图像的非重点区域不够敏感等原因，逐渐成为最常见的秘密信息载体形式。近年来，针对图像的隐写算法已有较为成熟的算法，并得到了广泛应用。

然而，“隐写术”是一把双刃剑。为了避免不法分子利用“隐写术”传播不良信息，研究者提出了隐写分析技术。隐写分析的目标是根据载体的统计特性判断其中是否隐藏有秘密信息，进而估计嵌入的信息长度、识别隐写工具、估计隐写密钥，最终提取秘密信息[2]，当前的研究重点是检测载体中是否含有秘密信息。

本文首先对图像隐写算法进行简单介绍，然后分别介绍专用隐写分析与通用隐写分析，最后总结当前隐写分析算法的劣势，并讨论未来发展趋势。

2图像隐写

根据是否改变载体原始数据将图像隐写算法分为嵌入型隐写算法和无载体隐写算法。嵌入型隐写算法通过修改载体像素嵌入秘密信息，具有高隐写量、易于实现等特点，近几年取得了不错的成果。根据不同的嵌入策略可将嵌入型隐写算法分为非自适应隐写算法与自适应隐写算法。其中，非自适应隐写算法主要是通过修改像素值或频域系数实现秘密信息嵌入，是对载体元素无差别的选择与修改，包括LSB（Least Significant Bit）算法[4]、[±1]嵌入算法、Outguess、F5[5]等。

针对自适应隐写算法导致图像质量大幅下降、统计特征改变过大等问题，研究者提出自适应隐写算法，选择合适的载体图像，通过训练找到最适合隐写的位置，得到最小损失函数，常见的自适应隐写术主要有HILL（High-pass， Low-pass， and Low-pass）、S-UNIWARD、WOW （Wavelet Obtained Weights）、HUGO等。

但是，嵌入型隐写算法通过直接修改载体图像隐藏信息的方式，总会影响图像的视觉效果和统计特征，容易被隐写分析捕捉到，研究者又提出了无载体隐写算法。该算法本身不存在修改载体问题，而是通过载体的某些特征属性隐藏秘密信息，其抗隐写分析能力更高。无载体图像隐写并不是完全不需要载体，而是通过建立图像的属性特征与隐秘信息的映射关系来实现隐写目的，为隐写提供了新思路。但該方法的隐写信息量较小，研究难度大，目前的研究成果不多。

3 图像隐写分析

图像隐写分析技术主要是对图像进行检测，判定其是否含有秘密信息。随着隐写术的快速发展，隐写方法层出不穷，与之相对的隐写分析也取得了很多成果。图像隐写分析主要的步骤分为三步：（1）图像预处理，将获取到的图像进行处理，得到可处理的信息;（2）提取特征，在预处理后的图像中提取尽可能多且关键的特征;（3）判定输入图像是否含密。通过使用大量的图像数据训练卷积网络，得到较好的判定效果。图像隐写分析方法主要分为两大类，分别为专用隐写分析算法和通用隐写分析算法。

3.1专用隐写分析算法

专用隐写分析算法主要针对某种非自适应隐写算法进行分析。主要是利用该隐写算法的漏洞，检测正确率很高，但泛化能力比较差，不适合大规模使用。

LSB替换会使图像DCT系数值的相邻对值趋于一致，相邻对值的接近程度与是否含密成正比，根据这种特性提出了[x2]算法[6]，将每组对值的均值与实际分布进行对比，得出含密的概率。根据空域LSB隐写嵌入秘密信息会降低图像系数空间相关性的特点提出了RS分析方法[7]，通过统计替换前后规则类、异常类和不可使用类的个数变化得出嵌入的秘密信息量。

针对F5算法，提出了一种基于平方误差最小准则的隐写分析算法[8]，将剪裁后的图像与载密图像的DCT系数直方图进行比较分析，判断是否含密并计算含密容量。还可以根据0/1系数组合差异对F5算法进行有效检测，通过提取相邻块间0/1系数组合差异特征，用SVM进行分类。

3.2通用隐写分析算法

通用隐写分析方法主要是针对自适应隐写算法和无载体隐写算法所设计的，能有效识别多种隐写算法，这种方法相比专用隐写分析算法识别率稍差，但其泛化能力较强，能有效抵御一些新出现的隐写算法，因此成为当下研究的热点。通用隐写分析方法主要是使用深度学习中的卷积神经网络，有效获取图像中的特征，通过学习大量的数据优化权重和偏移量，使用不同的网络层和激活函数调整网络、加速收敛，因此不需要过多的先验知识就可以完成隐写分析。根据训练策略的不同，通用隐写分析方法又可以分为两类，分别为半学习隐写分析方法和全学习隐写分析方法。

3.2.1半学习隐写分析方法

半学习隐写分析模型是指图像预处理时使用给定的高通滤波器，获取图像的残差信息，辅助卷积神经网络进行学习。

2016年，Xu等人[10]提出了Xu-Net网络，预处理时使用中心对称的KV核，有效保留当前像素点与其周围像素点之间的关系，获取像素之间的共生矩阵，该网络的检测正确率大幅提高。

2018年，高培贤等人[12]在Xu-Net的基础上提出SCNN模型，该模型含有七个卷积层和一个全连接层，用两个3×3的卷积核代替Xu-Net的5×5的卷积核，激活函数全部用ReLU函数，用移动步长为2的卷积层替代池化层，在减少参数的同时提升了准确率，并且加速模型收敛，防止梯度爆炸和梯度消失等问题。同年，又提出S-DCCN模型[13]，在每个卷积层后连接一个密集连接模块，可使最后一层得到原始图像的特征，防止部分特征丢失，相比Xu-Net，检测准确率提升了14%，但这也导致模型训练时间更长，参数更多，不过还是在可接受范围内。2018年，汪然等人[14]提出了分类与分割相结合的JPEG图像隐写分析模型，该模型降低了类内离散度、提升了类间离散度，与“富模型”特征提取相比，检测性能更加优异。

2021年，黄思远等人[16]提出了一种基于显著性检测的图像隐写分析方法，对图像的复杂区域做重点监测，用BASNet将图像的显著性区域提取出来，进行特征提取与学习，该方法的优点是空域与JPEG域通用，将图像分割融合了隐写分析领域，但在低嵌入率情况下检测效果不好。

3.2.2全学习隐写分析方法

全学习隐写分析方法与半学习模型最大的差别是预处理结构也要经过网络训练，而不是使用固定的滤波器。

2017年，Ye等人[11]提出了Ye-Net网络，添加了多种滤波核，使用一种新的截断（truncated linear unit，简称TLU）激活函数。Ye-Net首次将通道感知引入隐写分析中，并且这种技术在纹理复杂处与细节处检测效果更好，并且能够提升检测的准确率。2019年，Zhu等人[15]提出了Zhu-Net网络，在预处理时将25个5×5的滤波核替换为3×3的滤波核，减小计算量，模型更容易收敛和训练。

4 结论与展望

4.1结论

本文对近几年图像隐写分析做了简单的介绍，通过将深度学习引入图像领域，已经对隐写检测正确率有了较好的提升，并且泛化效果和鲁棒性都有了很大的提升。但是，基于深度学习的隐写分析模型还有很多地方需要改进。

（1）拟合速度慢。模型参数多、层数多、训练时间长、模型收敛慢。

（2）对预处理层过分依赖。选择不同的滤波器会得到相差很大的结果。

（3）低嵌入率检测效果差。当隐写的数据量很小时，不能有效检测到嵌入，检测的正确率较低。

4.2展望

笔者期待的图像隐写分析网络是可以检测出秘密信息是否存在，并且提取秘密信息，而当下还处于检测是否存在阶段，之后的研究可能集中在以下几个方向：

（1）加速模型训练。目前的网络训练时长并不理想，训练时间过长不利于投入使用，尤其是全学习隐写分析模型。

（2）实现小样本集训练。目前的神经网络主要依靠大量样本的学习才能训练出一个较好的结果，而大样本集难以获取和训练时间长都是问题，如果可以实现小样本训练，对时间和空间节省都是一项巨大的进步。

（3）进一步提高隐写分析模型的通用性。使一个模型可以对多种格式的图像进行分析。

（4）开展针对无载体图像隐写的研究。目前无法有效检测这种隐写算法，未来有很大的发展空间。

参考文献：

[1] Cheddad A，Condell J， Curran K， et al. Digital image steganography： survey and analysis of current methods[J].Signal Processing，2010，90（3）：727-752.

[2] Nissar A，Mir A H. Classification of steganalysis techniques： a study[J].Digital Signal Processing，2010，20（6）：1758-1770.

[3] Hinton G， Osindero S， WellingM， et al.Unsupervised discovery of nonlinear structure using contrastive backpropagation[J].Cognitive Science，2006，30（4）：725-731.

[4] Chan C K， Cheng L M. Hiding data in images by simple LSB substitution[J].Pattern Recognition，2004，37（3）：469-474.

[5]A Westfeld. F5-A Steganographic Algorithm High Capacity Despite Better Steganalysis[C]// 4th International Workshop on Information Hiding （IH 2001），2001.

[6] Westfeld A， Pfitzmann A.Attacks on steganographicsystems[C]//InformationHiding，2000.

[7] Fridrich J，Goljan M，Du R.Detecting LSB steganography in color，and gray-scale images[J].IEEE MultiMedia，2001，8（4）：22-28.

[8] Fridrich J，Goljan M，Hogea D.Steganalysis of JPEG images：breaking the F5 algorithm[C]//InformationHiding，2003.

[9] 韩晓东，平西建，张涛.基于0，1系数组合差异的F5隐写分析算法[J].信息工程大学学报，2009，10（2）：184-187.

[10] Xu G S，Wu H Z，Shi Y Q. Structural design of convolutional neural networks for steganalysis[J]. IEEE Signal Processing Letters，2016，23（5）：708-712.

[11] YeJ，Ni J Q，Yi Y. Deep learning hierarchical representations for image steganalysis[J].IEEE Transactions on Information Forensics and Security，2017，12（11）：2545-2557.

[12] 高培贤，魏立线，刘佳，等.针对图像隐写分析的卷积神经网络结构设计[J].中国科技论文，2018，13（14）：1664-1668.

[13] 高培贤，魏立线，刘佳，等.基于密集连接网络的图像隐写分析[J].计算机工程与应用，2018，54（15）：74-77，146.

[14] 汪然，薛小燕，平西建，等.分类与分割相结合的JPEG图像隐写分析[J].中国图象图形学报，2018，23（10）：1472-1482.

[15] Zhang R，Zhu F，Liu J Y， et al. Depth-wise separable convolutions and multi-level pooling for an efficient spatial CNN-based steganalysis[J].IEEE Transactions on Information Forensics and Security，2020，15：1138-1150.

[16] 黃思远，张敏情，柯彦，等.基于显著性检测的图像隐写分析方法[J].计算机应用，2021，41（2）：441-448.

【通联编辑：唐一东】