深度造假取证方式研究

2020-07-06王淏

青年生活 2020年21期

王淏

摘要：随着计算机技术的不断成熟，许多方便的计算机技术被运用在我的在我们生活中，但在这一背景下也滋生了许多不法网络行为，深度造假就是其中之一。深度造假利用机器学习，对信息源进行拆分，替换，能达到以假乱真的效果。现阶段，大部分民众是通过自己眼睛，常识去判断信息的真实性，深度造假这一技术会让绝大部分民众的信息识别能力大幅下降，没有办法准确识别信息是否真实，本文通过对deepfake进行算法解析，并模拟多次fakeapp进行数据模型训练，从多次实验模拟中进行归纳总结，可出结论;深度造假在对生命周期进行学习时，只能模拟大体上的生命特征，但无法模拟细小的生命周期，如眨眼频率，表情鲜活度。因此可以利用该特点对深度造假软件进行取证。

关键词：深度造假;生命周期;deepfake;信息真实

1 引言

1.1 研究背景

随着时代的不断进步，大数据的应用越来越广泛，人工智能即AI应运而生，逐渐被应用在各个领域。然而随着人工智能技术的不断成熟，普及，随之带来的是一系列安全问题。目前国外已经出现的“深度造假”就是人工智能的一个体现。该程序是利用给程序进行不断的数据学习，数据的大量“喂食”让程序进行一个数据模拟。

1.2 研究现状

深度造假是利用一个程序的反复学习，加深学习，收集大量的数据资料推导出模型，并利用模型进行造假活动。“深度造假”看上去与真人并无差别但是其本质上就是模型模仿的过程。就像美国纽约大学法学兼职教授保罗·巴雷特说，简单来讲，“深度造假”就是借助深度学习手段制作的虚假视频。深度学习系统可以从多个角度研究目标人物的照片和视频，然后模仿其行为和说话模式，从而制造出具有说服力的虚假内容。[1]这种“深度造假”的危险在于，这种技术可以让人相信原本并不真实存在的东西是真实的。

1.3 研究内容

本文从人工智能的本质出发对其证明，探讨了试图证明神经网络的算法，模拟了深度学习所产生的深度造假运行形式，并通过列举了一系列范例揭示了人工智能取证系统可以针对哪一点进行取证。

2 deepfake实际运行模拟实验

为了验证本实验猜想，本文对深度造假进行了模拟实验，模拟deepfake的运行过程，首先我们需要下载CUDA，CuDnn，VS2015等文件，并将其安装在电脑中，接着下载fakeapp，并在其原路径下压解CORE文件。

由此将fakeAPP的日志环境，运行条件搭建好，接下来进行视频素材人物解析，

注;本文在实验中采用了抖音软件中某知名网红视频，以及演艺圈某知名明星视频作为实验素材，（本人声明以下为实验数据，结果视频第一时间删除，并承诺一切相关视频不得用于商业用途。）接着打开fakeapp的软件界面;

选中GET DATESET 出现如下界面，将实验素材放入程序中，这一步的目的是将视频分割成图片，然后从图片中提取脸部。这个环节只需要填写两个地方，一个是Vidoe视频路径，一个是帧率FPS，默认为30。之后开始运行;

接着用同样的方式操作FTM.mp4，最好得出两个视频素材的图片，面部特征数据具体过程和上述过程一致，最后得出如图; 接下来进行第二步，训练模型模型是很重要的一个数据分析，也是一个极其消耗时间的东西。训练模型对电脑配置的要求也是比较高。本文实验时不具备高配置实验环境，因此用时3天建立了一个训练模型，Mode是模型的保存路径 Data A：被换的人脸Date B：拿去换的人脸，

输入路径之后，点击TRAIN开始训练。稍等片刻下面就会显示Loss A：xxxx ，LossB：xxxx 。同时Model 目录下除了四个文件。同时还会跳出一个有很多脸的预览窗口。如图;

这一个环节是非常耗时间的，一般需要几天时间，在这期间我们可以关注上图红框内的数值，当两者的数值差在0.01到0.02之间时，人脸预览图越来越清晰，第二列第三列和第一列一样清晰，这时候这个训练过程基本上就已经结束了，接下来我们就可以开始第三步的准备工作，首先将训练模型整理好，检查文件路径，即可开始第三步，生成视频。生成视频的过程分为几个步骤。首先，输入Model 路径。Video路径频率（30）然后，点击Create。然后程序自动开始，处理过程可分成4个阶段。生成图片、截取脸部、合成图片、合成视频。如图所示;

以上为其中一个实验过程，本次实验选取时间，空间为环境变量进行多次实验模拟，通过6次实验模拟，得出以下图表。

本实验通过对模型训练的时间进行控制，来进行实验，从而来得到以上数据，通过以上数据可以看出模型训练时间越短误差值越大，其合成的视频清晰度，相似度越低。而生命周期特征则是无论训练时间如何变化，一直在5～6之间来回波动，该实验说明了模型训练的时间长短并不影响生命周期特征的变化。这说明了deepfake对生命周期的模拟是一个定值，不能精准模拟，而模型训练的时间长短只会影响其结果的清晰度与相似度。因此可以得出结论;人工智能取证系统针对深度造假的取证方向受生命周期尺度因子变化而变化，即;深度造假在对生命周期进行学习时，只能模拟大体上的生命特征，如;眨眼，表情等，但无法模拟细小的生命周期，如眨眼频率，表情鲜活度。因此可以利用该特点对深度造假软件进行取证。

3 结论

通过实验模拟算法解析，我们发现，训练模型受到时间，环境的影响，其会使得其清晰度，相似度受到改变。而其生命周期特征是在一个特定的值来回波动。从实验总结得出结论;人工智能取证系统针对深度造假的取证方向受生命周期尺度因子变化而变化，即;深度造假在对生命周期进行学习时，只能模拟大体上的生命特征，如;眨眼，表情等，但无法模拟细小的生命周期，如眨眼频率，表情鲜活度。因此可以利用该特点对深度造假软件进行取证。

參考文献：

[1] 李鬼变李逵！“深度造假”视频危害日益加剧，刘霞-《科技日报》-2019.