面向场景的数据交换隐私保护模型研究文献综述

2018-08-13赵小柯刘志天

信息记录材料 2018年9期

赵小柯，刘志天，刘瑶

（北京交通大学北京 100044）

1 引言

伴随着计算机技术的飞速发展，网络连接和磁盘存储空间日益增加，网络数据安全的保护工作也得到了越来越多人的重视，给隐私保护带来了新的挑战与机遇。目前各大高校内运行的应用系统数量已经比较庞大，各个应用系统之间交流频繁，对于数据交换与数据共享的需求也日益增加[1]。

隐私保护最早是T Dalenius提出来的，1977年，他给隐私保护出具了一份说明，把访问发布后的所有数据与不访问数据做了一个对比，目的是为了不让不法分子得到目标外的其他信息，即使他们有着其他渠道获得消息，从中发现只有在不发布数据的时候，完美隐私才会实现，这个时候没有任何的泄露风险。”[2]最重要的一个任务是开发发布数据的方法和工具，以便公开的数据在保持可用性的同时保护个人隐私，这就是数据发布过程中的隐私保护。认为数据收集阶段是诚实的模型，数据共享的阶段是非诚实性的，数据接收者的诚实性无法保证[3]，在此阶段为了避免隐私泄露，就需要适当地采取一定的数据隐私保护技术。

本文以一些特殊的场景为出发点，比如数据交换，从而对隐私保护模型进行阐述，发表自己的观点。

2 静态数据隐私保护模型研究现状

目前关于隐私保护模型的研究中，数据记录属性主要有三种，分也就是显式标识、准标识和敏感属性。显式标识属性是唯一标识单一个体的属性，准标识属性是组合起来能唯一标示一个人的属性。在公布数据时人们能意识到通过对于显式标识属性的处理来保护个人信息，但是准标识属性结合到一起同样可以识别一个人的属性，在1998年Samarati等人就曾提出K-匿名模型来解决这一问题[4]。也就是说至少要有K-1条记录体现在发表的数据里，使得准标识属性能够取得相同的值，如果K条记录相同，这种情况就称为等价类。根据Machanavajjhala等人的研究，k-匿名模型很容易受到攻击，如果攻击者确定了目标在等价类中敏感属性都相等，那么攻击者就必然发动攻击。

除此之外基本的隐私保护模型还有ι-多样性匿名模型[5]，ι-多样性匿名模型要求所发布的数据表中每一个等价类都得由代表，能够代替敏感值属性，这个代表要满足相异ι-多样性、信息熵ι-多样性与递归（c，l）-多样性。

为了弥补上述两种匿名模型的缺陷，2007年Machanavajjhala等人提出了t-closeness模型[6]，该模型在k-匿名模型与ι-多样性模型的基础上作出了改进，它要求任何等价类中的敏感属性的分布接近于整个表中属性的分布，即两个分布之间的距离应该不超过阈值t。

（a，k）-匿名模型着眼于个人身份与敏感属性之间的关联，是一种限制推测敏感信度的方法[9]。