APP下载

基于多层模糊综合评估的隐私保护效果评估方法

2020-12-18俞艺涵付钰吴晓平

网络与信息安全学报 2020年6期
关键词:生命周期因子评估

俞艺涵,付钰,吴晓平

基于多层模糊综合评估的隐私保护效果评估方法

俞艺涵1,2,付钰2,吴晓平2

(1. 海军航空航天大学教练机模拟训练中心,辽宁 葫芦岛 125001;2. 海军工程大学信息安全系,湖北 武汉 430033)

针对由单一数据层面进行隐私保护效果评估无法刻画网络环境整体隐私保护效果的问题,借助模糊综合评估方法,从数据全生命周期凝练隐私保护效果影响因子,通过分区块、多层次地模糊综合评估,并依据数据隐私差异确定各因子与各区块权重,综合计算得到网络环境整体隐私保护效果评估结果。实例分析表明,该方法可行有效。

隐私保护;隐私保护效果评估;模糊综合;多层次

1 引言

随着信息技术的不断发展,网络环境中的数据呈爆炸式增长。海量数据中不可避免地存在众多隐私信息,如何对开放式网络环境中的隐私信息进行保护成为近年来的研究热点[1]。当前,针对数据生命周期各个阶段已有较多的隐私保护研究成果,如隐私保护数据发布、隐私保护数据挖掘等,但对各类隐私保护方法的实际效果缺乏规范化的评价方法。

针对以上问题,本文结合数据实际应用环境和隐私场景对隐私保护效果的影响因素进行归纳,并考虑到隐私概念的模糊性,设计了一种基于多层模糊综合评估的隐私保护效果评估方法,该方法将隐私保护效果评估由单一数据自身层面扩展至整个数据生命周期,由多层次、分区块的隐私保护效果评估结果整合计算得到网络环境整体隐私保护评估效果,可为下一步指导隐私保护具体实施提供依据。

2 隐私保护效果影响因子

隐私保护效果评估需以明确隐私保护效果影响因子为前提,文献[8]将对隐私保护效果的评估刻画至整个隐私生命周期中,将其与以下几大因素相关联:一是隐私信息的概率分布;二是信息所有者;三是信息接收者,主要指信息接收者所拥有的背景知识、兴趣点、隐私观念等;四是信息使用时的约束条件,即数据使用在时间、空间、环境条件上的限制;五是隐私操作,即隐私保护措施。本文以此为基础,综合考虑当前网络环境下隐私数据所面临的安全风险总结得出隐私保护效果的3个主要影响因子,每个影响因子包含文献[8]所提的多个因素且存在交叉,具体如下。

(1)数据隐私类别

数据隐私类别是指数据隐私信息中所蕴含的隐私信息的类别,其对隐私保护效果的影响具有本质性。数据隐私类别一方面决定数据在隐私层面的重要性,另一方面会影响隐私所有者、数据使用者、数据攻击者在不同隐私应用场景下对数据的隐私态度与处理方法,从而影响隐私保护效果。若将隐私保护的对象视为一种资产,则数据隐私类别是对该资产的一种量化,本文将数据隐私类别对隐私保护效果产生的影响称为资产因子。

(2)隐私风险来源

隐私风险来源是指隐私数据在整个生命周期中可能面临隐私泄露风险的原因,其与数据隐私保护效果具有间接关联性。以数据隐私安全全局角度来看,当数据隐私面临的风险越高时,对于已实施的隐私保护措施的隐私保护效果应给予越低的评价。考虑到隐私风险间接地影响隐私保护实际效果,本文将隐私风险来源对隐私保护效果产生的影响称为威胁因子。

(3)隐私保护实施

隐私保护实施是指隐私数据在整个生命周期中所被采取的隐私保护措施,其对于隐私保护效果的影响具有直接性。隐私保护实施采用的隐私保护技术、隐私保护强度、隐私保护范围等因素将影响隐私信息的泄露概率,泄露概率越高,隐私信息的脆弱性越大,本文将隐私保护实施对隐私保护效果产生的影响称为脆弱性因子。

3 基于多层模糊综合评估的隐私保护效果评估流程

在实际评估过程中,上述3个隐私保护效果影响因子分别对应多个方面十个指标,因此,在采用模糊综合评估方法对隐私保护效果进行评价时,因评估因素集中的因素数量过多,不可避免地将出现一些因素的权值取值较小(接近于零)的情况,即在计算综合评价结果时丢失对应因素信息。另外,在当前网络环境中对数据隐私保护效果进行评估时,评估对象类似于一个无边界的复杂系统,很难厘清一个因素与评语集对应的隶属关系,从全局角度进行评估将丢失用户个体差异信息,使评估结果缺乏准确性。

综上,在利用模糊综合评估方法对隐私保护效果进行评估时,为使评估结果尽可能地科学、准确,本文利用模糊综合评估的多级分层模型展开具体评估工作,具体步骤如下。

根据二级因素评估结果,将其作为行向量构造对应一级因素模糊评估矩阵。

的确定由评估时的具体情况和数据隐私差异决定。的计算过程如图1所示。

Figure 1 The minimum evaluation unit evaluates the process hierarchy

图2 空间维度上的评估扩展示意

Figure 2 Schematic diagram of evaluation extension on spatial dimension

4 实例分析

公开临床医疗数据有利于各类医学问题的研究,但在公开的临床医疗数据集中通常会涉及患者隐私信息。目前存在众多临床医疗数据集,其保护患者隐私的方法各不相同。本节以所提基于多层模糊综合评估的隐私保护效果评估方法对真实医疗数据集MIMIC-III[10]的隐私保护效果进行评估。

Step2 针对临床医疗数据集隐私保护效果评估需求,生成如图3所示隐私保护效果评估指标集。

图3 临床医疗数据集隐私保护效果评估指标集

Figure 3 Evalution index set of privacy protection effect of clinical medical data set

表1 临床医疗数据集隐私保护效果评估评语集定义

由二元对比决策法得到模糊评估矩阵对应的权值向量。

再依据数据隐私差异由二元决策法得到其对应的权值向量。

根据随机抽取的100条记录可以认为MIMIC-III数据集隐私保护效果为良,这与MIMIC-III数据集通过模式识别算法移除个人健康受保护信息的实际情况相符。进一步,可以继续抽取数据集中的记录进行评估,亦可对其他医疗数据集进行评估,通过所提评估结果扩展计算方法得到更全面的临床医疗数据隐私保护效果的评估结果。

5 结束语

本文针对网络环境隐私保护效果评估问题,借助模糊综合评估方法,将网络环境隐私保护效果评估由单一数据层面转向数据全生命周期,从隐私风险来源、隐私类别和隐私保护实施3个方面建立评估指标,通过划分最小评估单元,分区块、多层次地进行基于模糊综合评估的隐私保护效果评估,由数据隐私差异确定各因素、各区块权重,整合计算得到网络环境中隐私保护效果评估结果。实例分析表明,所提方法简便可行,在明确网络环境整体隐私保护效果的同时,可得到影响隐私保护效果的主要原因,为优化下一步隐私保护具体实施提供理论依据。

[1] CHANG V, SUN G, LI J. Guest editorial: security and privacy for multimedia in the internet of things (IoT)[J]. Multimedia Tools & Applications, 2018:1-2.

[2] SWEENEY L. K-anonymity: a model for protecting privacy[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2002, 10(5):557-570.

[3] DWORK C, MCSHERRY F, NISSIM K. Calibrating noise to sensitivity in private data analysis[J]. Proceedings of the VLDB Endowment, 2006, 7(8):637-648.

[4] LU Q W, WANG C M, XIONG Y. Personalized privacy-preserving trajectory data publishing[J]. Chinese Journal of Electronics, 2017, 26(2): 285-291.

[5] FUNG B C M , WANG K , YU P S. Top-down specialization for information and privacy preservation[C]//International Conference on Data Engineering. 2005: 205-216.

[6] JIANG H W, ZENG G S, MA H Y. Greedy clustering-anonymity method for privacy preservation of table data-publishing[J]. Journal of Software, 2017,28(2):341–351.

[7] XU J, WANG W, PEI J, et al. Utility-based anonymization using local recoding[C]//Proceedings of the Twelfth ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. 2006.

[8] 李凤华, 李晖, 贾焰, 等. 隐私计算研究范畴及发展趋势[J]. 通信学报, 2016, 37(4): 4-14.

LI F H, LI H ,JIA Y, et al. Privacy computing: concept,connotation and its research trend [J]. Journal on Communications, 2016, 37(4): 4-14.

[9] 俞艺涵, 付钰, 吴晓平. 基于Shannon信息熵与BP神经网络的隐私数据度量与分级模型[J]. 通信学报, 2018, 39(12): 10-17.

YU Y H,FU Y, WU X P. A metric and classification model for privacy data based on Shannon information entropy and BP neural network[J]. Journal on Communications, 2018, 39(12): 10-17.

[10] JOHNSON A E W, POLLARD T J, LU S, et al. MIMIC-III, a freely accessible critical care database[J]. Scientific Data, 2016, 3: 160035.

Evaluation method of privacy protection effect based on multi-layer fuzzy comprehensive evaluation

YU Yihan1,2, FU Yu2, WU Xiaoping2

1. Flight Simulation Training Center, Navy Aviation University, Huludao 125001, China 2. Naval University of Engineering, Wuhan 430033, China

Aiming at the problem that the evaluation of the privacy protection effect from a single data level cannot describe the overall privacy protection effect of the network environment, with the help of the fuzzy comprehensive evaluation method, the privacy protection effect influencing factors were condensed from the entire life cycle of the data. According to the data privacy differences, the factors and block weights were determined, and the overall calculation results of the overall privacy protection effect of the network environment were obtained. Case analysis shows that the proposed method is feasible and effective.

privacy protection, evaluation of privacy protection effect, fuzzy synthesis, multi-level

s: The National Natural Science Foundation of China(61672531), Cyberspace Security Special Project(SQ2018YFGX210002-04)

TP393

A

10.11959/j.issn.2096−109x.2020082

俞艺涵(1992− ),男,浙江金华人,海军工程大学博士生,主要研究方向为信息安全、模拟仿真、隐私保护。

付钰(1982− ),女,湖北武汉人,博士,海军工程大学副教授,主要研究方向为信息安全风险评估。

吴晓平(1961− ),男,山西新绛人,博士,海军工程大学教授、博士生导师,主要研究方向为系统分析与决策。

论文引用格式:俞艺涵, 付钰, 吴晓平. 基于多层模糊综合评估的隐私保护效果评估方法[J]. 网络与信息安全学报, 2020, 6(6): 121-127.

YU Y H, FU Y, WU X P. Evaluation method of privacy protection effect based on multi-layer fuzzy comprehensive evaluation[J]. Chinese Journal of Network and Information Security, 2020, 6(6): 121-127.

2020−05−08;

2020−08−20

俞艺涵,chenyike1992@163.com

国家自然科学基金(61672531);网络空间安全重点专项(SQ2018YFGX210002-04)

猜你喜欢

生命周期因子评估
我刊2021年影响因子年报
全生命周期下呼吸机质量控制
不同评估方法在T2DM心血管病风险评估中的应用
第四代评估理论对我国学科评估的启示
一些关于无穷多个素因子的问题
从生命周期视角看并购保险
民用飞机全生命周期KPI的研究与应用
山药被称“长寿因子”
企业生命周期及其管理
扮靓爱车拒绝潜伏危险因子