基于同态加密算法的网址链接数据防泄漏算法
2021-11-17包空军孙占锋
包空军,孙占锋
(郑州轻工业大学,河南 郑州 450001)
1 引言
计算机在各个领域当中并被广泛应用,其中,企业隐私信息在网络中的安全性越来越受到关注。为了保护企业的机密信息不被有意或意外泄露,数据泄漏防范技术应运而生。
李家春等[1]提出一种基于防止协作式位置信息攻击的位置隐私保护方法,设计基于用户与好友在线交互的关系强度计算方法,给出关系强度与位置隐私的相关性和量化方法,提出基于协同位置信息隐藏和时间调整的位置隐私保护算法。在twitter数据集上的实验结果表明,该方法能够满足用户的位置隐私保护需求,且保护效果较好。王晓明等[2]提出一种无线网络数据传输加密协议的设计,利用AES加密算法加密用户数据中的数据头与数据体,根据TCP与UDP传输协议的不同属性,设计对应的数据加密方案。
上述两种方法在一定程度上可以防止敏感信息的泄漏,但防止用户通过非敏感数据和综合其它外部知识间接推断敏感信息的性能较差。为此提出一种网址链接数据防泄漏算法。其创新之处在于两方面:一方面采用同态加密算法,在云模式下更好的控制子系统,解决平台重要信息泄露问题,实现信息的保密传输;另一方面通过混沌序列防泄漏算法的设计,分析网址链接数据防泄漏算法的抗破译能力,运用密文数据统计呈现的状态,判断该算法的防泄漏性能,有效提高安全性和运行速度。
2 全同态加密算法数据保护特点分析
全同态加密保证了数据处理器处理后数据的明文信息,可以直接处理数据的密文,从而使用户信息得到相应的安全保障,但是其无法判断数据是否为明文。因此,本文采用全同态加密算法,在操作密文的同时,可以恢复明文[3-4],完善传统的加密模式。
首先,所提方法的原始信息加解密示意图如图1所示。云背景下信息加解密如图2所示。
图1 原始信息加解密示意图
图2 云背景下信息加解密示意图
如图2所示,在信息加解密过程中,该系统可以向连接到服务器的多个用户发送请求,但不利于隐藏和保护隐私信息。以上所有访问都需要通过服务器进行操作,访问控制模型的设计是针对云服务的特殊环节,主要是保证隐私访问的安全性,即只有满足信任级别的要求,才能授予权限[5],这确保了用户可以在其清晰可控的范围内访问网页,也可以提高访问级别,增加私有数据的保护程度,满足用户自身对网页的应用需求,保护私有数据。
需要对私有信息实施保护措施,Alice内存在私有函数fA与私有信息xA,Bob将私有信息yB用私有公钥kB实施加密,获得E(y)传输到Alice,Alice利用私有函数fA加密私有信息xA与E(yB)。充分利用全同态性质[6],函数fA将被隐藏处理,可通过Bob获得E(fA(xA,yB))。Bob利用私有的私钥加密操作D(E(fA(xA,yB)))=fA(xA,yB)。加密信息的处理过程在图3中展现。
图3 加密信息处理过程
图3对数据信息进行加密处理,Alice中存在私有函数fA,并运用私有公钥kB加密函数fA发送到Bob当中。Bob根据私有信息xB运算出E(fA)(xB)。利用同态性,对Bob的信息xB隐藏处理,获得了E(fA(xB)),并将其发送给Alice。Alice用私钥解密它以获得fA(xB)。加密函数的处过程在图4中展现。
通过以上研究,使用同态加密技术对重要数据进行加密并存储在云平台上。在这个过程中,用户使用的关键字是同态密文,因此不需要对密文数据进行解密。这不仅保证了存储在云存储平台上的用户数据的安全性,也缓解了用户对云平台不完全信任的现象,在一定程度上保证了用户的搜索隐私。
3 网址链接数据防泄漏算法
3.1 防泄漏模型与设计
由于定量混沌系统的信息丢失之后[7],序列信息逐渐趋于零,很难保证长期预测的准确性。另外,混沌同步是实现信息解密的关键手段,但由于相关信息在泄露之后,计算机系统只能恢复到整个系统的起始状态,所以,混沌序列的防泄漏方法被列为现代密码学的一个重要研究前沿。
由于web链路数据在传输过程中稳定性较差,并且伴随着一定程度的离散现象发生,因此需要获得离散时间动态系统轨迹。一维离散非线性动力系统定义表达式为
xn+1=T(xn)
(1)
在式(1)中,xn∈V,n=0,1,2,3…,而T:V→V作为映射过程,将网址实时状态xn映射至下一个状态xn+1。若从初始值x0开始并重复应用T,则会获取到序列{xn,n=0,1,2,3…},此序列代表离散时间动态系统的轨迹。
非线性动力系统具有随机性,对初始值的设定有较高的要求,需要符合序列密码的要求。设置从初始值的定义公式为
x0=μ×xn×(1-xn)
(2)
在式(2)中μ∈(0,4),xn∈(0,1)。当μ∈(3.5699456…,4)时,logistic映射序列呈现出混沌的状态。因此,{xn,n=0,1,2,3…}从初始值x0在logistic映射的基础上产生,展现出非周期且不收敛状态。
公式中的logistic映射混沌系统生成的序列的概率分布函数P表达式即
(3)
通过P(x)能够方便地计算出由Logistic映射产生的混沌序列进行统计。在x的时间平均值,即混沌序列轨迹点的平均值表达式为
(4)
针对互相关函数,分别选择两个初始值x0和y0,那么序列的互相关函数公式即
(5)
从以上分析可知,混沌动力系统的形式简单,对初始条件敏感,并且具有白噪声的统计特性[8]。
该动态系统中,实数序列映射到整数序列形成的伪随机序列{xk}称为加密密钥序列,也就是在发送数据给对方之前对数据进行加密,将加密后的数据发送给对方,解密后才能得到明确的文本,由此,本文采用一种Logistic混沌映射的防泄漏模型,进行数据防泄漏设置,该模型如图4所示。
图4 混沌序列防泄漏模型
考虑序列的随机性和加密速度,设计完整的网址链接数据防泄漏算法,在图5中展现。
图5 混沌防泄漏算法框图
随机数的间隔M取5为宜,而Yk取Xk小数点后的第4、5、6位,可以从根本上提升抗干扰能力[9]。已经证明,为了克服转换过程中的不利影响,可以去除一部分多余的数据,因为用户很难记住两个浮点数作为密码,在实际操作中需要将用户记忆的字符串映射到X0和α当中。
3.2 提升算法抗破译性能
密码分析的关键是获得用户设定的初始值x0或参数μ,将这两个值作为浮点数,设定计算机的浮点数的有效位数为16位,则15+15=30位的总数具有不确定性,其中可能组合数为1030。然而,现有的56bit DES防泄漏算法,对密钥耗尽攻击十分有效,即具有穷尽的译码安全性[10]。
为了提高对选择明文攻击的防御性,需要对Xn实施数据处理后,将Xn和Xn+1间的关系复杂化,以避免攻击者通过简单的操作求解μ的值。为了使其关系复杂化,利用区间取数的方法。如果Xn和Xn+1间有一个数字,那么两者的关系为:
(6)
3.3 密文数据的统计分布计算
网站链接数据在传输过程中所得到的部分数据是低价值数据,需要将其预处理、过滤和安全存储,实现综合处理,而随着时间的推移,网站链接数据将会增加,因此要对网站链接数据进行系统的管理、分类和定期清理。
采用混沌和色散的概念,使网站链接数据能够隐藏冗余的明文信息,那么防漏系统几回充分利用密文空间,即混沌序列充分利用防漏空间。此时,明文和密钥序列都被作为数据流的一个字节,选取任意字节的明文m和密钥k。设m取不同的值,即某一位出现0或1的概率不相等,并设出现0或1的数据位为单独事件。设定第一明文字节出现1的概率为Q,在理想标准下,密钥序列须符合白噪声特性[12],即每字节出现0或1的概率相等,为0.5。加密后链接数据密文c第一位出现1的概率表达式为
Q(ci=1)=Q(mi=1,ki=0)+Q(mi=0,ki=1)
=Q×0.5+(1-Q)×0.5=0.5
(7)
因此,可以判断加密密文的概率分布一致,至此实现网络链接数据防泄漏算法设计。
4 实验结果分析
为了验证本文所设计算法的防泄漏的有效性,在PC机上搭建了实验环境。硬件配置为:InterCorei5-2350M CPU @ 2.40GHz,8.0GB RAM。软件环境为Windows 8 64位操作系统,Matlab R 2014 b。此次实验使用麻省理工大学入侵检测实验室的KDD99数据集,选取的数据标签分为正常数据(3542条)与DOS攻击类数据(1458条)一共5000条数据。将文献[1]方法与文献[2]方法的数据保护方法作为对照组,并以生产不同长度明文的时间、入侵检测率作为实验指标。
4.1 不同明文长度生成时间
针对不同明文生成长度,当k=150和k=n1/2时的不同状态,对所需时间消耗进行分析,具体内容如表1所示。
表1 不同长度明文生成时间消耗
从表2可以看出,对于较小的文本,为了增加密文的抗攻击性和防泄漏性,可以选择不同k值的状态进一步确定。对容量较大的文本,选择k值为k=n1/2。为减少明文的加密时间,可以选择k=150。
4.2 不同方法的入侵检测率
为进一步验证本文算法的数据防泄漏性能,将入侵检测率作为实验指标,检测出的攻击数据占比越多,入侵检测率越高,越能保护网络链接数据的安全。在本实验中,将5000条数据随机划分为5组,每组1000条。用本文提出的网址链接数据防泄漏算法与文献[1]以及文献[2]方法检测5组数据中的DOC攻击数据。在MATLAB中,对5组数据实施分析操作,统计出不同方法的入侵检测率。具体内容如图6所示。
图6 不同方法的入侵检测率对比图
通过图6可以看出,检测5组数据过程中,对比的两种方法入侵检测率在30%~60%之间,本文算法的入侵检测率则始终高于80%。是因为本文通过混沌序列抗泄漏算法的设计,提高了对攻击数据检测精度,与其它两种算法相比较而言更加可靠,且具有显著优越性。
5 结论
1)为完善网址链接数据传输过程易发生隐私泄露的情况,提出一种网址链接数据防泄漏算法,基于同态加密算法构建新的数据加密与存储模式,当密钥值k=n1/2时,其抗攻击性和防泄漏性较强。
2)为了避免物理同步混沌系统中攻击者入侵问题,利用计算机软件实现了数据文件的加密,取得了满意的效果,其入侵检测率高于80%,当密钥值k=150时,明文的加密时间较低,传输过程的运行速度快。
3)受到实验平台和现有技术的限制,所提方法只能单独设置密钥值,即只能满足单一防御目标,下一阶段研究重点要放在系统运行过程复杂度上面,减少系统所占用的内存,增加系统的同步处理能力。