APP下载

隐蔽网络信息安全指数多维属性分类仿真

2021-11-17刘文祺

计算机仿真 2021年2期
关键词:贝叶斯准确率变量

田 伟,刘文祺

(1. 中国人民解放军95333部队,湖南 长沙 410114;2. 电子科技大学计算机科学与工程学院,四川 成都 611731)

1 引言

网络信息可以加强社会的治理,但由于网络信息的开放性,导致网络信息会受到大量的恶意攻击,网络信息安全问题已经成为信息领域的一大难点[1]。隐蔽网络信息也同样具有安全的难题,通常情况下,大多数学者会采用安全指数对隐蔽网络信息安全进行相应的衡量,其主要指的是在网络安全的状态下,网络信息反映的数据特征变化程度是一个相对的数值变化,主要是对网络信息安全状态进行相应的反映与度量,将其简称为网络信息安全指数[2]。隐蔽网络信息安全指数具有多维属性的特性。如何对隐蔽网络信息安全进行正确的评估已经成为学者研究的重点课题之一,而隐蔽网络信息安全指数多维属性分类则是其中的关键步骤,只有对隐蔽网络信息安全指数进行合理的分类,才能对其网络信息安全进行正确的评估,从而对其进行相应的保护。

就现有的研究来看,使用较为广泛的隐蔽网络信息安全指数多维属性分类方法主要有三种,分别为粗糙集理论方法、支持向量机方法与K-最近邻域方法。其中,基于粗糙集理论的隐蔽网络信息安全指数多维属性分类方法主要是区分确定性与完整性较低的数据,并对其进行有效分析,同时对该类数据中包含的不相关信息进行剔除,这种方法具有易于执行、操作简单的优势;基于支持向量机的隐蔽网络信息安全指数多维属性分类方法主要是针对线性与非线性数据进行分类的[3]。支持向量机实质是一种学习算法,其主要是通过创建平面来对信息进行合理的分类;基于K-最近邻域的隐蔽网络信息安全指数多维属性分类方法通过选择K个与样本相似的训练实例,对样本的标签进行预测,以此来实现样本的分类。但是上述三种方法均存在着分类准确率及效率低的缺陷,无法适应现今网络的需求,为此提出隐蔽网络信息安全指数多维属性分类方法,并采用仿真对比实验对提出方法的分类性能进行验证与分析。

2 隐蔽网络信息安全指数多维属性分类方法设计

2.1 选择隐蔽网络信息安全指数属性

对于隐蔽网络来说,其特点在于复杂程度较高、节点的规模较大,同时网络信息之间的关系也较为复杂[4]。将隐蔽网络信息安全指数看作为一个复杂的信息系统,其表现形式可分为三种,分别为实体、关联与整体。

其中,信息实体指的是处于网络信息节点处的原数据,其不仅具有实体属性,同时还具备关联属性。而实体属性指的是网络信息的具体表现形式,关联属性指的是网络信息中信息实体所在的位置与层级之间的关系;信息关联指的是两个或者两个以上的信息实体之间的联系,信息之间的关联属性主要是通过网络信息结构来体现;信息整体指的是将网络信息看作为一个整体,其中包含信息实体与信息关联,实质上是一个具有信息关联的信息实体,与信息实体具有同样的属性。

为得到隐蔽网络信息安全指数属性,采用混合法对其属性进行相应的筛选。混合法主要将包装法与过滤法进行有效的结合,将各自优势充分发挥,得到更加适合安全指数分类需求的属性集合[5]。隐蔽网络信息安全指数属性集合主要分为三种,分别为实体属性集合、关联属性集合与时间属性集合,而其具体定义如表1所示。

表1 隐蔽网络信息安全指数属性分类情况表

根据上述分类情况可知,一般情况下网络信息安全指数映射可视化划分关系,可分为结构映射与图形映射关系。其中,图形映射方法能够提供隐蔽网络信息安全指数实体属性,而结构映射方法可显示关联属性与时间属性隐形结构[6]。隐蔽网络信息安全指数多维属性映射关系如图1所示。

图1 隐蔽网络信息安全指数多维属性映射关系图

通过上述过程完成了隐蔽网络信息安全指数多维属性的分析,并采用混合法对属性进行提取,得到适合安全指数分类需求的属性集合,为下述网络信息安全指数多维属性分类打下夯实的基础。

2.2 构建多维贝叶斯分类模型

以上述隐蔽网络信息安全指数多维属性的分析为基础,构建多维贝叶斯分类模型,为安全指数多维属性分类提供模型支撑[7]。

多维贝叶斯分类模型主要以多维贝叶斯分类器为主,采用分类器对安全指数多维属性进行分类。在安全指数多维属性分类中,主要采用具有有限顶点集的贝叶斯网络,其属性集合为

V={C1,…Cm,X1,…Xn}

(1)

其中,Cm表示的是具有m个类变量;Xn表示的是具有n个属性变量。任意类变量Ci与任意属性变量Xi均提取于有限集合;而多维贝叶斯分类器主要是通过参数πijk与参数θijk对其进行相应的控制,参数表达式为

(2)

其中,ck表示的是类变量的取值;Pa(Ci)表示的是类变量的节点集合;xk表示的是属性变量的取值;Pa(Xi)表示的是属性变量的节点集合。

多维贝叶斯分类器主要采用双分裂有向图对类变量与属性变量之间的关系进行连接与显示。多维贝叶斯分类器对其进行表示

S=(V,A)

V=(VC,VF)

A=(AC,AF,AAC)

(3)

其中,V表示的是属性集合,由VC={C1,…,Cm}与VF={X1,…Xn}组成;A表示的是弧集,其主要由三个集合组成,分别为类变量集合AC、属性变量集合AF与属性变量与类变量乘积集合ACF。

多维贝叶斯分类模型可以采用图形进行表示,其包含三个子图,分别为类子图、属性子图与桥子图。多维贝叶斯分类模型示意图如图2所示。

图2 多维贝叶斯分类模型示意图

其中类子图SC=(VC,AC)如图3所示,属性子图SF=(VF,AF)如图4所示,桥子图SCF=(V,ACF)如图5所示。

图3 类子图示意图

图4 属性子图示意图

图5 桥子图示意图

多维属性分类问题实质上是对最大后验概率的估计问题,也是一个非确定性问题,而多维贝叶斯分类模型可以极大简化分类的过程,提升分类方法的分类效率[8]。

通过上述过程实现多维贝叶斯分类模型的构建,可以极大地提升隐蔽网络信息安全指数多维属性分类方法的分类效率。

2.3 约减隐蔽网络信息安全指数属性集合

以上述构建的多维贝叶斯分类模型为基础,对隐蔽网络信息安全指数属性集合进行处理,为安全指数多维属性分类提供硬件设备支撑。

采用属性选择算法对2.1小节得到的属性集合进行约简。常用的属性选择算法主要有三种,分别为蚁群优化算法、菌群优化算法以及类电磁机制算法。根据安全指数多维属性的特点,选择菌群优化算法作为分类方法中的属性选择算法[9]。

菌群优化算法主要是采用加权策略对冗余变量进行消除,以此来提升所提方法的分类准确率。安全指数的每个属性权重随着频数与属性变量之间的关系及类变量与属性变量之间的关系发生变化。菌群优化算法对得到的安全指数属性集合进行加权,权重表示为

ωi={ω1,ω2,…,ωn}

(4)

根据式(4)对属性进行相应的选择,但是会出现属性重复的情况,因此需要对其进行约简处理,主要通过属性子集的适应度函数值对权重进行更新,对上述步骤进行重复直至函数值稳定,菌群优化算法结束。菌群优化算法流程如图4所示。

图6 菌群优化算法流程图

通过上述过程完成了隐蔽网络信息安全指数属性集合的约简,得到约简属性集合为V′F={x1,…xn},简化了安全指数多维属性分类的过程,为下述隐蔽网络信息安全指数多维属性分类提供数据支撑。

2.4 实现隐蔽网络信息安全指数多维属性分类

由于隐蔽网络信息安全指数数据具有多维属性的特征,计算复杂程度较高,无法直接对其进行分类处理,因此需要对其多维属性分类,降低数据的维度,为安全指数的分类提供方便。以上述得到的约简属性集合及多维贝叶斯分类模型为依据,对隐蔽网络信息安全指数进行多维属性分类[10]。具体的过程如下所示。

1)对给定的类变量Ci(i=1,2,…,m)创建一个对应的贝叶斯分类器S,以菌群优化算法得到约简属性集合为V′F。

2)在约简属性集合V′F中随机抽取m个数据,将其转化为多维二进制向量,采用0或1对其属性选择状态进行显示,其中0表示属性未被选择,1表示属性被选择[11-12]。同时,必须保证抽取的数据不能重复,对数据的目标函数值进行相应的计算,将最优目标函数值对应的数据进行提取,为xV′F;

3)将xV′F赋值到数据y上,选择一个随机数λ,若λ大于0.5,则y对应的属性被选择;反之则y对应的属性未被选择,并对y的目标函数值进行相应的计算。在迭代的过程中,若y的目标函数值超过xbest,则迭代结束,并对xbest值进行更新;

4)对数据的总力向量进行计算,以数据的目标函数值为基础,对其进行迭代计算,则数据的总量为

(5)

5)根据式(5)计算出来的结果为依据,按照分类规则对隐蔽网络信息安全指数进行多属性分类,分类规则表示为

(6)

通过上述过程实现了隐蔽网络信息安全指数的多属性分类,为隐蔽网络信息安全提供更加有效的数据支撑。

3 仿真对比实验分析

上述完成了隐蔽网络信息安全指数多属性分类方法的设计,并实现了安全指数的多属性分类,对该方法的可行性进行验证。但是对其是否能够解决现有方法存在的问题依然无从可知,因此设计仿真对比实验对其进行验证。仿真对比实验主要采用提出的隐蔽网络信息安全指数多属性分类方法与基于粗糙集理论的隐蔽网络信息安全指数多维属性分类方法(现有方法1)、基于支持向量机的隐蔽网络信息安全指数多维属性分类方法(现有方法2)与基于K-最近邻域的隐蔽网络信息安全指数多维属性分类方法(现有方法3)进行对比分析,为了方便实验进行,将实验方法简称为提出方法与现有方法1、2和3。

在仿真对比实验中,主要通过分类准确率与分类效率对方法的性能进行描述。具体的实验过程如下所示。

3.1 分类准确率对比分析

分类准确率直接决定着方法的分类性能,分类准确率越高,则方法性能也就越好。通过实验得到分类准确率对比情况如表2所示。

表2 分类准确率对比情况表

如表2所示,提出方法的分类准确率远远的高于现有三种方法。由于所提方法通过菌群优化算法在抽取数据过程中有效避免重复信息的出现,并对数据的目标函数值进行相应的计算,最终提取到最优目标函数值对应的数据,以提高对隐蔽网络信息安全指数进行多维属性分类的准确率,其分类准确率最高可以达到95%。

3.2 分类效率对比分析

通过实验得到分类效率对比情况如图7所示。

图7 分类效率对比情况图

如图7所示,提出方法的分类效率远远的高于现有三种方法,所提方法采用双分裂有向图对类变量与属性变量之间的关系进行连接显示构建多维贝叶斯分类器。完成对安全指数多维属性进行分类。有效提高分类效率,其分类效率最高可以达到95%。

通过上述实验结果发现,提出的隐蔽网络信息安全指数多维属性分类方法极大的提升了分类准确率与分类效率,充分说明提出的隐蔽网络信息安全指数多维属性分类方法具备更好的分类性能。

4 结束语

提出的隐蔽网络信息安全指数多维属性分类方法极大的提升了分类准确率与分类效率,可以为隐蔽网络信息安全评估提供更为可靠的数据支撑。由于实验对实际情况中干扰因素的忽视,导致实验结果具有一定的误差,因此需要对提出方法进行进一步的优化与探索。

猜你喜欢

贝叶斯准确率变量
乳腺超声检查诊断乳腺肿瘤的特异度及准确率分析
多层螺旋CT技术诊断急性阑尾炎的效果及准确率分析
不同序列磁共振成像诊断脊柱损伤的临床准确率比较探讨
颈椎病患者使用X线平片和CT影像诊断的临床准确率比照观察
租赁房地产的多主体贝叶斯博弈研究
租赁房地产的多主体贝叶斯博弈研究
贝叶斯网络概述
贝叶斯公式的应用和推广
分离变量法:常见的通性通法
不可忽视变量的离散与连续