上行链路干扰下双层网络中心数据挖掘方法

2022-07-20冀江瑀陈秀波

计算机仿真 2022年6期

冀江瑀，陈秀波

(1. 北京邮电大学网络空间安全学院，北京 102206；2. 北京邮电大学网络空间安全学院信息安全中心，北京 102206)

1 引言

随着互联网技术的不断发展，网络中多样数据的呈现不断增长趋势。这些数据的出现影响了网络运行速度以及数据挖掘的难度。其中，双层网络是采用物联网和无线传感组网进行网络组网设计的分布式网络拓扑结构，双层网络在实现数据传输中容易受到上行链路干扰，导致双层网络可靠性较低，需要对上行链路干扰下双层网络中心数据进行挖掘，提升双层网络中心数据的可靠性。采用上行链路干扰抑制和特征提取方法，进行双层网络中心数据挖掘优化，提高对双层网络中心数据的检测和识别能力，相关双层网络中心数据挖掘方法研究将在优化网络的传输性能，提高网络输出稳定性对双层网络的优化十分重要。为此，该领域相关研究者进行了很多研究，并取得了一定成果。

文献[3]提出复杂光纤网络多来源数据深度挖掘方法。该方法通过优化后的粒子群算法寻找到网络中数据的特点，将获取的数据特征和网络中多种其它数据流相融合，将数据集合中数据长度进行排列，然后对数据密度进行解析和聚类，完成网络中数据的挖掘。该方法有效分析了光纤网络中数据特征，提取精度较高，但该方法未过多考虑多层次网络环境中多种数据，存在一定局限性。文献[4]提出基于模糊神经网络的异常网络数据挖掘方法。该方法首先获取了网络中异常数据之间存在的相似之处，将数据的属性特征进行有效的获取，在此基础上，引入联合关联规则将获取的数据特征进行模糊融合处理，将处理后的结果进行混合加权和自适应分块匹配，完成网络数据集的挖掘。该方法对异常数据的挖掘精度较好，但操作过程复杂且耗时较长。

针对上述方法中存在的问题，本文提出一种新的双层网络中心数据挖掘方法。该方法通过对双层网络中心数据特征的获取以及对双层网络中干扰数据的抑制等处理，完成了双层网络中心数据挖掘方法的优化。该方法研究了上行链路干扰情况下数据挖掘方法，与传统方法相比具有数据挖掘精度高、耗时短等优势，具有一定研究价值。

2 双层网络中心数据的存储模型

2.1 双层网络中心数据存储模型构建

为了实现上行链路干扰下双层网络中心数据挖掘，首先构建上行链路干扰下双层网络传输和分析模型，根据数据的数值属性和分类属性进行模糊聚类和信息融合处理。

当上行链路干扰下双层网络中心数据分布关联映射存在

：

→

2+1，表示

(

)=[

(

)，

(

))，…，

(

))]为一个采样节点分布集，上行链路干扰下双层网络中心数据采集的标签分布集为

(1)

根据上行链路干扰下双层网络中心数据的种类属性

(

=1，2，…，

)进行特征分类，令

，

，…，

}是混合属性数据集

上的一个向量分布集合，根据上行链路干扰下双层网络中心数据采样的节点分布模型，双层网络中心数据的稀疏性特征分解模型为

2π(

)[

(

2π

(

))

(2)

(3)

根据上述分析，此时需要提取上行链路干扰下双层网络中心数据的统计特征量和关联规则特征量，并对该环境下网络中的核心数据进行获取和保存，构建的储存模型如图1 所示。

图1 双层网络中心数据分布存储模型

2.2 分块区域融合

在上述构建的双层网络中心数据存储模型基础上，将上述数据进行有效的融合十分重要。本文采用分块区域融合方法进行网络数据的分块区域融合处理，结合特征提取结果进行数据挖掘，在大规模数据集约束下，上行链路干扰下双层网络中心数据的关联规则知识集为

(4)

其中，

(

)为上行链路干扰下双层网络中心数据的统计特征量模糊加权值。

在模糊关联度约束下，进行上行链路干扰下双层网络的分布式融合处理，结合模糊质心和均值进行上行链路干扰下双层网络中心数据的自适应融合，数据对象的统计特征值为

(5)

在混合属性条件下，数据关联规则点记为[

，

]，在有限数据集内，相异度特征量满足

∈[

，

]，数值属性的属性值为

(6)

其中，

表示上行链路干扰下双层网络中心数据的能量分布幅值，为

阶方阵，即

，，0<

，

}，其中

，为上行链路干扰下双层网络中心数据的鲁棒特征分布矩阵，表示为

×1。

3 双层网络中心数据挖掘算法优化

3.1 上行链路干扰抑制

在上述提取的上行链路干扰下双层网络中心数据基础上，对其进行数据挖掘优化分析。构建双层网络中心数据的多维尺度分解模型，采用射频标签识别技术进行上行链路干扰下双层网络中心数据的向量量化处理，构建上行链路干扰下双层网络中心数据多源分布模型

，

，…，

]

(7)

采用语义本体模型检测方法，将上行链路干扰下双层网络中心数据进行多元划分。根据挖掘数据的维度特征，采用云计算方法进行处理。将数据从高维降低到低维，构建上行链路干扰下双层网络中心数据融合模型，即

max

(

)=(

(

)，

(

)，…，

(

))

s.t.

(

)≤0(

=1，2，…，

)

(

)=0(

=1，2，…，

)

(8)

采用模糊关联规则调度方法对获取的双层网络中心数据进行寻优处理。获取双层网络中任意节点的首要特征，在指定离散区间内上行链路双层网络中心数据挖掘的关联规则集表达式为

(9)

(10)

(11)

其中，

(

)、

(

)表示上行链路干扰下双层网络中心数据的关联融合度，

、

为混合属性条件向量集量，

(

∩

)是上行链路干扰下双层网络中心数据融合的交叉分布概念集。从数据集中随机选择

个不同的数据进行参数自适应调节，得到调节系数，结合资源融合调度方法，对簇中心数值属性进行分类设计，得到输出为

，数值属性的模糊特征集为

。上行链路干扰下双层网络中心数据挖掘的匹配度为

(12)

设定上行链路干扰下双层网络中心数据分布关键指标特征分布为

，

………

)，在有限空间内，得到上行链路干扰下双层网络中心数据挖关联规则知识库分布结构满足

，∀

∈[0，

-1]。根据上述分析，实现对上行链路干扰下双层网络中心数据挖掘的干扰抑制。

3.2 数据挖掘输出

根据关联知识融合结果进行双层网络中心数据的相关性融合，结合自适应滤波方法进行上行链路干扰抑制，实现上行链路干扰下双层网络中心数据挖掘优化，构建上行链路干扰下双层网络中心数据的量化融合矩阵

+1，计算式如下

(13)

将规模为

的数据集

划分

个聚类簇，进行上行链路干扰下双层网络中心数据的测度分解，得到测度分解矩阵为

(14)

(15)

考虑等价语义映射，得到上行链路干扰下双层网络中心数据分布的链路集满足

∈

×、

∈

×和

∈

×，特征分布集满足

～

(

，

)，上行链路干扰下双层网络中心数据挖掘的整合矩阵：

(16)

根据上述分析，结合上行链路干扰下双层网络中心数据整合的匹配指标集

∈

(

=1，2，…，

)，构建数据挖掘的图模型为

∈

(

=1，2，…，

)，由此实现上行链路干扰下双层网络中心数据挖掘优化。

4 仿真分析

4.1 实验环境及参数

仿真在Matlab 7.2 软件上进行，操作系统为Windows XP 系统，CPU 为3.6 GHz，运行内存为8 GB，上行链路干扰下双层网络中心数据采样的分块长度为800，对双层网络中心数据检测的迭代次数为100，上行链路干扰下双层网络中心数据采样样本的个数为1024，采样的周期为T=0.04 s，双层网络中心数据挖掘过程中，受到上行链路干扰下的强度为SNR=0～24 dB。双层网络中心数据的采样结果如图2所示。

图2 双层网络中心数据的采样结果

4.2 仿真结果分析

以图2数据为测试对象，构建双层网络中心数据的多维尺度分解模型，根据关联知识的融合结果进行双层网络中心数据的相关性融合，得到数据挖掘输出如图3所示。

图3 数据挖掘输出

分析图3得知，采用本文方法能有效实现双层网络中心数据挖掘，数据挖掘输出的特征分辨力较好。随着尺度系数的不断改变，采用所提方法进行数据挖掘后输出的波形较为稳定，且在规定时间范围内数据输出的特征分辨率较为明显，验证了所提方法的有效性。

为保证所提方法的有效性，仿真分析了所提方法、复杂光纤网络多来源数据深度挖掘以及基于模糊神经网络的异常网络数据挖掘对上行链路干扰下双层网络中心数据挖掘精度进行了对比，为保证实验精度，进行了多次迭代分析，且获取的结果均为平均值，实验结果如图4 所示：

图4 不同方法数据挖掘精度分析

分析图4 可以看出，随着迭代次数的改变，所提方法、复杂光纤网络多来源数据深度挖掘以及基于模糊神经网络的异常网络数据挖掘方法在数据挖掘中的精度发生一定改变。其中，所提方法的数据挖掘精度最高约为98 %，复杂光纤网络多来源数据深度挖掘的数据挖掘精度最高约为78 %，基于模糊神经网络的异常网络数据挖掘方法的数据挖掘精度最高约为76 %，相比之下所提方法的挖掘精度最高。这是由于所提方法针对网络中存在的干扰数据进行抑制，提升了数据挖掘的精度，验证了所提方法的科学有效性。

为进一步分析所提方法的有效性，仿真测试不同方法进行数据挖掘的时间开销，得到对比结果见表1所示：

表1 时间开销对比(单位：s)

分析表1中数据得知，在相同实验环境下进采用三种方法对上行链路干扰下双层网络中心数据挖掘的时间开销存在一定差距。其中，所提方法的时间开销最短约为0.34 s，而其它两种方法的时间开销始终高于所提方法，验证了所提方法的可行性。这是由于所提方法在进行数据挖掘之前评估不同属性数据度量值，获取上行链路干扰下双层网络中心数据的谱特征分布，根据关联规则特征量构建双层网络中心数据分布存储模型，降低了数据挖掘的复杂程度，进而降低了挖掘的耗时。

5 结束语

针对上行链路干扰下双层网络中心数据挖掘方法中存在的一定问题，提出了一种全新的优化方法。该方法首先获取双层网络中心数据的特征及分布情况，然后将其数据特征进行融合，对数据向量进行量化处理，在双层网络中心数据中存在干扰时，对其进行有效的抑制，实现了上行链路干扰下双层网络中心数据挖掘方法的优化。与传统方法相比所提方法具有以下优势：

1)采用所提方法对上行链路干扰下双层网络中心数据挖掘进行传输的分辨率效果较好，具有一定优势；

2)采用所提方法对上行链路干扰下双层网络中心数据挖掘的精度最高约为98 %，具有一定可信度。

3)采用所提方法对上行链路干扰下双层网络中心数据挖掘进行传输的时间开销最短约为0.34 s，其处理速度较快。

虽然本文方法在现阶段取得了一定成果，但还存在一定不足，未来将对数据中干扰成分进行详细研究，以提升数据挖掘的性能。