APP下载

基于卷积神经网络的网页信息资源定向抽取方法研究

2021-05-22周沭玲

关键词:定向网页分布式

周沭玲

基于卷积神经网络的网页信息资源定向抽取方法研究

周沭玲

(合肥财经职业学院 人工智能学院,合肥 230601)

为了提高分布式融合集成网络网页信息资源定向抽取能力,提出基于卷积神经网络的分布式融合集成网络网页信息资源定向抽取方法。构建分布式融合集成网络网页信息的自适应聚类处理模型,获得分布式融合集成网络网页信息数据集合,采用多重属性调度的方法,建立高分布式融合集成网络网页信息检测的模糊度训练集,实现对网页信息资源的模糊参数辨识与融合,采用最优策略下均衡控制的方法,得到高分布式融合集成网络网页信息的模糊决策特征调度矩阵,通过自相关检测识别与参数寻优的方法实现网页信息资源的定向抽取。仿真结果表明,采用该方法进行网页信息资源定向抽取的精度较高,自适应性较好,提高了网页信息资源定向抽取能力。

分布式融合集成网络;卷积神经网络;网页信息资源;定向抽取

随着分布式融合集成网络网页信息规模的增大,需要对该信息进行有效定位检测,构建分布式融合集成网络网页信息融合模型,采用分叉树决策方法,结合对分布式融合集成网络网页信息的特征分布,采用语义信息特征识别和中文标签定位,实现对分布式融合集成网络网页信息定位检测。结合大数据分析技术,构建网页信息资源定向抽取的信息定位模型[1],通过语义信息分析方法,实现对网页信息资源定向抽取,研究网页信息资源定向抽取方法,在网页大数据信息挖掘和特征检测中具有重要意义[2]。

对分布式融合集成网络网页信息的定位是建立在语义特征分析和标签识别基础上,构建分布式融合集成网络网页信息参数特征检测模型,采用关联特征挖掘技术,实现对分布式融合集成网络网页信息定位[3],传统方法中,对分布式融合集成网络网页信息定位抽取方法主要有基于模糊参数匹配的分布式融合集成网络网页信息定向抽取方法、基于特征演化和融合聚类分析的网页信息资源抽取方法、基于最大信息熵特征匹配的分布式融合集成网络网页信息定向抽取方法等[4-6],构建分布式融合集成网络网页信息定向抽取的参数特征分布模型,结合样本数据融合的方法,实现对分布式融合集成网络网页信息定向抽取,但传统方法进行分布式融合集成网络网页信息定向抽取的特征聚类性不好,抽取的精度不高。针对上述问题,本文提出基于卷积神经网络的分布式融合集成网络网页信息资源定向抽取方法。首先构建高分布式融合集成网络网页信息的定向数据采集模型,结合频繁项挖掘方法进行分布式融合集成网络网页信息资源融合和模糊定位处理,采用卷积神经网络确定分布式融合集成网络网页信息资源的驱动信息特征量。然后根据网页信息资源数据样本的位置分布,结合聚类分析方法,实现对网页信息资源定向抽取的模糊参数辨识,通过自适应寻优和二乘规划算法,利用极大熵原理来确定信息资源的位置参数,建立卷积神经网络的动态调节弹性网络神经元解析控制模型,通过参数寻优和大数据挖掘,实现对网页信息资源定向抽取。最后进行仿真测试分析,展示了本文方法在提高网页信息资源定向抽取能力方面的优越性能。

1 网页信息资源大数据采集和参数融合

1.1 网页信息资源大数据采集

为了实现分布式融合集成网络网页信息定向抽取,结合标签识别方法,构建分布式融合集成网络网页信息定向数据采集模型,将数据集中的数据点划分为为多变量分布区间,通过分区块调度的方法,构建分布式融合集成网络网页信息的自适应融合聚类处理模型[7],结合语义关系知识库和概念库检测的方法,实现分布式融合集成网络网页信息的中文多标签识别,通过模糊样本提取,得到分布式融合集成网络网页信息的标签样本分布序列,为

图1 分布式融合集成网络网页信息采集的分岔数模型

在分布式融合集成网络网页信息采集的分岔数模型的基础上提取数据信息,构建高分布式融合集成网络网页信息的加权信息参数融合模型,促进网页信息资源的参数融合。

1.2 网页信息的加权信息参数融合

2 网页信息资源特征提取与定向抽取输出

2.1 网页信息资源特征提取

采用卷积神经网络学习方法,获得分布式融合集成网络网页信息资源分布的列表属性,将哈希表中所有值并入结果集合中[12],得到高分布式融合集成网络网页信息抽取的特征权重为

其中,高分布式融合集成网络网页特征空间的聚类函数满足

采用最优策略下均衡控制的方法,建立高分布式融合集成网络网页信息的模糊特征调度矩阵:

将任意概念集空间进行特征分解,构建高分布式融合集成网络网页信息定向抽取的目标函数,提高分布式融合集成网络网页信息资源定向抽取能力。

2.2 网页信息资源定向抽取输出

引入社会最优接入率作为测试集,采用多层次的空间聚类分析方法,构建分布式融合集成网络网页信息资源特征信息重组模型[13],得到分布式融合集成网络网页信息资源融合的优先控制参数特征集为

综上分析,采用卷积神经网络学习,得到分布式融合集成网络网页信息资源抽取的卷积函数为

综上分析,通过自适应寻优和二乘规划算法,利用极大熵原理来确定信息资源的位置参数,建立卷积神经网络的动态调节弹性网络神经元解析控制模型,通过参数寻优和大数据挖掘,实现对网页信息资源定向抽取。

3 仿真实验与结果分析

为了验证基于卷积神经网络的网页信息资源定向抽取方法的实际应用性能,设计如下仿真实验。

实验环境:实验以分布式融合集成网络为例,网页信息资源采集的样本数为1200,测试集为240,网页信息资源抽取的训练集规模为200,信息分布的频谱带宽为15.8dB,相似度系数为0.14,网页信息资源分布的关联系数为0.26。根据上述参数设定,得到网页信息资源抽取的节点定位结果如图2所示。

图2 网页信息资源抽取的节点定位结果

图2中显示了网页信息资源抽取过程的节点定位采集结果,可以看出,采集节点分布较为广泛,可以提高实验结果的可靠性。

以图2结果为基础抽取网页信息资源,将本文方法与传统的基于条件随机场模型的大数据资源定向抽取方法(文献[2]方法)和基于分段融合调度的大规模信息智能定向检索挖掘方法(文献[7]方法)进行对比,得到不同方法抽取到的网页信息资源的收敛值输出如图3所示。

图3 网页信息资源的收敛值输出结果

分析图3所示结果可知,文献[2]方法的收敛度在最初略高于文献[7]方法,后期存在明显的下降。而本文方法的收敛度曲线始终位于文献[2]方法和文献[7]方法之上,其最大收敛度接近于0.8,说明应用本文方法抽取网页信息资源的收敛度较好,可以提高抽取结果的特征聚类性和定向性。

在此基础上,测试不同方法抽取网页信息资源抽取的误差,得到对比结果如表1所示。

分析表1所示结果可知,随着待抽取样本数量的增加,不同方法的误差率也随之增加。相比之下,文献[2]方法和文献[7]方法进行网页信息资源抽取时的误差率更高,而本文方法的误差率偏低一些,最大的误差率仅为0.30,证明本文方法的抽取精度较高、具有良好的自适应性。

4 结束语

结合大数据分析技术,构建网页信息资源定向抽取的信息定位模型,通过语义信息分析方法,实现对网页信息资源定向抽取,本文提出基于卷积神经网络的分布式融合集成网络网页信息资源定向抽取方法。构建分布式融合集成网络网页信息定向数据采集模型,结合语义关系知识库和概念特征库检测的方法,实现分布式融合集成网络网页信息的中文多标签识别和特征分析,根据网页信息资源数据样本的位置分布,结合属性融合聚类分析方法,实现对网页信息资源定向抽取的模糊参数辨识与融合,采用卷积神经网络实现对网页信息资源定向抽取。分析得知,本文方法进行网页信息资源抽取的精度较高,聚类性较好,误差较小。

表1 网页信息资源抽取的误差率对比结果

[1] 廖彬,张陶,于炯,等. 多MapReduce作业协同下的大数据挖掘类算法资源效率优化[J]. 计算机应用研究,2020, 37(5): 1321-1325.

[2] 程月. 大数据资源中用户需求信息定向提取仿真[J]. 计算机仿真,2018, 35(5): 422-425.

[3] 马峻岩,张颖,李易,等. HA2:层次化的物联网感知设备固件异常分析技术[J]. 计算机工程与应用,2019, 55(22): 60-68.

[4] 李帅,王国胤,杨洁. 基于云综合方法的三支群决策模型[J]. 计算机应用,2019, 39(11): 3163-3171.

[5] 王亮,冶继民. 整合DBSCAN和改进SMOTE的过采样算法[J]. 计算机工程与应用,2020, 56(18): 111-118.

[6] 李孜颖,石振国. 面向大数据任务的调度方法[J]. 计算机应用,2020, 40(10): 2923-2928.

[7] 朱飞燕. 大数据资源调度中多种类复杂信息智能定向检索[J]. 自动化与仪器仪表,2019, 32(02): 124-127.

[8] 方军,张璋,张雪峰,等. 基于均衡适应度的云工作流调度算法[J]. 计算机应用与软件,2019, 36(5): 255-261.

[9] 张引,陈敏,廖小飞. 大数据应用的现状与展望[J]. 计算机研究与发展,2013, 50(Z2): 216-233.

[10] 李罡,吴志军. 基于多QoS约束条件的广域信息管理系统任务调度算法[J]. 通信学报,2019, 40(7): 27-37.

[11] Shu W, Qian W, Xie Y, et al. An efficient uncertainty measure-based attribute reduction approach for interval-valued data with missing values[J]. International Journal of Uncertainty, Fuzziness and Knowledge-Based Systems, 2019, 27(6): 931-947.

[12] 贾博婷,赵天威,祝志川. 基于熵值修正G2赋权的综合评价方法及实证[J]. 统计与决策,2019, 35(8): 30-35.

[13] 王楚捷,王好贤. M-CORD下无线接入网络资源分配研究[J]. 计算机工程与应用,2018, 54(22): 92-98.

[14] 周亮. 基于语义相似性关联特征提取的大数据挖掘技术[J]. 智能计算机与应用,2018, 8(5): 134-137, 142.

[15] 李宇海,于快快. 基于局部自相关性的特异性光谱谱段选取算法[J]. 光电技术应用,2018, 33(2): 20-23, 31.

Research on directional extraction method of Web information resources based on convolutional neural network

ZHOU Shu-ling

(Institute of Artificial Intelligence, Hefei College of Finance & Economics, Hefei 230601, China)

In order to improve the directional extraction ability of distributed fusion integrated network Web page information resources, a method of directional extraction of distributed fusion integrated network Web page information resources based on convolutional neural network is proposed. Construct a distributed fusion integrated network Web page information adaptive deletion clustering processing model, obtain a discrete set of distributed fusion integrated network Web page information data, adopt multiple attribute scheduling methods, and establish a highly distributed fusion integrated network Web page information detection ambiguity. The training set realizes the identification and fusion of fuzzy parameters of Web page information resources, adopts the method of balanced control under the optimal strategy, and obtains the fuzzy decision feature scheduling matrix of highly distributed fusion integrated network Web page information, and identifies and optimizes parameters through autocorrelation detection. The method achieves the targeted extraction of Web information resources. The simulation results show that this method has higher accuracy and better adaptability for directional extraction of Web information resources, which improves the ability of directional extraction of Web information resources.

distributed converged integrated network;convolution neural network;Web information resources;directional extraction

2020-12-18

周沭玲(1983-),女,江苏沭阳人,讲师,硕士,主要从事软件工程、管理信息化研究,zhouzhou_508@163.com。

TP391.1;TP183

A

1007-984X(2021)04-0033-05

猜你喜欢

定向网页分布式
基于HTML5与CSS3的网页设计技术研究
中班定向式军事游戏的开展
大班定向式军事游戏的开展
浅析分布式发电对电力系统的影响
基于CSS的网页导航栏的设计
基于HTML5静态网页设计
基于预处理MUSIC算法的分布式阵列DOA估计
搜索引擎怎样对网页排序
优秀定向运动员中距离定向比赛成绩比较研究
分布式并联逆变器解耦电流下垂控制技术