APP下载

数据挖掘技术在Web预取中的应用探究

2022-07-01谢怡雯

科技资讯 2022年14期
关键词:网络服务数据挖掘技术

谢怡雯

摘要:随着现代化技术发展速度的加快,互联网技术广泛应用普及,人们对互联网访问速度提出更高要求,Web预取优化已成为满足用户使用需求的主要渠道。基于此,Web预取作为可以有效提高网络服务质量的重要技术,为进一步优化其技术效果,该文结合数据挖掘技术及其应用优势,重点探究Web预取中数据挖掘技术的应用,并分析其发展趋势,以期为相关工作提供有效参考建议。

关键词:Web预取  数据挖掘技术  网络服务  网页内容

中图分类号:TP311.1;TP393.0文献标识码:A   文章编号:1672-3791(2022)07(b)-0000-00

Application of Data Mining Technology in Web Prefetching

XIE Yiwen

(Guiyang University,Guiyang,Guizhou  Province,550001  China)

Abstract: With the acceleration of the development speed of modern technology and the widespread application of Internet technology, people have put forward higher requirements for the Internet access time.Based on this, Web pre-acquisition serves as an important technology that can effectively improve the network service quality. In order to further optimize its technical effect, this paper combines the data mining technology and its application advantages, focuses on exploring the application of data mining technology in Web prefetch, and analyzes its development trend, in order to provide effective reference and suggestions for relevant work.

Key Words:Web Prefetching;Data mining technology;Network services;Web content

人們生活质量的提高使网络使用者数量呈明显且高速的上升趋势,在获取相关信息或是交互时,受数据传输迟缓等方面的影响导致网络服务质量降低,无法满足当前人们日益扩大的网络使用需求。而数据挖掘技术作为深层次数据挖掘技术,能够有效优化Web预取,因此,掌握其应用要点是必要的。

1数据挖掘技术及应用优势

所谓数据挖掘技术,主要是指面向数据所开展的清理、变换、挖掘、模式评估和知识表示等数据处理技术,是一种仿生全局优化方法[1]。通过将其应用于Web预取,能够依托于自身优化性能提高Web预取数据准确性,帮助Web预取技术在海量信息中采用最高效搜索引擎查找自身所需信息。互联网具有共享、开放、交互等特性,用户在传输信息时,每分每秒都在产生着信息数据,传统的筛选和搜索技术只面对一部分数据,数据筛选效果相对较差。但是通过在Web预取中落实数据挖掘技术,能够利用其多种多样的挖掘方式在短时间内处理海量数据,挖掘形式包括结构挖掘、内容挖掘和使用记录数据挖掘。其中,内容挖掘应用最为广泛。若是与人工智能技术模块相结合,还能够更为全面且准确地检索信息,具有极强的直接利用性,无需筛选,节约时间成本的同时也保证了数据筛选质量。

2探究Web预取中数据挖掘技术的应用

2.1基于Agent的智能数据挖掘系统

由于互联网的广泛应用使得人们生活趋近于多样性,网络速度也在各类技术不断发展下提高,但是由于使用人数越来越多,网络质量仍不可避免的受到影响。比如:WWW运行使用的数据服务和请求方式,其中并没有固定状态的协议,所以网络服务器发挥的作用有限。从当前Web预取技术来看,其采用的数据挖掘系统智能性不够完善。因此,在应用数据挖掘技术时,可以在Agent技术的基础上开展数据挖掘工作,结合系统特点赋予数据挖掘自动反应性、自治性和适应性,从而搭建出包含数据源、预处理、数据挖掘、决策和人机界面的数据挖掘结构,以此优化Web预取效果。其中,以Agent技术为基础能够在Web预取和数据处理过程中自动确定执行任务,并根据该任务进行相应模型的建立,以此应对海量数据检索、处理和数据变换。在其实际应用过程中,能够有效消除Web预取中的不安全数据、推导缺失数据、消除重复性记录数据,并按照数据特征进行选择以及转换数据格式[2]。

除此之外,以Agent为基础的智能数据挖掘还可以识别出完整的数据模式,确定新模式和新规则,给出数据挖掘解释,协调数据挖掘、人机界面和数据预处理等方面,及时删除冗余数据。其中,以Agent为基础的智能数据挖掘在Web预取中的应用,还能够调节数据处理过程、提高数据处理速度,这是因为该系统主要采用人工挖掘数据方式,促进了人机质量的良好交互。该系统还可以结合语法和语义功能模块,在发现新数据时可以及时通知用户,将查询到的数据和挖掘结果及时传递给用户。

2.2基于Agent的Web预取系统

在现有的一些浏览器中仍在使用缓冲机制,一方面控制远程服务器发送频率,另一方面控制用户请求发送频率,这对用户网络使用体验造成极大影响。但是通过应用以Agent为基础的Web预取系统,即围绕智能数据挖掘系统进行Web预取系统的重塑,能够将挖掘Agent、数据预处理Agent、知识库、Cache、决策Agent等整合在结构中,从而利用数据挖掘技术分析和归类不同用户,预读Web数据,以此提高网络使用速度,优化用户网络使用體验。在该系统实际应用过程中,主要处理WWW数据模型相关数据,抽取词干,分类词条。在数据挖掘模块具体运作时,定期更新搜索的知识库,同时为提高数据处理效率和效果,用户可以更新时间设定,以此保证Web预取数据质量。另外,该系统的决策模块还能够实时监测用户行为,根据浏览器数据痕迹分析用户行为预测用户动向,并将Web页面存放至本地高速缓存中,供后续相关工作使用。而决策模块主要是根据知识库更新状况调整增量算法,灵活调动数据挖掘时间,一方面增强了用户行为和知识库信息数据之间的同步性,另一方面也提高了系统运行效率,优化了Web预取效果[3]。

2.3浏览器模型改进和机器学习

对于在Web预取中应用数据挖掘技术而言,其核心是利用该技术算法改进原有系统的使用基础,比如历史数据访问保存方式等。当用户在Web上浏览时,改进后的浏览器模型可以使用预测模型保存用户将要产生的访问数据,同时于客户端存储网页内容。在该情况下,若是用户在浏览器后续使用过程中想要访问相关页面,可以直接提取本地缓存数据,从而保证服务器时刻处于较高的使用效率,优化用户网络使用体验。从数据挖掘技术起源来看,其主要产生于智能学习和机器的不断深入和改进。在个体差异性的影响下,不同用户的网络使用过程存在差异,而且,相较于其他网络使用版块,网页浏览往往具有较强的随意性,这种情况直接影响关联规则计算结果的准确性,最终无法使用缓存数据,影响用户网络使用体验。因此,在数据挖掘技术的应用过程中,仍要注重浏览器模型改进的持续性和机器学习的深入性,根据数据变化等对预测模型进行调整,进而保证预测结果的精准性,提高上网速度,满足用户网络使用需求[4]。

另外,在以往Web预取没有数据建模的情况,无法直接处理日志等数据,需要先将其转化为可操作格式,之后方可对数据进行挑选,获得所需数据。但是在数据挖掘技术的应用下,利用该技术的关联算法能够精准运算预处理后的数据,最终获得数据模式集合。作为以计算机技术为基础的现代化技术,能够挖掘出Web海量数据中的隐藏信息,进而为相关决策和工作提供极具参考性的支持。一般情况下,关系规则算法应用于数据建模过程中,在该算法作用的发挥下,用户兴趣关联规则将更为清晰的呈现出来,使相关工作人员掌握用户网络使用过程中的兴趣偏好,进而将无用数据及时删除,避免浪费资源的同时提高网络服务质量。此外,为提高算法简单程度,还可以在数据模型创建过程中省去用户兴趣关联性这一步骤,直接使用关联分析法,但是该方法无法准确地挖掘数据信息,所以主要应用于事先预测环节。要想保证用户行为预测结果具有较高精准性,那么要做好模型参数和算法的实时调试工作,并及时存储预测结果,以此更好地掌握用户行为。

2.4电子商务领域的应用

由于用户所需数据存在差异,所以Web预取在使用数据挖掘技术时需要充分考虑用户对数据的实际需求,根据数据类别添加和筛选相关数据元素。近年来,在新零售行业的转型发展下,以互联网技术为基础的网络购物已经成为人们主要的消费购物方式,这一新型的购物模式促使电子商务进入高速发展阶段,由于该行业门槛相对较低,因而该领域市场竞争程度较为激烈[5]。在该情况下,相关企业为提升自身核心竞争力,采用Web预取技术检索相关数据以期扩大客户资源,但是由于数据量庞大,检索效果相对较差,因此,数据挖掘技术被应用于Web预取中。由于用户在网络购物前会使用搜索引擎检索商品信息,在数据挖掘技术的应用下,企业可以获得此类数据,并通过优化和处理掌握用户需求,一方面增强信息推送的精准性,另一方面提高用户挖掘质量和效率。在该领域,数据挖掘技术主要应用于两个方面:一是用户点击量,二是用户历史消费记录和浏览记录。通过从海量数据中挖掘此类数据,能够帮助企业掌握用户行为并预测,在实际处理过程中,先是从服务器中获取数据,之后合并、提取和集合数据,并对其进行相关度的清洗和有效性的过滤,以此保证数据处理结果符合要求,清除不必要信息,最后转换数据,优化Web预取方式效率[6]。

除电子商务领域外,以数据挖掘技术为核心的Web预取系统还可以广泛应用于其他与Web有关的领域,比如组织单位日常运营,将互联网和局域网相连接,不仅能够拓展数据来源,还能够使内外部信息传输的安全、流畅。

3 分析Web预取中数据挖掘技术的应用发展趋势

从当前搜索引擎公司发展现状来看,针对人们日益提高的网络使用要求和需求,有关生活中搜索引擎的重视程度不断提高。对于互联网的使用而言,搜索引擎是重要构成,是人们获取相关资讯、知识和信息的主要方法,但是搜索引擎众多,不同引擎的内在机制存在差异,最终会带来搜索结果的差别,因此,人们在实际使用过程中,往往会根据自身习惯和信息数据种类选择不同搜索引擎。就目前Web预取中数据挖掘发展现状来看,用户更加关注数据的相关性,“关键词”已成为搜索关键,与其有关的信息和数据会排至最前面,当用户访问其中一个页面时,Web会预测相关访问信息,并将其预下载于服务器中,若是用户点击浏览,将无需缓冲直接跳转,用户网络使用速度得到极大提高[7]。

但是,在Web实际运作过程中,并不会对所有相关信息进行缓存,因此,在今后应用发展过程中,应更为深入地研究算法计算,优化数据模型,利用高技术弥补空间布局性的缺陷。另外,数据挖掘技术还具有较大上升、发展空间,相关人员应根据互联网技术发展趋势不断研究数据挖掘技术,进而在规范的互联网行业下,实现互联网制度和数据挖掘技术发展的联动,一方面给予其充分的制度保障,另一方面利用不断提高的应用水平提高互联网使用效果,进一步优化用户体验。

4结语

综上所述,数据挖掘技术作为数据处理的关键技术,通过将其应用于Web预取中能够提高数据处理质量和效率,为用户提供更好的网络使用服务。在其实际应用过程中,要以Agent为基础构建智能化数据挖掘系统,并不断更新数据库等,以此提高挖掘深度。

参考文献

[1] 刘张榕.基于E-OEM模型的Web数据精准挖掘研究[J].微型电脑应用,2021,37(10):146-149,164.

[2] 蒲道北.基于Web的数据挖掘模型研究[J].中国新通信,2021,23(19):64-65.

[3] 王志俊.试论数据挖掘技术在Web预取中的应用[J].科技资讯,2019,17(21):19-20.

[4] 邢雅菲.基于CP-ABE加密数据的缓存策略与预取模型研究[D].上海:华东师范大学,2019.

[5] 王顺平.数据挖掘技术与应用探讨[J]. 电脑知识与技术,2017,13(19):6-7.

[6] 高垣,佀洁.大数据时代的数据挖掘技术探析[J]. 电子测试,2018(4):125-126.

[7] 刘振鹏,董姝慧,李泽园,等. 面向社交网络数据的等差数列聚类匿名算法[J]. 郑州大学学报:理学版,2022,54(1):41-47.

猜你喜欢

网络服务数据挖掘技术
计算机网络服务质量优化方法浅谈
人事档案管理现代化
数据挖掘在计算机网络病毒防御中的应用
数据挖掘技术及其在医学信息领域的应用
基于Web的数据挖掘技术与相关研究
网络服务直接侵权认定标准的演化与思考
借力社交网络服务平台提升企业招聘效率