APP下载

数据挖掘及其在网络信息检索中的运用

2016-11-27魏巍巍

决策与信息 2016年35期
关键词:信息检索数据挖掘结构

冯 雷 魏巍巍

北京信息职业技术学院 100018

数据挖掘及其在网络信息检索中的运用

冯 雷 魏巍巍

北京信息职业技术学院 100018

网络信息检索对于帮助人们迅速获取有效信息,提升知识储备具有非常重要的意义。数据挖掘技术在网络信息检索中的应用将能够有效提升检索效率。这项技术的应用将能够使得网络信息检索变得更加精准、更加个性化和智能化。本文将重点探讨数据挖掘在网络信息检索中的运用情况。

数据挖掘;网络信息;结构挖掘

在互联网技术快速发展的背景下,人们看到的信息也是海量增长。在海量信息海洋中如何快速有效获取自身有用信息是人们高效率工作的关键。为了能够达到这一目的就需要提升网络信息检索水平,通过利用数据挖掘技术从而达到快速获取有用信息的目的。

一、数据挖掘

所谓数据挖掘实际上就是要从大量数据中利用专门算法来搜索隐藏其中的特定信息的过程。在互联网时代数据挖掘技术在实际工作中所发挥的影响越来越大,加强对这门技术的研究已经成为当务之急。通过数据挖掘就是要把那些没有加工的数据转变成有用信息。在网络信息检索过程中利用数据挖掘技术间将能够进一步增强信息检索能力。不仅如此还能够实现对数据未来走势的科学预测。应该看到数据挖掘是一种比信息检索层次更高的技术。信息时代数据挖掘技术所发挥的影响将会越来越大。

二、网络信息特点

当前互联网已经成为人们日常生活中不可或缺的一部分,以互联网依靠,各种信息实现了快速传播。网络信息资源变得异常丰富,在互联网上人们将能够获取各种信息。当前的网络信息已经成为知识和信息的集合,已经成为当前一种非常宝贵的财富。同传统信息相比,网络信息有其自身特点,深入分析就会发现其具有以下特点:

(一)数量庞大、种类繁多以及传播范围广。互联网上的信息是非常庞大的,从种类上来看也能够分为多种类别。图文、文本、数据、视频、图像以及音频是典型的信息传播载体。从信息内容上来看不仅有健康信息,同时也是有虚假和有害信息的。有害和虚假信息将会对人们产生很大危害。因此就需要采取措施来对这些信息进行有效甄别。网络信息分类的一个很重要的功能就是要防止这些信息流传。

(二)管理困难。从当前实际情况来看网络信息资源更新快、传播范围广、影响更大。再这样的背景下要想实现对网络信息的有效管理就显得非常难。网络信息本身是自由发布的,从信息来源上来看也是非常广泛的,信息源的差异性就会对信息质量产生直接影响,信息质量难以得到保证是网络信息的典型特征。对此在今后工作中必须要引起认识。

(三)管理机制多样。从当前对网络信息的管理来看,目前还没有统一的管理机制,因此这就会使得网络信息安全会缺乏一定保障。不少大型网络公司虽然设计了一些管理制度,但是从实际情况来看仍然存在着管理机制多样化的问题。这样在实际管理过程中就会变得困难。

三、数据挖掘技术的运用

数据挖掘技术在网络信息检索中的应用已经成为今后发展的必然趋势,在实际应用过程中所发挥的影响将会变得越来越大。对于其具体应用情况,本文认为主要是表现在以下几个方面:

(一)结构挖掘。结构挖掘是数据挖掘在网络信息检索中的典型应用,结构挖掘实际上就是要挖掘Web潜在链结构模式,之后通过Web组织结构和链接关系将能够提供丰富的信息,这些信息大多是关于Web内容相关质量、结构方面的信息。通过结构挖掘将能够发挥非常重要的作用。

结构挖掘本身可以分为网络引用挖掘和网络结构挖掘这两种形式。引用挖掘实际上就是要对各个Web站点之间的链接关系来进行分析,通过对这一关系的分析将能够使得人们了解哪些网页被连接次数最多,这样就能够分析出哪些网页是比较重要的。结构挖掘实际上就是要对网站结构进行科学分析。

(二)内容挖掘。所谓内容挖掘实际上就是要从网络内容、数据、文档中来发现有用信息。从实际情况来看Web资源分布范围是非常广泛且类型多样的。在实际工作中为了能够准确获取信息就需要网络页面内容挖掘和搜索结果再挖掘。对于页面内容通常是要采用文本挖掘的方式,利用文本挖掘来直接挖掘Web文档内容或者关键信息,之后还要通过间接形式来对文档内容进行摘要或者解释。对于搜索结果的挖掘实际上就是要利用其他信息检索工具来对检索结果进行再次挖掘。有些系统就是通过对搜索引擎查询结果的分析从而来提炼出更加合适的结果。URL、内容类型、超文本链接等都是可以进行专门提炼的。在提炼之后则是要对其分类并且文档可视化从而显示出来。

(三)使用挖掘。通过网络信息用法挖掘,可以充分的了解用户的网络数据实际意义。网络信息内容挖掘和网络信息结构挖掘主要是针对原始数据的,而网络信息用法挖掘主要是针对用户和网络交互的过程中产生的数据。这些数据类型包括很多:用户对网络服务器的访问记录、浏览器日志记录、用户的个人信息、用户额交易信息等等。运用网络信息用法挖掘技术能够有效的从服务器以及浏览器端的日志记录中发现隐藏在网络数据中的一些无法通过索引获取的模式信息,还可以了解用户对网络系统的访问模式以及在网络上所进行的行为模式,从而对其作出预测性分析。

数据挖掘在网络信息检索中的应用是时代发展的必然趋势,在今后工作中为了能够满足实际需要就应该加强对数据挖掘技术的研究,通过对此研究从而来了解今后发展趋势。

[1]李村合.网络信息挖掘技术及其应用研究[J].情报科学,2008.

[2]叶云,万明明.网络信息挖掘技术探讨[J].广西大学学报,2007.

[3]黄晓斌.网络信息挖掘[M].北京:电子工业出版社,2005.1.

冯雷(1978-),女,北京人,北京信息职业技术学院软件与信息工程学院,教师,工程硕士,从事计算机信息管理专业,市场调查等方向研究。

魏巍巍(1980-),女,北京人,北京信息职业技术学院软件与信息工程学院,教师,工程硕士,从事计算机信息管理专业,空间信息技术等方向研究。

猜你喜欢

信息检索数据挖掘结构
改进支持向量机在特征数据挖掘中的智能应用
《形而上学》△卷的结构和位置
探讨人工智能与数据挖掘发展趋势
基于事故数据挖掘的AEB路口测试场景
论结构
计算机信息检索技术的发展及问题研究
软件工程领域中的异常数据挖掘算法
文献信息检索与利用之我见
论《日出》的结构
创新治理结构促进中小企业持续成长