APP下载

Web挖掘技术在高职院校数字图书馆个性化服务中的应用研究

2015-07-02梁杰

科技资讯 2015年8期
关键词:个性化服务数字图书馆高职院校

梁杰

摘 要:当前,随着高等职业院校需求信息的丰富,以及互联网所提供的海量信息时代的到来,图书馆用户在网络当中查询真正需要的信息已经变得复杂废时。随着信息技术的不断发展,图书馆用户对于个性化服务的要求越来越普遍。将Web挖掘技术运用在高职院校图书馆个性化服务当中,不仅效率高、安全性高、风险低,而且有着很好的发展前景。文章在分析了高职院校数字图书馆个性化服务重要性的基础上,研究了Web挖掘技术,以及Web挖掘技术在高职院校数字图书馆个性化服务中的具体应用。

关键词:Web挖掘技术 高职院校 数字图书馆 个性化服务

中图分类号:G250 文献标识码:A 文章编号:1672-3791(2015)03(b)-0204-02

1 高职院校数字图书馆个性化服务的重要性分析

当前,随着高等职业院校需求信息的丰富,以及互联网所提供的海量信息时代的到来,图书馆用户在网络当中查询真正需要的信息已经变得复杂废时。如果,可以通过信息化技术将图书馆每一位用户经常浏览的、感兴趣的、查找过的信息以主动推进的方式推送给图书馆用户,则会增加信息的有效性,使得图书馆用户学习工作效率提高,最终提高图书馆用户的客户满意度。而高职院校数字图书馆个性化服务提高的就是这样的一种有针对性的、主动的服务。通过这种个性化服务,可以使用户更快捷方便的得到感兴趣的信息,得到需求范围以外更多的服务,这已经成为未来云时代所必须的服务模式。

2 Web挖掘技术

Web挖掘,就是将数据挖掘技术应用在 Web上,从大量类型丰富的Web数据中挖掘隐含知识的过程。Web上的数据类型丰富,主要包括:HTML文档中的文本数据、多媒体数据、超链数据,以及Web服务器日志文件中登录用户的访问行为数据等.在数据挖掘领域,如果面对的数据类型不同就会采用不同的挖掘算法。因此,根据所挖掘的Web数据的类型,可以将Web挖掘分为以下3类:Web内容挖掘、Web结构挖掘和Web访问日志的挖掘。

Web内容挖掘是一种以文本内容挖掘为主的过程。它是从Web文档中挖掘以文本为主要媒介的知识结构,包括文本的总结、分类、聚类、关联分析,以及利用Web文档进行趋势推荐等,由于这一挖掘技术起步较早,应用较广,当前已经基本成熟。

Web结构挖掘是指从Web文档的链接中推导知识的过程.其中比较有代表性的工作是PageRank 和CLEVER.PageRank 的核心思想在于发现权威性页面。CLEVER 系统主要采用了HITS算法,该算法的主要思想在于,如何识别hub/authority页面。著名的搜索引擎Google中就采用了该算法,比较于其它基于词类索引检索的搜索引擎,可以得到明显优化的查询结果。

Web访问日志的挖掘的挖掘更加容易理解,它是指当用户访问了Web网站的某些站点后,系统将此用户所该问的关键数据进行搜集并进行记录,如用户的IP、进入网页的时间,退出时间、所浏览页面的地址、浏览模式、浏览路径等。通过对浏览网站的大量用户的数据进行分析,可以分析出进入本网站的大多数用户所采用的浏览模式等信息,为Web网站的优化提供更多的依据。

3 Web挖掘技术在高职院校数字图书馆个性化服务中的应用

3.1 基于Web挖掘技术的高职院校数字图书馆个性化服务的数据需求分析

高职院校的师生对于数字化图书馆的数据需求主要是以下几个方面。第一是信息检索类,包括图书的检索、期刊检索、论文检索、会议检索、文献检索等。第二是图书借阅类,包括图书预约、图书借阅、图书延期、图书归还等。第三是信息发布类,主要是图书馆理员发布与图书馆有关的信息,如新书资讯、图书馆借阅管理规范等。第四类是导航功能,如导航到知网数据库、万方数据库、读秀数据库等。

实现图书馆个性化服务中,图书馆用户可以在浏览图书馆Web页面的时候看到系统向其推送的相关信息。例如用户时常查找“Oracle数据库管理与应用”相关书籍,那么当图书馆新进与Oracle数据库管理与应用相关的图书时,就会自动显示在页面当中,用户可以根据需要进行查看。简单的说不同的用户登陆到相同的Web页面看到的却是不同的界面,不同的内容,而这些内容是个人性的,有针对性的,更适合当前读者的。

3.2 数字图书馆中的个性化服务的主要内容分析

基于Web挖掘技术的高职院校数字图书馆可以为用户提供的个性化服务包括以下几个方面。

3.2.1 用户内容定制

用户内容定制是图书馆个性化服务当中最为重要的部分。用户内容定制是通过作者进行设置,实现对于资源的选择。用户内容定制是一种个性化的静态服务。

3.2.2 信息检索策略定制

信息检索策略定制是根据用户的具体需求,确定一种信息检索的方案。

3.2.3 个性化界面定制

个性化界面定制,即用户可以根据自身的喜好,去定制满意的操作界面。如用户设定将知网数据库、万方数据库作为主要导航,设定在页面的常用位置,用户可以根据自己的需要,去选择定制页面上需要出现的内容,使得图书馆的服务界面成为私人定制的操作界面,即实现个性化界面的定制。

3.2.4 是信息推荐服务

信息推荐服务是一种动态的服务模式,用户的使用习惯、感兴趣的内容会随着时间的推移和某些外在因素的影响而发生变化的。因此,需要记录用户的行为,分析用户的兴趣记录,挖掘用户当前感兴趣的主要内容,从而进行有效的信息推荐服务。

3.3 基于Web挖掘技术的高职院校数字图书馆个性化服务系统模块设计

从技术角度来说,要想实现这一功能,可以通过Web挖掘技术来实现,当然除此之外还需结合检索技术。基于Web挖掘技术的高职院校数字图书馆个性化服务系统具体设计了以下模块。

3.3.1 数据采集模块

该模块的主要功能是收集用户的基本信息,如用户的IP地址、用户登陆的时间、用户退出时间等,以及用户在查询时使用的关键字,用户的浏览信息、下载信息等。通过这一模块实现对数据的收集功能,将这些数据存放在数据库当中,以便进行后面的分析。

3.3.2 数据预处理模块

该模块的主要功能是针对Web页面中的全部信息进行数据化处理。网页中的文字、图片、视频等到需要转换成数据库中可以识别的编码形式。即将这些形成会话文件。

数据的预处理又包括数据清理以及事务识别两部分操作。其中,数据清洗从字面上可以分析到,它是一种对数据进行整理的过程,即先判断哪些数据是有用的,哪些是无用的,将有用的数据留下,将无关的信息删除掉。事务识别过程是形成会话文件的过程,它以逻辑单元的形式体现页面访问序列。

3.3.3 挖掘处理

此模块的功能是确定数据挖掘所采用的具体方法,实现挖掘的具体方法,得到挖掘的结果。

能够实现数据挖掘的算法有很多,如分类、聚类、关联规则等。此阶段要设计合理的算法,将数据预处理环节形成的会话文件进行数据挖掘,以得到隐藏的未被发现的规则。如,通过分析该校图书馆网站被大多数用户访问的路径,可以知道哪种站点结构更适合本校的图书馆网站,从而为该网站的后续优化提供准备。再如运用关联规则算法可以挖掘出用户在该图书馆网站内部的各页面之间的访问关系,为图书馆来说也是十分重要的。

3.3.4 模块分析模块

此模块的功能是将挖掘的结果进行数据分析,得到用户模式。

这一阶段需要通过专业的工具、专业的技术来辅助分析人员来行挖掘模式的理解,以使挖掘模式得到最优的运用。

3.3.5 数据推送模块

此模块的功能是生成动态的Web页面,使不同用户看到不同的页面。这里需要使用PUSH技术,将用户可能需要的数据呈现在用户的界面上,即实现主动推送的功能。数据推送模块可以说是面向用户的最直接的个性服务的接口。

3.3.6 系统自学模块

对于数据挖掘系统来说,系统必须具备自学能力,以不断完善挖掘。

4 结语

当前,随着信息技术的不断发展,图书馆用户对于个性化服务的要求越来越普遍。将web挖掘技术运用在高职院校图书馆个性化服务当中,不仅效率高、安全性高、风险低,而且有着很好的发展前景。

参考文献

[1] 肖锋,张帆.Web挖掘技术在数字化校园中的应用研究[J].科技创业月刊,2010(4).

[2] 王玉珍.Web数据挖掘在数字图书馆个性化服务中的应用[J].自动化与仪器仪表,2010(3).

[3] 阮娟.基于Web挖掘的高校教务管理系统个性化服务模型系统设计[J].电脑学习,2010(3).

[4] 郭秋萍,王全兰.一种基于Web挖掘的图书馆服务推荐模型及其算法研究[J]. 图书馆杂志,2010(6).

[5] 孙士新,李海燕,王甫成.高校数字图书馆个性化服务关键技术探究[J].西昌学院学报(自然科学版),2010(2).

[6] 周锋.Web挖掘技术在远程网络教育中的应用[J].常州工学院学报,2010(Z1).

[7] 余金昌.基于知识挖掘的高校数字图书馆个性化服务模式[J].中国电化教育, 2010(11).

[8] 房敏.高校数字图书馆个性化服务综述[J].科技创新导报,2010(33).

[9] 欧阳烽.Web数据挖掘与高校数字图书馆个性化服务[J].现代情报,2008(1).

猜你喜欢

个性化服务数字图书馆高职院校
浅析移动时代的图书馆发展策略
互联网思维下数字图书馆个性化服务建设研究
需求理论在高校图书馆就业服务中的应用研究
基于云计算的数字图书馆建设与服务模式研究
高职院校创新创业教育初探
全球化背景下高职院校韩语专业毕业生就业现状分析
多元智能理论视角下高职院校体育课程评价体系的研究
浅谈财务管理存在的问题及完善措施
刍议数字图书馆计算机网络的安全技术及其防护策略
大数据对高校图书馆个性化服务的影响