APP下载

数据挖掘技术在数字图书馆中的应用

2021-11-21

无线互联科技 2021年18期
关键词:数据挖掘数据库数字

徐 辇

(常州纺织服装职业技术学院,江苏 常州 213164)

0 引言

随着计算机和互联网的不断发展,我国已经进入了信息时代,海量信息的不断增长,虽然给民众带来了便利,但也引发了许多问题。如今,民众面临的主要问题是大量数据已经超出其日常分析、掌握或处理范畴,存在诸如难以区分真假信息、难以确保安全性及统一格式等问题。在这种情况下,数据挖掘技术应运而生。数字图书馆是信息管理及服务的主要组织,它积累了大量的信息,在使用中也存在很多问题。数据挖掘技术在数字图书馆中的应用可以为相关管理人员提供必要的决策依据,也对其他关联性工作产生直接影响。

1 数字图书馆及数据挖掘技术的含义

1.1 数据挖掘技术

数据挖掘技术主要指应用大量的数据库信息,充分掌握并分析各类技术运用模型,从而构造数据库,最后形成运用模型。总的说来,数据挖掘技术任务主要有:(1)开展相关预测。(2)对特定对象开展描述。预测任务有益于图书馆单位综合当前的信息进行日常汇总。[1]描述任务则有益于发现工作中存在的其他问题,并及时改善工作方式,从而提升工作效率及工作质量。此外,就数据挖掘技术的工作过程而言,主要有以下过程:第一,数据的准备和存储。对现有数据进行综合整理和存储,为技术应用做好准备。第二,数据挖掘任务十分明晰,各个单位均有其各自的挖掘需求,因此要预先明确针对人群的技术使用需求。第三,创建数据模型,可以更加高效地进行数据分析,以此获取更加科学的工作方式。

1.2 数字图书馆含义

现阶段,图书馆主要模块有:馆藏模块、日常存储模块及阅读器模块。随着当前阶段信息技术的飞速发展,图书馆的各个模块也能够有效集合于同一个系统内,故而每个模块每天均会产生较多的信息数据[2]。按照日常情况明晰模块最终结果,对于图书馆内不断提高工作水平具有特定的优势特征。在日常工作中,数字图书馆的工作发展也存在一些问题:图书馆资料管理的运用效率低,大部分书籍及文献使用价值较低,书目及其他资料库存数量不足等。图书馆是知识获取的地域之一,然而在实际工作中,数字图书馆在此方面的工作远远低于预期目标,对阅读人员的吸引度不够。故而,应运用数据挖掘技术进一步指导数字图书馆的工作,提升数字图书馆的服务水平。

2 数字图书馆中运用数据挖掘技术的实际意义

数字图书馆运用先进的信息化技术满足使用人员日益增长的信息需求,同时充分运用数字图书馆提供的信息实现自动化。数字图书馆作为信息和情报的中心,在实现自动化发展的同时,其功能也得到了提高。对此,在这一要求的背景下,重中之重便为抓好综合建设工作,原因如下:第一,因为图书馆需要处理的信息量大,且涵盖面广较。因此,为有效防止由于数据丰富但是信息贫乏等问题,必须提高管理人员的信息处理能力,加强其对于海量信息的处理力度,在海量信息中发现不适宜的信息并进行进一步处理,理清问题的内在联系,以满足用户的要求。第二,虽然当前阶段数字图书馆管理系统已初步具备简单统计、检索等性能,然而要想对相关数据进行分析,仍然存在问题。尤其是在分析不同的需求时,需要进行更多的重复动作。例如,在流通子系统中,图书馆在对阅读人员进行详细分析的前提下,仅以报表的形式展示一定时期的信息,不能具体划分哪些信息是使用人员经常借阅的。因此,如果想再次有效地运用有效数据,就应该充分利用数据挖掘技术。实践证明,将数据挖掘技术应用于数字图书馆,不但能够提升数字图书馆信息资源的运用率,还能够进一步提升其服务质量,满足管理及借阅使用的需求[3]。

3 数据挖掘技术的运用分析

3.1 文本数据挖掘

当数据挖掘对象实现文本类型的数字信息组合时,将数据挖掘算法和信息检索算法相结合以自动分析和处理大量文本信息的过程称为文本挖掘。文本挖掘包括:特征提取、文本商、文本分类和聚类、概念操作和探索性数据分析。文件数据挖掘的大部分是数字图书馆的文本数据,因此对自动信息处理有很高的要求包括:文档表达和索引、自动文本摘要、自动文档分类等。面对海量信息,文本挖掘技术弥补了人力和时间的不足,促进了数字图书馆中各种信息的处理和映射过程,为以后的数字图书馆服务提供了保证。

3.2 特色馆藏资源建设

在数字图书馆特色资源建设中,数据挖掘技术的应用相对有限。一些价值较高的信息普遍存在于网络数据库中,普通人无法通过搜索引擎获得这些信息。他们只有登录专业信息网站,通过网站提供的查询界面,才能在网络数据库中找到信息,并根据专业知识库自动进行分析,整理搜索结果,最后导入本地信息数据库。例如,在构建具有地方特色的文献数据库时,只有构建与地方文献相关的各种属性的统计字典,有效利用网络信息挖掘档案,才能实现自动挖掘和检索。无须人工干预,即可搜索指定范围[4]。数据库中的相关信息通过重复数据消除、净化等技术进行挖掘和处理,导入本地相关数据资源数据库。为用户提供相关项目的信息检索服务,有助于建立具有地方特色的图书馆数据库。

3.3 个性化服务

收集用户信息并形成用户信息数据库。完整的用户信息可以充分确保挖掘工作,了解用户的一般需求和特殊需求,从而提供有效性的个性化服务。故而,用户才是数字图书馆的主要资源。通过挖掘用户的日常访问日志等数据信息能够掌握用户的兴趣,因此其对于提供网络信息推送及个性化信息定制服务是有益的。从总体上看,数据挖掘技术通过丰富、动态的在线查询和分析来了解用户的实际需求,通过在线提问和调查等方式,系统可以获得用户的用户名、访问IP地址、个人喜好、职业或者其他第一手资料。然后,通过关联规则和文件规则(例如,OLAP),全面分析上述数据并为用户建立信息需求模型。根据实际需求,积极跟进图书馆数字资源的变化,搜集用户需求的信息,同时通过智能推送方式将所需信息推送到用户的邮箱、手机或者计算机中。

3.4 信息查询

以往查阅方式中,用户需要通过对其他书号进行分类来获取图书信息,但是这种查询方法效率低下,不能满足当前用户的需求[5]。为了获得更加详细的内容,需要将数据挖掘技术合理地应用于图书馆数据信息。随着信息技术的不断发展,用户阅读需求的分类和专业背景可以更好地帮助用户查询所需的数据。在满足用户的特殊阅读需求时,可以根据用户的阅读历史和相关记录推荐阅读书籍,为用户提供更加便捷地服务,同时也应满足其日常查询需求。

3.5 馆藏资源内容

图书馆具有较多的文献,尤其是在一些高等院校图书馆中,信息的收集主要由藏家决定。故而,在某些情况下,不同类型书籍的数量无法平衡,导致流通书籍和杂志的收集和安排不足,许多书籍的资金配置也不合理。此种技术在数字图书馆中的使用可以更加高效地分析出各类文献的使用价值,而后对其进行更加客观地评价,准确预测图书馆的文献量、购买趋势及实际需求。为更加便捷地服务于图书馆的藏书工作,同时,方便使用人员查询所需的信息,这对于数字图书馆具有至关重要的作用和意义[6]。

4 结语

综上可知,图书馆是民众的日常工作及生活关键组成内容,作为促民生的一项基建工程,是获取知识来源的一种重要形式。运用数据挖掘技术不断发现数字图书馆中各项工作的存在问题,并不断改善方式,对于数字图书馆的工作长效机制具有深远意义。

猜你喜欢

数据挖掘数据库数字
基于并行计算的大数据挖掘在电网中的应用
一种基于Hadoop的大数据挖掘云服务及应用
成双成对
基于GPGPU的离散数据挖掘研究
数字变变变