APP下载

数据挖掘在公共图书馆管理决策中的应用

2017-05-16张艳

科学与财富 2017年12期
关键词:数据挖掘技术

张艳

摘要:随着互联网的应用普及,各行各业已经迎来了大数据时代,图书馆作为传统资料的储存地,也正在进行着变革,加速图书馆的现代化进程,让大量的资料数据得到有效的保存,数据挖掘技术是互联网时代深入发展的产物,他是结合多门学科的新型技术,在公共图书馆的数字化建设中起着非常重要的作用,本文首先对数据挖掘技术做详细的介绍,然后在深入探讨数字挖掘技术在公共图书馆管理中的应用。

关键词:数据挖掘技术;数字挖掘方法;数据挖掘的应用

21世纪是互联的时代,互联网的深入发展和计算机技术的不断创新让人民进入到了知识经济的网络时代,现在人们每天接触到的各种信息特别是数字化互联网信息指数飞速增长。海量信息的增加给人民生活带来方便的同时也面临着很多问题。因为信息量的增加,让人民在寻找可用信息的时候变得麻烦,信息的供给和信息的消费之间的平衡关系打破,如何在信息大爆炸的世代及时提取对自己有用的知识,成为我们将要面对的大问题。这就要求必须研究一种实用性的工具帮助我们过滤整理,在知识的海洋中,提取对自己有帮助的资料。因此专业人员就开始了一个新领域的探索---数据挖掘(DM)和知识发现(DMKD)应运而生。

一、数据挖掘的基本介绍

数据挖掘顾名思义就是在海量的数据资源中挖掘出对自己有价值的东西。其实他是通过已经积累起来的各种历史资料中,运用一定的方法和技术,提取出隐含在里面,具有潜在价值的信息的过程。研发目的是帮助人们找到数据与数据之间相关连的,被人们的所忽略的东西。数据挖掘的过程主要是找到原始数据,这些原始数据一般是来源于已经建立的资料库,各种数据库,还有一些非资料库数据库中的零散信息,和网络信息。数据来源真实可靠,数据挖掘的结果能过让使用者感到兴趣,有意义。

数据挖掘是一个慢慢发展变化的过程,我们从数据库的角度来观察。他可以从偌大的数据库中找到有效的,可以利用的信息,并最终演变成有用数据集合的资料。整个过程具有非平凡过程,非平凡过程是一个数学理论中的概念,他的意思是在进行数据挖掘的时候并不是单一的进行数据的提取,也不是一点都不提取,而是发现那些隐含的,我们未曾发现的,可能对我们有用的信息。从决策支持的角度来看,数据的挖掘是一个决策支持的过程,它主要是基于互联网技术,运用统计学,数据库等多种技术的结合,自动分析数据源,进行机械化的整理,从而找到潜在的信息,来预测客户的行为,帮着企业的管理者及时的调整经营策略,预防和减少风险的发生。他在提高商业和科学决策过程质量和效率的新方法。

我们经常用到的信息数据分析有“查询,报表,联机,统计”等方法,和这些传统的数据分析相比,数据挖掘具有在挖掘开始不用给出明确的前提,而进行自动的甄别与处理,去发现信息,发现知识。这就体现了数据挖掘的有着“先未知”“有效”“实用”的特点。

二、数据挖掘的主要方法

数据挖掘技术主要有两个基本的过程:数据准备、信息挖掘

(一)在公共图书馆的管理工作中,首先就要进行数据准备工作,数据挖掘的首要要素就是建立数据库,对数据库中的数据进行概括,了解书籍的使用情况。1.要获取用户的基本信息,在数字化的公共图书馆中,应该首先就要录入用户的基本信息,用户的基本信息包括用户的个人基本信息和用户的借阅信息。个人基本信息包括:姓名,年龄,职业,性别,和身份号码,联系方式等,借阅信息包括:图书类型,借阅时间,借阅等级。2.要获取用户的历史信息,用户的历史借阅信息在图书管理中有着非常重要的作用,他可以让图书管理员清晰的看到用户的借阅情况,历史信息包括:借阅书籍的编号,书籍信息,借阅时间,归还时间等等。通过对这些数据的分析处理可以把公共图书馆中的图书状态清晰的反应出来,并进行可靠的预测。3.获取图书的检索记录,在现代化的公共图书馆中,都有附有图书的检索功能,用户在借阅图书的时候可以根据图书的编号,图书的类型等进行图书的检索。对于图书检索信息的处理,图书管理员可以根据用户的信息,检索关键词,檢索的编号等进行分类整理。图书的检索功能在公共图书馆中是非常受人喜欢的,经常有着巨大的使用量,所有要做到检索记录的存储分析就需要一定的计算机技术的支持,只有当技术达到一定的高度,硬件设施完备的情况下,才能进行信息的处理。4.取得书籍信息,书籍信息的获取包括图书的名称, 编号,作者,位置的编号,出版社的信息,学科的分类信息,这些信息需要从图书的属性进行区分处理。

(二)信息挖掘

信息挖掘主要包括以下几个方面:确定挖掘目标,选择挖掘的工具,建立挖掘模型,实施搜索和结构的分析。1.确定挖掘目标,首先要把需要进行数据挖掘的目标确定,然后利用数据挖掘系统快速的帮助用户做出假设,进行挖掘驱动,另一种形式是进行验证驱动,就是用户首先需要对挖掘的信息进行合理的假设。然后在进行驱动性的挖掘。3.建立挖掘模型实施搜索,通过对挖掘数据库的建立,进行有目的的搜索,了解用户的需求,进行智能查找。4.结果分析,数据的挖掘不是一次性就能成功的,他要进行反复的测试,然后对每次得出的结果进行对比,让数据的挖掘精度达到要求。

三、数据挖掘的主要功能

数据挖掘是通过一定的规律来预测未来将要发生的行为,是基于知识,技能的前瞻性选择。就用期刊的管理举例来说,数据的挖掘主要是针对期刊的管理与服务,对数据库中的海量数据进行筛选,甄别,转换,分析与其他可操作性的处理。从而得到决策的重要数据,数据的挖掘主要有以下几个类型功能。

(一)自动预测趋势和行为

数据的挖掘主要是基于大数据的基础上尽心的数据预测性的发现,这些信息在以往都是通过大量的手工整理记录分析出来的,而通过数据的挖掘就可以快速的知道数据本身的结论。我们来举一个最简单的例子,比如利用市场预测进行数据挖掘,就可以快速的帮着销售人员来获取那些最具有投资价值的潜在客户。

1.关联分析

数据的关联是数据库中存在的重要组成部分,数据关键就是两个或者多个数据之间存在着内在联系,这些联系是有规律可循的,我们成这些有规律的关联數据就叫做数据关联。关联可以分为简单的数据关系,时效性的数据关联,因果性的数据关联。根据关联的目的我们可以发现整个关联数据会组成一个巨大的数据关联网。有的时候我们并不知道这些数据库中的数据关联存在着怎么样的数据关联意义,数据的关联是具有不确定性的。数据关联产出的规律也是没有可信度的。

2.聚类分析

数据库中的数据可以变成一系列的有意义的关联体,这种关联体就叫做聚类,聚类的存在增加了人民对客观事物的现实认识,是概念描述的先决条件。聚类技术包含传统的模式和识别方法。里面的概念聚类技术指的是在考虑区分的对象是不仅仅的是要考虑到传统的对象之间的距离差距,还要详细的划分出这里面的具体内涵,这样就可以从根本上避免整个技术的片面性。

3.概念描述

概念描述是指对一个东西所有具有的内涵特征进行的描述,这类描述的对象有着相互关联的特征。概念性的描述分为行为特征的描述和区别性的描述,前者是对特定对象的某些特征进行分析,后者是对不同的描述对象之间的差别进行描述。差别性的描述有很多种类,比如对策描述,遗传描述等。

4.偏差描述

数据库中的很多数据经常会有一些异常的处理错误的记录,对这些数据库中的处理错误偏差的描述称之为偏差描述。偏差描述存在着很多的潜在知识,比如在品种分类中的反常实例,不满足规则的特例,观测结果与预测值直接的偏差等,偏差描述的基本途径就是找对观测结果和参照值之间的差别意义。

四. 数据挖掘中的主要应用

(一)读者需求分析

现在很多的研究都是仅仅局限于实际调查所得到的的读者需求,这种需求的得到方式是简单容易的,当然他们也存在很多的问题比如真实性,时效性,一致性,一般性等等。我们来做一个简单的推理,如果在公共图书馆中,图书的借阅量很大,就说明这类图书比较受到大家的欢迎,图书馆就要适量的增加他的库存量。如果放在藏书结构的图书馆,借阅量大的图书就很好的说明他们可以满足读者的需求,可以提高公共图书馆的利用率。我们所说的这种藏书的模式并不一定适用于藏书结构,他们只是在借阅量比较大的图书中的一种内在的模式,从另一个方面来看他就是一种同类图书的半衰期的内在模式。这种内在模式需要从大量的数据中找到,只有不断的加大读者的阅读行为和阅读量才能根据图书的内容进行分析预测,从读者的身上找到比较受欢迎的藏书模式。这种藏书模式应该是读者最喜欢的,最方便的一种模式。同一读者群里面有着相同的行为模式和需求,不同的行为细分里面有着不同的读书需求。需求一般都是在分析活动的过程中对读者行为的一种细致划分,他们都是在调查的基础上进行的,在实际的应用中,读者的阅读行为完全是可以在借阅的大量数据挖掘中找到的。

(二)信息资源的优化

建设公共图书馆每年的文献购置费是一定的,这些一定的费用如何在各个科目直接进行分配,如何让有限的购置费发货最大的作用。传统图书馆在进行这方面分析的时候一般是有多个人进行专门的调查决定,或者进行商讨,但是这种做法很难避免个人的主观意志,容易造成图书管理经费的浪费,发挥不出应有的价值。然而通过数据挖掘技术就能很好的解决这种问题,借阅量大的图书一目了然。

通过图书馆的管理系统可以让数据挖掘在图书借阅,流通的时候得到很好的利用,我们可以按着文献的借阅次数进行有针对性的补充,让那些不全面而人们经常搜索的图书尽快得到补充。对用户每次借阅的文献进行关联分析,发现这些文献其中的管理价值与比例关系,优化信息建设和藏书布局。

五、总结

公共图书馆管理决策是一个非常复杂的过程,要想得到现代化的管理就必须有着完整的,集成与真实的信息。在图书馆的信息化进程建设的时候大量的数据库建设可以为数据的收集和统计提供条件,也可解决依靠人力无法解决的问题。数据挖掘技术的出现,让公共图书馆在管理上有了新的方向,可以让管理者更好的服务于读者。

参考文献:

[1]时海燕. 数据挖掘在公共图书馆管理工作中的作用分析[J]. 办公室业务,2016,(21):189-190.

[2]陈海军. 数据挖掘在公共图书馆管理工作中的应用[J]. 中国管理信息化,2016,(02):169.

[3]张宏伟. 数据挖掘在高校图书馆文献采访决策中的应用[A]. 中华中医药学会.全国中医药图书信息学术会议暨第十一届中医药院校图书馆馆长会议论文集[C].中华中医药学会:,2014:4.

[4]杨睿娜. 数据挖掘在高职院校图书馆管理中的应用[J]. 科技创新与应用,2012,(06):242.

[5]马丰宁. 数据挖掘技术在公共图书馆中的应用[J]. 图书馆工作与研究,2012,(11):54-57.

作者简介:张 艳(1984.4—),女,江苏盐城大丰区,盐城市大丰区图书馆工作,本科学历,助理馆员职称,研究方向:图书馆学基础理论与图书馆管理研究,信息资源建设与服务研究。

猜你喜欢

数据挖掘技术
数据挖掘在计算机网络病毒防御中的应用
基于Web的数据挖掘技术与相关研究
应用型本科数据挖掘技术课程教学探讨与实践
探讨高校教育教学中数据挖掘技术的有效运用
财务报表内外数据挖掘技术的运用