APP下载

大数据时代数据挖掘提高图书资源利用效率

2021-03-15李锴淞陈莹

中国管理信息化 2021年5期
关键词:数据挖掘图书高校

李锴淞 陈莹

[摘    要] 全国各大高校用于电子图书资源采购的资金占学校开支的重要一部分,传统图书资源使用情况难以评估,文章通过对学校师生的网络访问分析及资源利用数据进行分析挖掘,形成图书资源使用报告,协助图书馆提升图书资源的使用效率,优化电子图书资源采购资金的使用。

[关键词] 高校;图书;数据挖掘

1      高校图书资源使用情况

高校图书馆是学校的文献信息中心,为学校的办公、教学和科研等各项工作提供服务。为了更好地服务广大师生,高校每年需要支出资金购买各类文献和电子资源。而各类文献及电子资源的采购中,如何高效又科学地完成采购操作,利用好有限的采购经费,制定科学的采购计划,真正满足读者的实际需求,优化图书资源利用效率是当前图书采购工作的主要难题,对于学校的资源建设以及馆藏体系完善都有重要的作用,直接影响图书馆的读者服务水平和实际工作效果。

2      传统图书资源采订购存在的问题

传统图书资源采订购一般采用以下方法:

(1)传统经验参考。此方法主要依赖于图书馆相关工作人员的历史采购经验,由其对本校图书馆馆藏资源的了解结合本校未来的资源储备方向及图书需求综合判断从而制定图书资源的采购目录和数量,形成采订购计划。此种方法优点在于负责本项工作人员的丰富经验,能结合本校实际情况,工作效率较高。

(2)专家评价法。此方法通常是图书馆邀请各学科、各领域的相关权威专家学者,请专家在本领域内选择他们认为相对来说更有价值、更能满足当前学科发展和建设要求、更能体现当前学科高端研究方向的图书资源,从而形成预采购目录。之后再结合当前馆藏图书当前各学科的资源实际情况以及采购经费情况,最终形成采订购计划。专家评价法的优点是可以很好地发挥专家学者对本学科权威图书熟稔的优点,专家根据其本专业的研究发展方向及学校相关学科的建设情况,选择最合适本校的图书资源,不仅保证了图书采购具备一定的专业水平,而且更能够保证真正体现学科最新发展成就和趋势的图书资源能够进入馆藏目录。加强图书馆与各学科教学、科研人员的联系,提高图书馆的服务水平。

上述两种图书资源采订购计划所采用方法,均有一定程度的缺陷,主要体现在如下两个方面: 一方面,不论是哪种方法,实际计划的制定决策均来源于人,这样就难免受到个人主观意识的影响。在图书资源的采订购过程中,虽然图书馆相关工作人员及专家学者具备较强的学识水平和业务能力,但仍然不可避免地在指定计划时会掺杂一定程度的主观意识和个人喜好,从而导致计划的制定在客观性上打折扣。另一方面,计划制定缺少数据支撑,缺少全面精准的计划性。主要在于对读者的真实需求,不管是图书馆工作人员还是专家学者都难以做到准确把握,作为馆藏资源的主要使用者,读者才是直接影响采订购计划是否成功的主要因素,而传统制定方法往往忽略了读者的实际影响,这样就很容易导致采订购缺乏全面精准的计划,购买的图书资源不能很好地满足广大读者的需求。

3      大数据时代数据挖掘提升图书资源利用率

在当前互联网技术飞速发展的时代,学校的信息化程度逐渐提升。主要业务全部网络化、数据化,利用好现有信息技术可以极大地提升高校的工作效率。

依托于网络流量深度分析系统,采集全网用户的网络行为日志及数据使用数据,利用数据挖掘技术,可以获得用户搜索资源排名、用户访问网站资源排名、下载文件总量、电子图书资源使用效率、读者借阅、检索频率较高的图书信息,还有缺书比例较大的图书以及读者借阅倾向、关注重点等信息,有助于科学分析各类文献的利用率和需求情况,为采购文献提供科学合理的各种分析报告及预测信息,从而指导采购人员对文献种类进行科学的筛选,制定科学的采购计划,合理地确定各种文献所需的复本量,及时补充短缺的文献,剔除过时的文献,从而保障图书馆信息资源体系的科学性和合理性。

通过分析各院系老师电子资源的使用情况,与其科研结果进行关联,找出一定的规律。例如,某老师科研成果丰富,一般其电子资源的使用频率也就比较高;某老师电子资源的使用频率比较高,但是其科研结果数量不多,可能该老师在做长期的学识积累。

对师生互联网所有访问进行全记录,如图1和图2所示,通过对图书资源库访问情况分析出访问兴趣点;为学校图书教学资源采购,专业课程开设,学术研究提供第一手数据依据。

通过对关键字检索排名,分析出校内师生的兴趣方向以及研究领域分布,如图3所示。

如图4和图5所示,对师生上网设备使用情况及浏览器类型进行统计,这样可以为学校采购软件的各种终端适配提供第一手数据依据。

從用户的角度出发,如图6所示对用户的搜索、预览、下载行为进行分析系统排名的模块,可根据此排名找到预览、搜索、下载排名靠前的人,查看他们所感兴趣的东西,以便分析学生的知识兴趣点。

对资源库的使用情况进行排名,如图7所示,便于老师根据资源库的热度进行购买数据库,同时提供了学校资源库零使用排行榜,能让老师仔细考虑下一步是否继续购买该库。

分析各种库的使用场景所占比重的模块,如图8所示,也可对比电子资源库各场景使用总量并绘制折线对比图,方便图书馆管理员对比电子资源的受欢迎度及其实用性。

4      总    结

图书馆的电子资源应用需要改进,这是各大高校的一致共识。但改进的方式、方向就需要一个指导性的助手,利用数据挖掘技术对购买与收集到的资源库进行合理分类,归纳出每种资源数据的主要包含内容框架结构,从资源库、期刊、学科等多方面入手分析,得到最全面合理的统计数据。帮助图书馆正确了解本校的电子资源,例如资源利用率低的数据库、提倡使用电子资源的力度不足、资源多而杂乱、使用不方便的电子资源、网络图书馆电子资源模块结构比较单一等问题, 实现有效避免资源成本投入而没有成果的输出。

主要参考文献

[1]李雷,申筱彤.数据挖掘在高校图书馆图书采购计划中的应用[J].医学信息:上旬刊,2011,24(4):1910-1912.

[2]韩丽华,魏明珠.大数据环境下信息资源管理模式创新研究[J].情报科学,2019(8):158-162.

[3]蒋红健.大数据挖掘管理与技术策略在高校档案馆中的应用研究[J].山西档案,2019(1):61-66.

猜你喜欢

数据挖掘图书高校
探讨人工智能与数据挖掘发展趋势
图书推荐
欢迎来到图书借阅角
基于并行计算的大数据挖掘在电网中的应用
中日高校本科生导师制的比较
学研产模式下的医药英语人才培养研究
高校创新型人才培养制度的建设与思考
高校科研创新团队建设存在的问题及对策研究
一种基于Hadoop的大数据挖掘云服务及应用
基于GPGPU的离散数据挖掘研究