基于个性化服务的高效图书馆大数据挖掘与决策分析体系构建研究

2020-11-13尚玉梅

微型电脑应用 2020年10期

尚玉梅

摘要：为了提高图书馆管理系统在使用过程中的个性化和智能推荐需求，通过分析大数据挖掘实施方案，选择合适的数据挖掘工具，对图书信息进行预处理，并结合支持向量机和神经网络算法建立了个性化图书信息推荐服务方案，然后进行系统功能需求分析和系统整体架构分析，最后进行了实例展示和分析。研究发现：采用改进的SVM算法來实现图书馆的个性化数据挖掘，支持向量机算法在使用过程中具有监督的、可扩展和非线性的高效特性，能够实现非线性的多核心数据聚类效果，从而提高数据挖掘的学习能力;利用BP神经网络对处理后的数据样本进行适应性训练，用户在使用过程中给予一定的正向反馈，该决策分析体系根据反馈结果进行不断的自主学习并更新和优化样品数据，实现了一个闭合的良性循环;通过对设计的个性化图书馆推荐服务系统使用体验调查发现：选A的读者占比为58%，选B的读者占35%，说明在使用过程中对于该个性化推荐系统满意度超过了90%，能够为读者用户提供一定的借阅便利。

关键词：图书馆;大数据挖掘;决策分析;个性化

中图分类号：TP315

文献标志码：A

ResearchonConstructionofEfficientLibraryBigDataMiningand

DecisionAnalysisSystemBasedonPersonalizedService

SHANGYumei

（

Library，ShanxiVocationalandTechnicalCollege，Xian710038，China

）

Abstract：Inordertoimprovetheuseoflibrarymanagementsystemintheprocessofpersonalizedandintelligentrecommendedrequirements，thisarticle，throughtheanalysisoflargedataminingplan，selectstheappropriatedataminingtoolstopreprocessthebooksinformation，andcombinessupportvectormachineandneuralnetworkalgorithmtoestablishpersonalizedbookinformationrecommendationserviceplan.Thenthesystemfunctiondemandanalysisandoverallsystemarchitectureanalysisarecompleted.Finallytheinstanceanalysisiscarriedoutanddisplayed.ItisfoundthattheimprovedSVMalgorithmcanbeusedtorealizepersonalizeddatamininginthelibrary，andtheSVMalgorithmhasthecharacteristicsofsupervised，extensibleandnonlinearefficiencyintheprocessofuse，andcanachievethenonlinearmulticoredataclusteringeffect，soastoimprovethelearningabilityofdatamining.Thedecisionanalysissystemcancontinuouslyindependentlylearn，updateandoptimizethesampledataaccordingtothefeedbackresults.Thusitachievesaclosedvirtuouscircle.Throughtheinvestigationontheuserexperienceofthedesignedpersonalizedlibraryrecommendationservicesystem，itisfoundthattheproportionofreaderswhochooseAis58%，andthatofreaderswhochooseBis35%，indicatingthatthesatisfactionofthepersonalizedrecommendationsystemexceeds90%，whichcanprovidecertainborrowingconvenienceforreadersandusers.

Keywords：library;bigdatamining;decisionanalysis;personalization

0引言

移动互联网和人工智能的发展对于信息的甄别效率有的新的要求，现代社会迫切需要在海量信息冲击下如何在短时间内获取自己感兴趣或者想要的信息[1]。近年来，智慧校园概念的提出便是智能化推荐和个性化定制需求的一个实践方向。校园活动过程中，图书馆是学生和教师在工作和生活中必不可少的一个场景，传统的图书馆管理系统由于信息交互机制较为传统，学生在海量图书信息中很难寻找自己感兴趣的书籍，因此如何实现在高校图书馆的个性化推荐服务，精确获取读者的阅读行为、构建兴趣点数据库，并以此分析潜在用户的阅读需求是具有现实意义的[23]。研究发现，关于个性化服务的图书馆管理系统在国外的研究相对较早，并且具备了一定理论和应用研究基础，例如美国华盛顿大学的gateway系统[4]，康奈尔大学的library系统[5]，这些系统通常包含资源推送、定制推荐、学科导览和文献传递等模板，这些定制化的图书馆管理系统极大了提高了师生的学习效率并在美国高校得到迅速推广。

然而，不少研究者指出康奈尔大学的Library系统还是存在一定缺陷[68]。例如缺乏主动推荐服务，服务内容较为单一，深度较浅，并且信息资源和服务项目的协同集成效用较低，主动检索功能缺乏等。针对这一问题，本文提出基于大数据挖掘和决策分析系统，用于构件一个更加智能的个性化高效图书馆管理系统。

1大数据挖掘实施方案

1.1数据挖掘工具选择

数据挖掘是一种典型的面向应用的数据处理和分析技术，是较为新颖的数据处理方式。目前国际上已经开发出较多大型数据处理技术，从用户使用角度看，数据挖掘技术可以快速为用户提供有用的数据信息，现阶段开发出的数据挖掘工具较多，例如IBM公司的DB2，SAS公司的SASETS，SPSS公司的SPSSModeler以及Oracle公司的神经网络等[9]。本文的研究中选取SPSSModer工具进行应用开发，该工具是较为先进的数据挖局技术，能够把用户从繁杂的编程作业中解放出来。

1.2数据预处理

数据预处理包括三部分：空白数据预处理、重复数据预处理和关键字预处理[1015]。首先，选取图书馆一年内的图书借阅和查询数据，进行编码和归类，将这些原始数据导出为excel。然后，由于数据挖掘过程中预处理的数据会有一些空白数据，对于数据挖掘的准确性造成影响，因此本文将无法充填的空白数据进行删除来确保数据的准确性，或者对空白数据进行逐条的补充书籍信息用于补全;对于重复借出的数据同样保留一条信息和借出次数，用于提高数据挖掘的效率和清晰度，防止数据挖掘过程的重复识别;最后选取不同类型关键字段进行数据挖掘，其中读者用户的关键挖掘字段，如表1所示。

1.3数据挖掘实现

采用改进的SVM算法来实现图书馆的个性化数据挖掘过程，建立面向多维度的图书馆个性化模型，然后转化为附带惩罚因子的无限制经验最小化模型，用于改进支持向量机的算法[1617]。支持向量机算法在使用过程中具有监督的、可扩展和非线性的高效特性，能够实现非线性的多核心数据聚类效果，从而提高数据挖掘的学习能力。通过分析图书馆数据挖掘的特征，本文设计高效图书馆的惩罚因子为无限制经验损失最小化原则，其实现函数如式（1）。

f（x，y）=min

[SX（]λ2[SX）]ω2+[SX（]1m[SX）]

[DD（][DD）]l（ω，（x，y））

（1）

式中，f（x，y）代表數据挖掘结果;λ表示迭代周期;ω代表空间唯独函数，x和y分别为数据挖掘字段。

通过公式（1）映射处理，将多维度下的附带惩罚因子所带来的损失降低，从而简化为一个单一约束条件下的极值问题，然后进一步利用向量机函数将问题平滑问不受约束的优化机制，从而得到本文所需要的训练样本。

2决策分析体系构建

为了更进一步获取用户真正感兴趣的图书信息，本文引入基于模糊综合评价法的决策分析体制机制，其具体实施流程，如图1所示。

实施过程中，首先利用BP神经网络对处理后的数据样本进行适应性训练，深层次结构上形成用户隐形的兴趣输入层和模糊规程训练层，然后进行模糊推理获取模糊值，模糊值经过模糊化结构辨识后输出实际值推送给用户隐形决策分析机制中，用户在使用过程中给予一定的正向反馈，该决策分析体系根据反馈结果进行不断的自主学习并更新和优化样品数据，从而获取了不断优化和更加个性化的图书推荐服务。这一决策分析评价体系通过接口输送至支持向量机的算法中，实现了一个闭合的良性循环。

3个性化推荐服务系统设计

3.1个性化数据挖掘功能需求

通过分析和研究目前高校图书馆在图书信息使用过程中的问题，认为需要完善一下功能需求：

（1）读者群体聚类分析，由于高校人数庞杂，专业分工明确，对图书馆的读者进行聚类分析是非常有必要并且可行的。通过对读者的专业、兴趣爱好等进行聚类，可以将其分成若干读者大群，便于进行针对性的数据挖掘和个性化推荐。

（2）关联分析，每一个读者大群代表着一类具有相同兴趣爱好或者专业背景的用户群体，利用支持向量机的算法进行关联分析，当群体中读者对某一本图书的借阅量较多时，推荐该图书给群体内的读者具有很高的准确度。

（3）中图分类号分析，我国建立了完善的图书分类编号，引入中图分类号进行图书分类，极大提高了图书的检索效率，便于寻找同一类型图书的关联关系，同时还方便了图书的整理和排架工作。

3.2系统整体架构设计

系统采用B/S开发环境，能够最大限度的降低用户成本，作为实现统一客户端的服务器管理模式[1820]。基于Web浏览器，本文根据实际图书管理需要，开发出功能完善三层架构模式，其基础的体系架构图，如图2所示。

用户界面层：读者通过账户密码登录系统后，一方面能够更新个人基本资料，还能够通过界面查询图书信息，包括历史阅读信息、历史借阅信息等。同时，在使用系统过程中读者能够看到相关的图书关联推荐，获取感兴趣的图书资料。

数据处理层：管理员通过后台进行分析，将读者的借阅进行进行数据挖掘和关联分析，分别存入不同的读者大群，当不同群的读者登录后就会根据其所在的身份进行个性化推荐，从而满足读者的借阅和搜寻需求，系统中的读者关联挖掘一般1一个月进行一次。

数据库层：是系统最底层结构，本文采用MySQL数据库，由微软公司研发，该数据库在可靠性、稳定性和安全性方面占据主要优势，同时能够提供外部各类数据接口并存储系统类的图书数据。MySQL数据库中的DataMinning属于一类商务数据智能挖掘技术，能够从当前的图书数据中获取个性化推荐和展示。

3.3数据库设计

（1）数据库的实体描述

图书馆管理系统的数据库设计中，首先分析数据字典中的数据存储进行分析，确定数据库表，然后分析各数据存储之间的关联关系，便于建立图书管理系统数据库，通常采用E-R图进行数据结构分析。图书馆管理系统的E-R图，如图3所示。

（2）数据库表设计

本文所采用的数据库为MySQL，其作用是存放图书管理所需要的基本信息，包括管理员信息表、读者信息表和书籍信息表等等，由于该系统是基于学校图书馆原有系统开发而成，因此基础数据将定期从图书馆系统更新到推荐系统中。下面对其中比较主要的表结构列举如下。该信息表用于存放图书馆管理员的基本信息，包括ID、工号，姓名，性别，电话，住址。在已创建的数据库library中，创建wardon表，添加字段，如表2所示。

该信息表用于存放读者的基本信息，包括学号，姓名，性别，电话，专业，生效时间，失效时间。在已创建的数据库library中，创建reader表，添加字段如表3所示。

该信息表用于存储图书信息，包括书号，书名，作者，出版社，出版时间，存放位置，简介，在馆状态，是否被预约借阅。在已创建的数据库library中，创建book表，添加字段如表4所示。

3.4实例展示与分析

为评价个性化推荐系统的实用效果，设定现在改系统内借阅过图书的读者，利用系统的大数据挖掘算法查看推荐结果。从图3中可以看到，当用户输入自己想要的书籍名称后，首先在搜索框内便会展现该类图书的历史搜索结果。那么根据算法其推荐的图书为《一千零一夜波斯王子与中国公

主》、《一千零一夜天国之梦》和《一千零一夜阿拉丁神灯》等，

系统推荐的图书与该读者借阅图书相似度较高，如图4所示。

为验证该图图书个性化推荐系统的用户群体满意度，本文在某高校图书馆使用该系统后的1年后对该系统运行过程中，针对图书推荐体验进行了满意度问卷调查，问卷调查主要有以下四个选项：

C：系统推荐的图书大部分不符合我的阅读兴趣，我很少借阅;

D：系统推荐的图书不知道为什么都不是我感兴趣的。

发送调查问卷150人，回收问卷132人，回收率88%，调查结果见图4.调查发现选A的读者占比为58%，选B的读者占35%，说明在使用过程中对于该个性化推荐系统满意度超过了90%，能够为读者用户提供一定的借阅便利，如图5所示。

4总结

为解决传统高效图书馆管理系统在查阅文献和图书信

息效率低下，缺乏智能化推荐功能的现象，本文通过分析现有的大数据挖掘工具并融入决策分析体系，建立了图书馆个性化推荐服务系统设计平台，并进行了实例展示和分析，得出以下结论：

（1）采用改進的SVM算法来实现图书馆的个性化数据挖掘，支持向量机算法在使用过程中具有监督的、可扩展和非线性的高效特性，能够实现非线性的多核心数据聚类效果，从而提高数据挖掘的学习能力。

（2）利用BP神经网络对处理后的数据样本进行适应性训练，用户在使用过程中给予一定的正向反馈，该决策分析体系根据反馈结果进行不断的自主学习并更新和优化样品数据，这一决策分析评价体系通过接口输送至支持向量机的算法中，实现了一个闭合的良性循环。

（3）通过对设计的个性化图书馆推荐服务系统使用体验调查发现：选A的读者占比为58%，选B的读者占35%，说明在使用过程中对于该个性化推荐系统满意度超过了90%，能够为读者用户提供一定的借阅便利。

参考文献

[1]

赵兴华.数据挖掘在高校图书馆个性化推荐服务中的应用[J].电脑知识与技术，2020，16（4）：56.

[2]蒲晔芬.基于动态更新的图书馆移动用户行为模型研究[J].微型电脑应用，2020，36（1）：102103.

[3]潘峻.基于双向LSTM的图书分类系统的设计与实现[J].信息技术，2020，44（1）：6770.

[4]贺海侠.基于VRML的虚拟交互图书馆信息管理系统研究[J].信息技术，2019，43（12）：131134.

[5]吴文臣.数据挖掘技术在图书馆推荐系统中的应用研究[J].电脑知识与技术，2019，15（33）：241242.

[6]乔雅，吴琳.基于协同过滤推荐算法的图书馆智慧服务模式研究[J].微型电脑应用，2019，35（11）：150153.

[7]张永强.基于文本相似度比较的高校图书馆个性化图书推荐研究与实现[J].青海师范大学学报（自然科学版），2019，35（3）：8591.

[8]陈豪.个性化推荐方法在高校图书馆书目推荐中的应用研究[D].贵阳：贵州财经大学，2019.

[9]李贺，侯力铁，祝琳琳.移动图书馆情景感知信息推荐服务用户接受行为研究[J].图书情报工作，2019，63（12）：94104.

[10]王振.基于R指数的高校图书馆核心图书推荐模型研究[D].济南：山东大学，2019.

[11]李志.基于深度学习的学术论文推荐研究[D].南京：南京航空航天大学，2019.

[12]崔金环，解海.微信的移动图书馆APP自动服务系统设计研究[J].自动化与仪器仪表，2020（2）：132134.

[13]王晋月.图书馆电子移动设备借阅信息自适应提取方法[J].自动化与仪器仪表，2019（12）：8790.

[14]时冬梅，张艺婕.图书馆书目数据自动采集模型构建[J].自动化与仪器仪表，2019（8）：9194.

[15]彭珍.我国公共图书馆智慧服务研究[D].长沙：湘潭大学，2019.

[16]张艳霞.大数据时代高职院校图书馆的服务功能研究[D].石家庄：河北师范大学，2019.

[17]乔蕊.以理工科为主的高校图书馆图书个性化推荐方法研究[D].北京：北京工业大学，2019.

[18]廖云璐.公共数字文化工程服务质量评价与对策研究[D].南昌：南昌大学，2019.

[19]周秋霞，杨春杰.基于物联网技术的智慧图书馆监控管理系统设计[J].自动化与仪器仪表，2018（11）：8588.

[20]刘淑娟.网络环境下图书馆学术信息资源数据库的建设[J].自动化与仪器仪表，2018（6）：3536.

（收稿日期：2020.03.27）

猜你喜欢

个性化图书馆

基于OBE的Java程序设计个性化教学研究

基于个性化服务的高效图书馆大数据挖掘与决策分析体系构建研究

猜你喜欢

杂志排行

微型电脑应用的其它文章