APP下载

图书馆学科文献推荐服务模型探讨

2022-02-14潘雪峰

关键词:馆员神经网络人工智能

潘雪峰

图书馆学科文献推荐服务模型探讨

潘雪峰

(辽宁工业大学 图书馆,辽宁 锦州 121001)

便捷高效的文献检索为科学研究提供有力支持。本文以图书馆为背景,结合人工智能方法提出学科文献推荐服务模型,为图书馆的学科建设提供参考。首先,简述了学科馆员在深入服务学科科研工作基础上给出的专业的文献推荐意见。其次,介绍了基于深度神经网络构建的人工智能文献推荐模型。两种模式都从各自的原理、意义及存在问题进行阐述。最后,将两种模式进行整合。本文提出了学科文献推荐服务模型并介绍其原理和意义,以期为图书馆学科文献推荐服务提供一种新的方法。

深度神经网络;专业文献推荐;学科文献推荐服务

一、引言

《全民科学素质行动规划纲要(2021—2035年)》一文中,特别强调了科技创新的重要性,科学普及的必要性。作为知识宝库的图书馆必将成为高校发展的重点。2017年我国实行“双一流”高校图书馆学科建设,从不同学科对科研文献的需求出发,以学科服务为指南,采用先进的技术设备,结合馆员自身素养的提升,为广大读者提供优质的文献推荐服务。然而,由于种种原因,相关问题不断显现。进入21世纪后,人工智能得到迅猛发展,各种人工智能推荐算法层出不穷,在文献推荐方面,由于个性化数据较少,文献推荐缺乏针对性。因此,将二者相结合,规避各自的问题,凸显各自的优势,学科文献推荐模型就显得尤为重要。

二、专业文献推荐

(一)专业文献推荐原理

自2010年起,我国高校图书馆学科服务平台建设取得了显著的成效[1]。学科服务以学科馆员工作为核心。各高校建立学科馆员团队,通过学科馆员深入了解不同学科的文献需求,提供专业的文献推荐服务,如图1所示。本文总结了学科馆员在学科服务工作中应完成的8项基本工作。

(二)专业文献推荐意义

高校图书馆作为支持高校科研工作的中坚力量,在加强图书管理的同时,更应为高校各学科科研提供专业文献推荐服务。在《为图书馆行业提供思想》[2]一文中,范并思教授指出,由于图书馆服务需求不足,高校图书馆最重要的纸质图书资源沦为装饰阅读空间的“壁纸”。专业文献推荐有助于提升图书馆的服务质量,为科研工作的顺利进行提供帮助,节省大量的文献搜索时间,尤其对科研工作刚刚起步的教师和学生有很大的引导作用。同时,向取得一定科研成果的教师和学生搜集文献推荐意见也可以起到事半功倍的作用。专业文献推荐为高校科研事业的发展提供便利条件。

(三)专业文献推荐存在问题

目前,由于学科服务实施过程中存在漏洞,专业文献推荐出现了一些问题。首先,从学科服务专业理论的角度来看,学科服务还属于探索的初期阶段。学科馆员多数都是半路出家,对不同专业的文献推荐也处于摸索阶段,推荐结果有一定的偏差。其次,学科服务没有达到前瞻性。目前大多数高校学科馆员都兼职其他工作,没有时间和精力去对比筛选所搜索的文献,都是简单的文献推送和传递,导致读者收到大量相似文献,服务满意度不高。最后,从咨询专家、专业教师推荐的文献来看,由于专家、专业教师自身学术研究功底较好,经常关注本专业发展较快的期刊,脱离了本校学生的基础,常常导致推荐的文献对于本专业学生来说显得过难,无法体现推荐价值。

图1 学科馆员8项基本工作

三、人工智能文献推荐模型

(一)人工智能文献推荐模型原理

1997年RESNICK和VARIAN提出推荐系统[3],淘宝、京东等都属于电子商务推荐系统。然而推荐方法多出现数据稀疏和冷启动问题[4]。为了避免这两个问题,文献推荐在推荐系统模式的基础上,以大数据为背景,应用深度学习的方式构建人工智能文献推荐模型。2021年《中国互联网发展报告》显示,我国大数据产业规模不断扩大,主要由于互联网移动端发展显著。各行各业汇集着大量数据,图书馆也不例外。应用人工智能研究大数据背后的联系成为很多学者研究的方向。徐磊等[5]依据大数据对读者个人信息保护进行了研究。本文对深度学习模型进行了总结,此模型一般包括数据收集、模型构建、模型优化、评价标准四个部分,如图2所示。

图2 深度学习模型

1. 数据收集

图书馆的数据多来自于数据库的积累。除图书馆自身管理的数据库以外,电子资源数据库也是图书馆强大的数据支持,如超星数据库、中国知网CNKI数据库等。各种数据库收集的数据量越来越多。从大数据中发现数据内部的奥秘成为各行各业追赶的方向。为了使模型推荐的文献更具专业性,在图书馆已有数据库的基础上,还要收集应用OPAC(Open Public Access Catalogue)检索机检索文献的个性化数据,如读者所在学科、喜欢书目偏好以及检索后的满意度评分等。通过这些数据构建深度神经网络模型,发现大数据背后的秘密。

2. 模型构建

自2006年HINTON提出了深度置信网络(DBN)后,深度学习进入了发展的提速期。深度学习本质是复杂的人工神经网络,又名深度神经网络,是模式识别的一种模型构建方法。采用多隐层、多层感知器的结构。深度学习具有学习能力强、覆盖范围广、适应性好的特点。

模型构建方法的选择需要依据数据的特点而定。从其发展顺序来看,深度神经网络最早使用自编码机[6]、玻尔兹曼机[7]、深度信念网络等方法构建模型。近些年卷积神经网络[8]和循环神经网络[9]应用较多,其主要原因是卷积神经网络可通过卷积算法抓住局部特征,通过参数共享,加快算法速度,降低网络模型的复杂度,对于图像处理优势明显。循环神经网络改变了一般神经网络同层间神经元相互独立的特点,使得同层神经元互相连接,对过去信息进行记忆。随着科技的发展,更多的模型构建方法会大量出现,这也是科技创新的热点方向。对于构建图书馆人工智能文献推荐模型选择哪种方法要根据图书馆的具体情况而定,如高校学科设置偏向、学术研究倾向等,并经过大量的试验综合给出推荐结果。

值得注意的是,在模型构建前,数据的粗糙性经常需要对原始数据进行预处理,如由于数据部分缺失导致大量数据不可用,应用一些方法将缺失值补齐;由于量纲不同导致数据没有可比性,经常要对数据进行换算处理,使数据不至于极端化。

3. 模型优化

模型构建后还需要进行优化。优化方式如下:

(1)模型相应参数的优化,如梯度下降算法;(2)激活函数的选择,如ReLU[10]、Sigmoid[11]等;(3)模型构建时应尽量简化,防止过拟合现象出现。过拟合通常由于数据太少,无法反映真实分布、数据含有噪声,模型覆盖噪音点、模型训练过度等原因产生,因此可以采用Dro-pout、DropConnect等方法防止过拟合。

本文提到的优化方法只是模型优化方法的一小部分,更多的优化方法值得进一步研究。

4. 评价标准

模型构建的好坏可以通过一些评价标准进行衡量。深度学习模型常采用准确率、混淆矩阵等进行评价。标准的选择也要根据数据的特点,有的模型只选择其中一种评价标准,有的模型选择其中几种辅以相应的参数协同评价。

(二)人工智能文献推荐模型意义

2017年,随着大数据、物联网、云计算的迅速发展,智慧图书馆成为我国具有代表性的图书馆形态。智慧图书馆呈现出服务理念和人性化服务,因此,各种推荐系统层出不穷。人工智能文献推荐模型对于图书馆员来说可以节省大量的数据统计时间。通过模型发现大数据的潜在价值,使推荐结果更加智能化、专业化、人性化。同时,推荐服务对象覆盖面广,可以节约读者很多阅读时间,用最快的速度提供最优质的服务。

四、学科文献推荐服务模型

(一)学科文献推荐服务模型构建原理

本文提出学科文献推荐服务模型,如图3所示。模型包括两部分,分别为专业文献推荐和人工智能文献推荐两个方面。

图3 学科文献推荐服务模型

在专业文献推荐部分,根据学科馆员对服务学科的教师和学生进行询问沟通发现其文献需求,通过专家、教师的推荐以及学科馆员自身科研素质的提高,最终为读者提供专业的文献推荐服务;人工智能文献推荐部分,通过图书馆数据库的积累和OPAC检索机个性化数据的收集,应用深度学习方法进行模型构建,通过优化方法结合评价标准完善模型构建,最终给出人工智能文献推荐结果。计算人工智能文献推荐结果与专业文献推荐意见的相似度,如欧氏距离方法。

其中x表示专业文献推荐的结果,y表示人工智能文献推荐结果。当用欧几里得距离表示相似度,一般采用以下公式进行转换规约到(0, 1]之间,转换公式为:

为了更加直观,本文的相似度采用百分制,即:

相似度在s>90%以上直接将人工智能文献推荐结果推送给读者,相似度s≤90%及以下将专业文献推荐结果推送给读者,并将每次推荐结果乘以50%反馈给人工智能文献推荐模型,起到反馈调整的作用。

需要强调的是,这里的90%和50%仅作为一个案例参考,具体数值要根据不同图书馆的具体数据而定,需要不断地调整这些参数达到模型的最优化,并非参数越大越好。

(二)学科文献推荐服务模型举例

专业文献推荐多以教师自身的学科素养和教学实践为主,如推荐一本关于Python的书籍,教师根据自身接触的Python相关资料会推荐其教学中常见的书籍《Python基础教程》。以人工智能文献推荐的方式,应用深度学习方法,将与Python相关的书籍信息输入模型中,经过分析计算,推荐书籍为《Python基础教程第三版》。应用欧氏距离方法计算出两种推荐结果相似度在90%以上,因此最终推荐结果为《Python基础教程第三版》。若专业文献推荐书籍为《Python学习手册》,人工智能文献推荐为《Python基础教程第三版》,应用欧氏距离方法计算出两种推荐结果相似度在90%以下,则推荐结果为《Python学习手册》更具说服力。同时,将每次的结果都乘以50%的系数放到下次人工智能文献推荐模型相关预测的基础数据中,便于模型的自我矫正。经过测试,应用学科文献推荐服务模型推荐的结果很大程度上能够满足读者的需求。

(三)学科文献推荐服务模型意义

本模型既考虑了专业文献推荐的学术性又利用大数据的潜在价值构建深度神经网络模型,二者相结合,既解决了专业文献推荐由于学科馆员自身专业素养不够、推荐文献量大、不精准的问题,又解决了人工智能文献推荐模型由于数据量不够、模型优化不完善、推荐没有专业化的问题。为高校师生科研文献需求提供专业化服务,对高校的学科发展起到推进作用,是图书馆科技创新和专业服务的具体体现。

五、结论

学科服务已经成为很多高校图书馆的发展趋势,但随之而来的问题也不断涌现,如何找到更加智能化、更加人性化的服务方式成为很多图书馆的研究方向。人工智能的出现,尤其是深度神经网络的研究在很多领域都取得了显著成效。目前,图书馆应用人工智能设备已经取得了一定成果,如人脸识别、自助借还机等都是图像识别的具体体现。因此,本文结合专业文献推荐和人工智能文献推荐两种模式,综合衡量推荐结果,希望能够为读者提供更加专业的文献推荐服务,为高校学科服务的发展提供有力的支持。

[1] 娄冰. “双一流”高校图书馆学科服务现状分析及对策研究[J]. 图书馆工作与研究, 2021(2): 106-112.

[2] 范并思. 为图书馆行业提供思想[J]. 图书馆建设, 2021(1): 4-5.

[3] RESNICK P, VARIAN H R. Recommender systems[J]. Commu-nications of the ACM, 1997, 40(3): 56-58.

[4] 黄立威, 江碧涛, 吕守业, 等. 基于深度学习的推荐系统研究综述[J]. 计算机学报, 2018, 41(7): 1619-1647.

[5] 徐磊, 郭旭. 大数据时代读者个人信息保护的实践逻辑与规范路径——以图书类APP隐私政策文本为视角[J]. 图书馆建设, 2021(1): 74-83+92.

[6] 赵阳, 朱全银, 胡荣林, 等. 基于自编码机和聚类的混合推荐算法[J]. 微电子学与计算机, 2018, 35(11): 52-56.

[7] 沈筱譞. 深度学习推荐方法及应用研究[D]. 武汉: 华中师范大学, 2020.

[8] 林景栋, 吴欣怡, 柴毅, 等. 卷积神经网络结构优化综述[J]. 自动化学报, 2020, 46(1): 24-37.

[9] 王菲. LSTM循环神经网络的研究进展与应用[D]. 哈尔滨: 黑龙江大学, 2021.

[10] 蒋昂波, 王维维. ReLU激活函数优化研究[J]. 传感器与微系统, 2018, 37(2): 50-52.

[11] NGUYEN VAN-TRUONG, 蔡觉平, 魏琳育, 等. Sigmoid函数的低复杂度概率分段线性拟合法[J]. 西安电子科技大学学报, 2020, 47(3): 58-65.

10.15916/j.issn1674-327x.2022.06.011

TP391.3;G258.6

A

1674-327X (2022)06-0041-04

2022-02-24

潘雪峰(1990-),女,黑龙江齐齐哈尔人,馆员,硕士。

(责任编辑:许伟丽)

猜你喜欢

馆员神经网络人工智能
神经网络抑制无线通信干扰探究
基于神经网络的中小学生情感分析
2019:人工智能
人工智能与就业
青海省人民政府关于转聘谢承华、斗尕馆员为荣誉馆员的决定
勘误
青海省人民政府关于转聘谢佐等3位馆员为荣誉馆员的决定 青政〔2017〕32号
数读人工智能
下一幕,人工智能!
基于神经网络的拉矫机控制模型建立