APP下载

基于深度学习的图书馆资源个性化推荐研究

2021-07-20

科技经济导刊 2021年19期
关键词:卷积个性化深度

祝 婷

(西安工业大学图书馆,陕西 西安 710021)

图书馆资源是读者增长学识和开展科学研究的重要知识源,然而随着互联网技术的快速发展,图书馆资源呈爆炸式增长,给读者们带来“信息过载”问题。一方面,读者面对海量的图书馆资源,很难从中获取自己感兴趣的资源;另一方面,部分图书馆资源被淹没,没有展现给读者的机会,造成资源浪费的现象。在这种场景下,图书馆资源个性化推荐技术便显得愈发重要。传统的图书馆资源推荐包括基于关联规则的推荐、基于内容的推荐、基于协同过滤的推荐以及混合推荐等。在大数据背景下,读者面对的图书馆资源更多具备复杂多样、无规律和多源异构等特征,如何深层次地挖掘这些资源的隐式特征,是提高推荐准确性的重要措施。深度学习技术可以通过多个处理层来实现数据深层次的挖掘和表示,因此,将深度学习技术应用于图书馆资源推荐已成为一种研究趋势。本文首先概述了图书馆资源推荐的现状与不足,然后分析了深度学习在图书馆资源个性化推荐中的作用,最后在此基础上构建了基于深度学习的图书馆资源个性化推荐框架,以期提高读者的用户体验以及图书馆资源的利用率。

1.图书馆资源个性化推荐概述

1.1 图书馆资源个性化推荐现状

常见的图书馆资源个性化推荐方法主要分为以下几种:①基于关联规则的图书馆资源推荐。该方法通过数据挖掘算法获取读者浏览资源数据库中的强关联规则,读者在借阅或下载资源时与其强关联规则进行匹配,将关联匹配的图书馆资源推荐给读者;②基于内容的图书馆资源推荐。该方法首先根据读者选择的图书馆资源生成读者兴趣模型,然后将图书馆资源生成内容特征向量,最后对比读者兴趣模型和图书馆资源内容特征之间的相似性,将相似性较高的图书馆资源推荐给读者;③基于协同过滤的图书馆资源推荐。该方法是应用最为广泛的推荐技术,它的主要思想是相似读者具有相似的兴趣爱好,大致步骤为首先根据读者对图书馆资源的评分生成评分矩阵,然后在评分矩阵中使用相似性算法计算目标读者的近邻读者,最后将近邻读者喜欢的图书馆资源推荐给目标读者。④混合图书馆资源推荐。为弥单一推荐方法的不足,取其优势,避其缺陷,可将多个推荐方法进行融合形成混合推荐方法。混合推荐方法通常分为前融合、中融合和后融合,通过不同推荐方法的融合,可以产生更好的推荐效果。

1.2 图书馆资源个性化推荐存在的不足

图书馆资源推荐方法未和深度学习技术进行融合。目前常见的图书馆资源推荐方法本质上是通过浅层学习方法获取读者、资源以及读者资源之间的关系,实现个性化推荐。这种推荐方法虽然在一定程度上可以满足读者的个性化需求,但是由于浅层学习方法无法深层次的挖掘推荐系统中的读者和资源信息,即无法学习深层次的特征,致使限制了图书馆资源推荐的准确性。另外,反应读者行为和个性化需求的周围环境数据通常具有多源异构、稀疏、不均匀分布等特征,浅层学习方法较难处理这类数据。因此,如何深层次地从读者和图书馆资源中获取读者的兴趣爱好并结合周围环境的隐式特征是实现图书馆资源推荐过程中面临的严重挑战。

2.深度学习在图书馆资源个性化推荐中的作用

2.1 深度学习技术

深度学习是机器学习领域的一个重要分支[1],已成为人工智能以及互联网大数据的热潮,并广泛应用于自然语言处理、语音识别、图像处理、机器翻译等领域[2]。它是以神经网络为基础,通过组合低层次的特征进而形成高层次的抽象表示,实现对数据进行更为复杂特征表示的算法。与传统的机器学习模型相比,深度学习可以自主、高效地进行特征抽取,不需要依赖自身领域知识及人工构建特征,并且深度学习模型具有三层及以上网络结构,网络模型更为复杂。典型的深度学习算法包括卷积神经网络(Convolutional Neural Network,CNN)、循环神经网络(Recurrent Neural Network,RNN)、深度信念网络(Deep Belidf Network,DBN)和受限玻尔兹曼机(Boltzmann Machine,BM)等[3]。

2.2 深度学习与图书馆资源推荐

图书馆资源推荐引入深度学习技术是为了更深层次的挖掘读者和资源的隐式特征,同时从多源异构等特征的数据中自动学习特征,将其映射到同一空间,进行统一表示。因此,与传统的图书馆资源推荐方法相比,深度学习技术在资源推荐领域中的应用具有一定的优势,它可以更加精准地学习读者的喜好、图书馆资源的特征,以及读者与资源间的交互行为,不再依赖人工特征设计,不仅减少了人工负担,而且可以获取数据的语义信息及内在联系,从而提高图书馆资源推荐的准确性,达到提升用户体验的目的。图书馆资源推荐是解决读者面临的信息过载问题和充分利用图书馆资源的重要途径,将深度学习融入到图书馆资源推荐系统中,对于克服传统图书馆资源推荐方法的不足,改进推荐系统的质量,提升图书馆的个性化服务水平具有重要意义。

3.基于深度学习的图书馆资源个性化推荐框架构建

本文将深度学习技术与图书馆资源推荐结合,构建基于深度学习的图书馆资源个性化推荐框架。框架分为数据输入层、深度学习模型层以及推荐结果输出层。首先,从读者和资源中提取相关数据,作为推荐模型的输入;然后,通过深度学习模型生成读者和图书馆资源的隐式表示特征;最后,根据读者与图书馆资源的隐式特征获取两者之间的相似性或关联度,输出图书馆资源推荐结果。具体推荐框架见图1所示:

图1 基于深度学习的图书馆资源推荐框架

3.1 数据输入层

图书馆资源个性化推荐是根据读者、资源以及读者与资源间的交互数据进行推荐,因此推荐框架的数据输入层包括读者属性数据、图书馆资源数据、读者与资源之间的交互行为数据以及其他数据。输入层是推荐框架的数据源,必须建立在客观真实的基础上,才能保证推荐结果的准确性。读者属性数据包括读者姓名、性别、年龄、专业、学院、研究方向等数据,可以从图书馆管理系统中提取读者属性数据;图书馆资源数据包括图书馆纸质资源的书名、作者、出版社、简介等和电子资源的题名、作者、摘要、关键词等数据,可以从图书管理系统中提取纸质资源数据,从电子资源数据库中提取电子资源数据;读者与图书馆间之间的交互行为数据分为显示反馈数据和隐式反馈数据,显示反馈是指读者喜欢或不喜欢某个资源(可以用0或1表示)、读者对资源的评分(可以用1-5表示,数值的大小代表读者对资源的喜爱程度),是读者对资源的直接反馈。隐式反馈是指读者搜索、浏览、借阅、纸质资源的次数,在线浏览、下载电子资源的次数以及浏览电子资源时长,是读者对资源的间接反馈,可以从图书馆书目检索系统、图书馆微信公众号、图书馆网站等提取读者行为数据;其他数据包括读者的社交网络数据、情境数据等。社交网络数据,如读者之间的社会化关系可以通过社交网站抓取,情境数据,如读者所处的位置、物理环境等可以通过智能终端和传感器设备实时采集。

3.2 深度学习模型层

深度学习模型层是在数据输入层输入数据的基础上,根据读者所处的实际场景和不同深度学习技术的特点,选用适当的深度学习方法对输入的数据进行自动特征提取,生成读者和资源的隐式特征表示。常见的深度学习模型有卷积神经网络、循环神经网络、受限玻尔兹曼机等。本文选择卷积神经网络来实现图书馆资源的特征提取,由于神经网络不能处理文本,因此需要对图书馆资源进行数据预处理和向量化表示。对图书馆资源的题名、作者、摘要、关键词进行合并、分词、去停用词处理,使用GloVe或Word2Vec对图书馆资源进行词向量表示,将这些数据作为卷积神经网络的输入数据。

卷积神经网络由输入层、卷积层、池化层、全连接层和输出层组成[4],输入层:将图书馆资源词向量表示pi作为模型的输入。卷积层:实现特征提取,卷积操作可以表示为公式,其中*代表卷积操作,Kj为卷积核,bj为偏置项,f表示激活函数。池化层:实现降低维度,将数据进一步压缩,分为平均池化Mean Pooling(取区域内平均值)和最大池化Max Pooling(取区域内最大值)。选择最大池化,对上层的输出结果进行池化操作,即取卷积核对应范围的最大值,输出为Zj= max。全连接层:汇总组合特征信息,对池化层的输出进行拼接,可以表示为Z=Z1⊕Z2⊕ … ⊕Zn,通过全连接层,最终将图书馆资源的隐式特征可表示为y=f,其中W为全连接层的权值矩阵,b为偏置项。同理,也可以生成读者的隐式特征表示。

3.3 推荐结果输出层

推荐结果输出层是根据深度学习模型层生成的读者与资源的隐式特征,通过相似性计算、内积、Softmax等方法,最终产生图书馆资源推荐结果。数据输入层的读者属性数据和读者行为数据等经过深度学习模型层提取出读者的隐式特征表示,图书馆资源属性数据经过深度学习模型层提取出图书馆资源的隐式特征表示,然后基于隐式特征表示,计算读者和图书馆资源的相似性或关联度,相似性计算方法包括皮尔逊相关系数、余弦相似性和修正的余弦相似性等方法,对图书馆资源按照相似性大小从高至低进行排序,最终选取前N个图书馆资源推荐给读者。

4.结语

随着人工智能技术的快速发展,基于深度学习的图书馆资源个性化推荐系统为解决信息过载问题和提升图书馆资源利用率提供了新的研究思路和发展方向。文章内容分为三个部分:第一,介绍了基于关联规则的图书馆资源推荐、基于内容的图书馆资源推荐、基于协同过滤的图书馆资源推荐等常见的图书馆资源推荐方法,提出了常见的图书馆资源推荐无法深层次的挖掘读者和资源的隐式特征,进一步限制了推荐准确性等问题;第二,在此基础上,将深度学习技术引入至图书馆资源推荐系统中,不仅减少了人工特征设计负担,而且可以挖掘读者和资源的深层次隐式特征,从而提高图书馆资源推荐的准确性;第三,构建了基于深度学习的图书馆资源推荐框架,主要包含数据输入层、深度学习模型层和推荐结果输出层,在大数据背景下,为读者提供更为精确的图书馆资源推荐服务提供参考。

猜你喜欢

卷积个性化深度
四增四减 深度推进
深度思考之不等式
一种融合PageRank和PersonalRank的多层个性化推荐算法
基于3D-Winograd的快速卷积算法设计及FPGA实现
一种并行不对称空洞卷积模块①
坚持个性化的写作
从滤波器理解卷积
简约教学 深度学习
基于傅里叶域卷积表示的目标跟踪算法
上汽大通:C2B个性化定制未来