大数据背景下基于用户特征库的个性化资源推荐技术探讨

2021-04-04冯丽丹

信息记录材料 2021年4期

冯丽丹

（柳州铁道职业技术学院广西柳州 545616）

1 引言

当前，大数据信息技术和移动网络通信技术发展趋势迅猛，互联网用户对于数据的需求特点逐渐趋于复杂化，是一个动态变化状态。因此，为便于用户高效利用资源，节约时间，根据用户的需求特点实现个性化推荐至关重要。这就要求相关领域学者投入精力研究如何从海量数据资源中挖掘并向特定用户推荐有价值的资源。本文旨在研究大数据背景下基于用户特征库的个性化资源推荐技术相关内容，分析发展现状并展望未来趋势，以期凸显大数据背景下资源共享的优势，为广大互联网用户的生产生活提供便利，推动互联网技术进一步发展。

2 大数据用户特征库与个性化推荐概述

2.1 大数据

随着时代的进步和社会经济的发展，包括互联网、物联网和人工智能等在内的现代化科技高速发展，由此造成的网络数据喷涌而出并持续积压形成庞大的数据库。这显然为人们全面了解和深入解决某些问题提供了有力支撑，但是这一切的前提是解决用户如何从海量的数据中找到自己需要的有价值的数据的问题。现阶段已有大量有关数据分析和数据挖掘等数据处理技术的研究，但是随着互联网的应用范围进一步扩展，处理海量数据也面临越来越多的新问题，相关技术的深入研究迫在眉睫。

随着大数据技术的不断发展，与学习相关的资源个性化推荐逐渐成为其主要研究方向之一。相关研究包括：探讨在互联网大数据的背景下如何通过变革资源服务模式实现更高效的学习方式；分析探讨大数据背景下国内外先进资源推荐技术应用的实例，尤其是在与教育资源相关的适应性教学和精细化教学管理等方面；当前国内外大数据应用相关的工作热点倾向于管理与决策工作方面，具体表现为要求信息化平台结合用户需求进行后台分析，据此制定切合用户群体特征的个性化资源服务策略。

2.2 用户特征库

用户特征库具体包括不同用户的各类信息包括兴趣爱好、专业领域等的整合，以期通过收集整理用户的不同方面的特征来获取他们对于资源需求的偏向，从而对用户进行精准分析，建立用户标签，最终形成个性化用户档案模型。在信息化管理及应用平台中，利用基于用户特征库的个性化资源推荐技术，可以获得用户对资源信息的属性关联性信息，实现平台资源信息的高匹配度的个性化推荐，不但为用户提供有价值的数据资源服务，还能有效节约用户在海量数据资源中挖掘有用资源的时间和金钱成本，具有重要的现实意义。

2.3 个性化推荐

在当前大数据背景下，个性化推荐技术是处理海量互联网数据应用最广的数据处理技术，对解决互联网数据过度积压问题起到至关重要的作用。

个性化资源推送服务目前的研究覆盖领域已经达到相对全面的状态，包括动态过程、静态过程以及应用更广的两者结合的过程分析方法。其中，采用静态数据分析方法的具体方式表现为综合线上线下对用户的受教育程度，对新技术的可接受性和适应性等的调研结果，分析不同用户各项指标间的差异，并用数据形式表现出来。而动态数据分析方法的应用则表现为在实际资源推送服务中系统根据用户在寻求资源的过程中表现出的不同行为习惯和兴趣爱好等方面的差异及变化及时做出相应的调整，从而完成高效的个性化资源推荐服务[1]。

在实现个性化资源推送的算法中，目前主流的算法主要有以下几种：（1）基于内容的推荐；（2）基于关联的推荐；（3）基于项目的协同过滤；（4）基于模型的协同过滤。

3 基于用户特征库的个性化推荐技术研究思路

研究从主流推荐算法入手，通过几种推荐算法的组合使用，从大数据中分析及构建用户特征，建立用户状态数据库、网络交互关系库和特征模型库，基于此设计个性化的资源推送服务框架，并提出个性化资源推送的实施策略，使信息化平台能够实现更精准的个性化智能推送服务。

3.1 用户特征库的构建

研究立足于静态数据和动态数据相结合的方法来分析用户特征。在实际应用中采取将动态数据分析方法作为主导，静态数据分析方法作为补充的方案，面向的用户群体为尚未参与学习平台资源推荐活动的用户，将各项调查结果作为辅助参考依据。获取的工具主要利用Felder-Silverman学习风格量表来进行。动态数据获取适合于有学习行为发生的用户，数据获取方式主要是从教育大数据中进行挖掘和分析。

3.2 个性化资源推送服务框架设计和构建

在分析和构建了用户特征模型之后，为了进一步有效地实现教育大数据中用户个性化学习资源推送的目标，基于用户特征模型构建用户个性化学习资源推送框架的构建参照Map Reduce数据处理框架进行设计，主要包括数据收集层、数据处理层、数据分析层和数据呈现层四个方面。

数据收集层主要收集用户的静态数据和动态学习行为数据。数据收集层还具备存储其采集到的大量数据的功能，这些数据的处理工作主要由数据处理层完成，数据处理包括提取数据的关键词，并依据关键词进行分类整理，降低重复率，综合过滤无用的数据信息等。

3.3 个性化资源推送的实施策略

个性化资源推送的实施策略主要有两个步骤：第一步，对知识点内容进行资源特征标记，存储在资源特征库中；第二步，结合用户特征与资源库的资源特征，考虑个性化学习资源如何推送给相应的用户。在推送过程中，可以依照前期学习风格量表的调查分析用户特征，依据不同学习风格特征的用户对于资源的偏好完成资源类型的个性化推荐，即基于内容的资源推荐。

3.4 关键环节

3.4.1 建立用户状态数据库、网络交互关系库和特征模型库

在建立用户特征模型之前需要判断用户是否首次进入信息化平台学习，并据此进行相应的后续操作：如果是，用静态数据获取的方式建立用户特征模型；如果不是，则需要结合首次进入获取的静态数据和学习行为发生后获取的动态数据进行对比，确认用户模型。用户模型分析中需要利用数据存储层存储的数据，然后在分析层对用户的个体特征、学习状态、偏好类型、学习路径、交互关系等进行分析，建立用户状态数据库、网络交互关系库和特征模型库。此外，还需要考虑是否存在某一方面具有相似特征的用户，利用Pearson相关分析方法分析用户之间是否具有相似性。

3.4.2 个性化资源推送实现路径中，基于特征匹配的资源推送

这一步骤的实现需要结合用户的特征及资源的差异性两者之间的联系程度，两者联系越密切，存在的相同或相似之处越多，则系统针对用户特征选择某一特定资源的可能性就越大。这一具体过程通常采用用户之间相似度计算方法，在进行相似度匹配时还可以利用欧式距离计算其相似度的大小。

4 大数据背景下个性化推荐技术发展面临的挑战

4.1 用户的隐形喜好

基于用户特征库的个性化推荐技术通常是基于搜集用户在互联网上表现出来的对某类资源的喜好程度实现的。但是在实际的互联网大数据环境下，这种简单直接的方法的可操作性难以达到期望值，因为相比于用户表现出来的显性喜好，用户往往还存在许多未表现出来的隐形喜好，将这些以其他隐性形式表达的用户喜好纳入个性化资源推荐系统是该系统发展面临的挑战之一。