APP下载

基于用户兴趣偏好度的音乐智能推荐系统设计分析

2022-06-15张利鸽

电子设计工程 2022年11期
关键词:基础模块音乐

张利鸽

(渭南师范学院,陕西渭南 714000)

当前,网络技术高度发达,我国网络域名规模达到千万级以上,网络技术在人们生活中无处不在[1]。推荐系统作为主要的网络营销工具[2],可使用户在面对海量网络商品信息时获取有价值的建议,并提升网络商品的销售量[3]。

音乐浏览是网络技术的一种主要应用形式[4],面对互联网上海量的音乐媒体信息,如何快速地获取用户所需的音乐类型,并将用户感兴趣的音乐推荐给用户,成为当前网络媒体网站提升自身市场占有率的主要方式。以此为目的,设计基于用户兴趣偏好度的音乐智能推荐系统。在设计数据采集模块、离线数据处理模块和在线推荐模块的总体架构基础上,考虑用户音乐兴趣偏好度和个性化的需求,引入协同过滤算法,利用近邻数目确定音乐推荐偏好度,实现对用户的精准音乐推荐。

1 基于用户兴趣偏好度的音乐智能推荐系统

1.1 系统整体结构设计

该文设计的音乐智能推荐系统主要由数据采集模块、离线数据处理模块和在线推荐模块组成,整体结构设计如图1 所示。

图1 系统整体结构图

数据采集模块的主要功能是采集用户注册信息[5]和目标音乐的在线评分数据,并进行在线调查。离线数据处理模块以数据采集模块采集的数据为基础,分析用户兴趣偏好度、统计用户信息等。在线推荐模块根据用户兴趣偏好度分析结果,针对不同用户需求为用户推荐能够满足其需求的音乐。

1.2 数据采集模块设计

该文系统的数据采集模块运行流程如图2所示。

图2 数据采集模块运行流程设计

数据采集模块可在系统处于初始启动状态条件下或独立线下运行时,得到系统运行所需的数据资源。数据采集模块的重点作用是高效获取海量有效数据,同时以合适的格式记录数据信息,并生成相应文件[6],便于后续的聚类处理与数据库存储。数据采集模块内,部分功能需以处理好的数据信息为基础,因此需要模块内不同功能交替协作才能完成全部数据的准备。

1.3 用户兴趣偏好度计算

离线数据处理模块中利用基于POI(Point of Interest,兴趣点,即用户搜索过的音乐)的用户兴趣偏好度计算方法,基于POI关联图[7],提出基于时间的用户兴趣偏好度计算方法,以此确定用户兴趣偏好度。

1.3.1 构建POI关联图

POI 的构建可在离线状态下进行[8]。将全部用户的音乐搜索序列内的POI 作为关联图内的节点,表示用户搜索的音乐,通过分析用户在音乐搜索序列内的连续访问行为[9]生成关联图的边。

1.3.2 音乐映射

用户分享的音乐数据结构由以下4 方面构成:音乐ID[10]、用户ID、时间、类型。基于用户分享的音乐数据结构能够获取用户搜索音乐的具体信息,确定用户的POI 列表,用SM=(p1,p2,…,pn)表示。

1.3.3 确定POI流行度

利用式(1)可计算POI 流行度:

式(1)内,N(p) 和Nmax分别表示用户搜索POI的次数和全部同类型音乐中用户搜索音乐的上限数值。

1.3.4 用户兴趣偏好度计算方法

基于用户的历史音乐搜索信息,提出基于时间的用户兴趣偏好度计算方法。用户在搜索一个POI音乐时,均会在该音乐POI 停留一定时间[11],由全部用户的历史音乐搜索记录内依照以下过程确定用户搜索过的各音乐POI 的浏览时间。用u表示一个用户,确定其POI 集合。依照时间顺序定义用户u的历史音乐搜索记录:其中px表示用户搜索过的音乐表示用户开始浏览的POIpx时间,表示用户结束POIpx浏览的时间。基于之间的差值能够确定用户浏览音乐POIpx的时间。

基于各音乐POI 的浏览时间能够确定随机用户浏览任意音乐POI 所需的时间均值[12]。设定随机用户在POIpx的平均访问时间为Vˉ(p),其计算公式如下:

式(2)内,U和n分别表示全部用户和全部用户内浏览音乐p的用户数,

但用户在各音乐POI 的浏览时间均值无法准确体现其对该类音乐POI 的兴趣偏好度,利用基于时间的用户兴趣偏好度计算方法,确定用户u对音乐POI 类别属性c的偏好度Int(u,c):

式(3)中,Catpx表示音乐的POIpx类别属性,

通过式(3)能够确定用户u对于一个特定音乐POI 类别属性c的兴趣度,相对于全部用户对同一个音乐POI 的浏览时间均值,Int()u,c是以用户在不同类别属性c的POI 浏览时间为基础确定的,即用户有较大概率花费时间浏览其感兴趣的音乐POI 类型[13],由此确定此用户对该音乐POI 类型的兴趣偏好度。

1.4 协同过滤推荐算法

音乐智能推荐系统的关键在于推荐算法,为提升用户的使用感,提高用户的黏合度,需要对用户的音乐兴趣偏好进行深度分析,以达到精准推荐的效果。为此,该文引入协同过滤推荐算法,在分析多个用户兴趣相似度的基础上,考虑用户个性化问题,利用近邻数目确定音乐推荐偏好度,提高对用户的音乐推荐精准度。在线推荐模块中,采用协同过滤算法,以志同道合观点为基础[14],该算法的核心观点为:若兴趣偏好度相同的用户均搜索过某音乐,则兴趣偏好度一致的用户有较大概率会对某音乐产生明显偏好;若用户对某音乐产生兴趣偏好,则其同样会更倾向于选择同该音乐一致度较高的音乐。普遍使用的协同过滤推荐过程实现方式大致可分为3 种[15]:以用户为基础的推荐方式、以项目为基础的推荐方式、以模型为基础的推荐方式。

以用户为基础的推荐方式[16]:给定一个用户,评分数据与音乐项目。部分音乐项目并未产生评分,在此条件下可利用与此用户相近的其他用户评分结果进行预测。通过式(4)可描述用户a与用户b的兴趣偏好度的一致度函数:

以项目为基础的推荐方式与以用户为基础的推荐方式在本质上具有较强相似性。但随着时间的变化,用户的兴趣偏好具有波动性,因此以用户为基础推荐方式的推荐结果无法完全满足用户需求。以项目为基础的推荐方式可有效避免时间造成的波动性问题,可提升推荐结果的稳定性。在获取用户之间兴趣偏好度的一致度后,考虑不同用户的思维方式与评分标准有所差异,因此以项目为基础的推荐方式可通过余弦一致度进行分析,音乐项目m和音乐项目n的余弦一致度可通过式(5)确定:

以用户为基础的推荐方式和以项目为基础的推荐方式均包含选择近邻的过程,通常情况下,这两种推荐方式均需通过大量的计算过程,但数据仅取其中少量部分,造成协同推荐算法产生数据稀疏问题,降低推荐结果的精度。且考虑新用户并未进行音乐搜索与评分,无法使用选近邻的过程,造成冷启动问题。以模型为基础的推荐方式依照数据库内对目标音乐的评分结果,通过离线计算现有用户对目标音乐的评分,利用模型评估过程得到全局推荐结果。但采用以模型为基础的推荐方式在评估训练过程中会消耗大量资源,且频繁更新模型。

基于上述分析可知,系统在线推荐模块采用协同过滤算法,以用户兴趣偏好度为基础,针对不同的用户采用不同推荐方式生成推荐列表,以此提升系统推荐性能。

2 应用分析

为验证该文设计的基于用户兴趣偏好度的音乐智能推荐系统在实际音乐推荐应用中的性能,选取某互联网知名音乐APP 为应用对象,采用该文系统对用户进行音乐推荐测试。从应用对象中随机选取1 000 名用户信息,在这些用户信息中共包含有效评价数据448 539 条与不同类型歌曲记录183 580 条。

2.1 系统功能测试

系统功能的实现是系统有效运行的基础,因此采用黑盒测试法测试该文系统的功能,主要测试用例为:①用户登录成功:输入正确的用户名与密码,期望输出结果为成功登录;②用户登录不成功:输入错误的用户名与密码,期望输出结果为用户名或密码错误,请重新输入;③生成推荐结果:输入为针对不同用户,在不同条件下点击推荐列表,期望输出结果为正确预测用户兴趣偏好度,推荐相应音乐。④创建歌单收藏音乐:输入为点击推荐歌曲,点击收藏至相应歌单下,期望输出结果为收藏成功,推荐列表内不再显示;⑤未创建歌单下收藏音乐:输入为在未创建歌单条件下单击收藏推荐歌曲,期望输出为提示创建歌单。各测试用例的黑盒测试结果如图3所示。

图3 黑盒测试结果

分析图3得到,该文系统功能测试中,除用例3的实际输出结果与期望输出结果一致度为62%外,剩余4 个用例的实际输出结果均与期望输出结果完全一致,由此说明该文系统功能满足实际应用需求。

2.2 推荐结果测试

该文系统在线推荐模块包含一个重要过程,即选择近邻过程,所选近邻数量对于系统推荐结果产生直接影响。因此在测试该文系统音乐推荐性能时,选取准确率Zp、召回率Hp、覆盖率Fp和流行度Lp为评价指标,计算过程如下:

在不同近邻数量条件下,该文系统推荐性能评价的结果如图4 所示。

图4 该文系统性能评价结果

分析图4 得到,近邻数量的提升对于该文系统推荐结果产生直接影响。

准确率与召回率:该文系统的准确率与召回率同近邻数量之间呈现正比例相关性,即随着该文系统在线推荐模块中近邻数量的提升,系统推荐结果的准确率与召回率均整体表现为上升趋势。但随着近邻数量的提升,该文系统推荐结果的准确率与召回率提升幅度并不显著,由此说明近邻数量与该文系统推荐结果的准确率与召回率之间相关性并不高。

覆盖率:该文系统的覆盖率指标与近邻数量为反相关性。随着近邻数量提升,该文系统覆盖率降低,且覆盖率下降幅度较大,由此说明近邻数量与该文系统推荐结果的覆盖率之间相关性较高。

流行度:该文系统的流行度指标与近邻数量为正相关性。随着近邻数量提升,该文系统流行度评价结果提高。

但考虑参考用户数量的提升对该文系统推荐效率也产生直接影响,会显著降低该文系统推荐效率,因此综合对比之下,设定近邻数量高于30较为合适。

2.3 实际应用效果

获取应用对象过去三年中不同月份的市场占有率,以其均值为标准,对比采用文中系统后相同月份的市场占有率,结果如图5所示。由图5得到,未采用文中系统之前,应用对象每年的市场占有率波动范围为55.7%~66.8%,平均市场占有率约为61.25%。采用该文系统之后,应用对象每年的市场占有率均值提升至92.4%,提升幅度达到50.86%。由此说明应用对象利用该文系统为用户推荐感兴趣的音乐,能够显著提升应用对象的市场占有率,即该文系统推荐结果可令用户满意,具有较好的实际应用效果。

图5 市场占有率分析

3 结论

该文设计基于用户兴趣偏好度的音乐智能推荐系统,基于用户数据与音乐数据,确定用户对目标音乐类型的兴趣偏好度,基于兴趣偏好度采用协同过滤推荐算法将用户感兴趣的音乐推荐给用户。应用测试结果说明该文系统能够准确向用户推荐感兴趣的音乐,提升应用对象的市场占有率。

猜你喜欢

基础模块音乐
28通道收发处理模块设计
“不等式”基础巩固
“选修3—3”模块的复习备考
“整式”基础巩固
“防”“治”并举 筑牢基础
音乐
“五抓五促”夯基础
集成水空中冷器的进气模块
音乐
秋夜的音乐