APP下载

视频网站推荐系统研究

2019-09-10刘焱昕

现代信息科技 2019年3期
关键词:视频网站用户行为推荐系统

摘 要:如今推荐系统在很多领域都有着较好的应用,例如购物网站、新闻网站、检索网站和音乐视频网站等。尤其是视频网站,推荐系统各式各样,不同的视频网站都使用特定的推荐系统向用户进行个性化推荐,不同的推荐系统所实现的推荐效果也是不同的,每个推荐系统都有各自的优点和缺点。本文对近几年视频推荐系统的研究进行综述,介绍常用的推荐算法,并结合在实际中使用视频网站的体验,针对具体的视频网站指出其存在的问题并提出改进建议。

关键词:推荐系统;视频网站;用户行为

中图分类号:TP391.41 文献标识码:A 文章编号:2096-4706(2019)03-0018-03

Video Website Recommendation System Research

LIU Yanxin

(Shanxi University of Finance and Economics,Taiyuan 030006,China)

Abstract:Today’s recommendation system has good applications in many areas,such as shopping websites,news websites,search websites and music video websites. Particular in video websites have various recommendation systems. Different video websites use specific recommendation systems to personalize recommendations to users. Different recommendation systems implement different recommendation effects. Each recommendation system has its own advantages and diSadvantages. This paper summarizes the research of video recommendation system in recent years,introduces the commonly used recommendation algorithm,and combines the experience of using video website in practice,points out the existing problems and proposes improvement suggestions for specific video websites.

Keywords:recommended system;video website;user behavior

1 研究背景和意義

网络信息技术的发展,使得信息逐渐过载,在过载的信息中,视频信息由于其自身特性,更加引人注目,由此出现了形式多变的视频网站。视频网站上过多的视频信息导致人们很难从海量的视频信息中得到自己想要获取的视频信息,但是人们对视频信息的需求又十分迫切,推荐系统较好地解决了视频信息过载的问题。视频网站使用推荐系统向用户进行个性化视频推荐,通过对用户的观看记录等信息进行分析,把用户可能感兴趣的视频推荐给用户,大大提升了用户的使用体验。作为视频网站,采取较好的视频推荐系统,有效地向用户推荐其感兴趣的视频,才会吸引更多的用户访问,并且节省费用,所以对视频推荐系统进行研究是十分必要的。本文对视频推荐系统的算法和应用研究进行分析,并针对哔哩哔哩视频网站提出在推荐视频时存在的问题和改进建议。

2 视频推荐算法

推荐算法是推荐系统中最为重要的部分,本文从采用单个算法推荐和采用混合算法推荐两个角度进行分析。

2.1 采用单个算法推荐

基于内容的推荐算法一般是通过对目标用户的历史行为进行统计,而行为又分为显示反馈、隐式反馈,用户观看完视频后对视频所打的分就是对视频的显式反馈数据,而用户观看了视频但是没有进行打分的这些视频就是隐式反馈数据。根据与目标用户有过交互的视频得到用户的偏好,然后基于用户行为计算其他视频的相似程度,将最相似的视频推荐给用户。匡俊[1]等针对点击率预测准确性较差的情形将特征工程和机器学习结合,提高了视频点击率预测算法的准确率。对视频进行特征提取,有效地避免了冷启动的问题,但是特征的提取可能会比较困难。

基于协同过滤算法是Goldberg[2]等人提出的,在实际生活中最为常用的一种推荐算法。算法通过找寻与目标用户相似的用户进而推荐视频,文献[3]中将协同过滤方法分成两类,基于近邻和基于模型,基于近邻是直接使用收集到的数据进行相似性判断,基于模型则是对具体用户构建偏好模型然后进行推荐。在传统的协同过滤算法的基础上,李珊珊[4]对相似度计算进行了改进,有效地避免了热门视频对推荐结果的影响;苏梦珂[5]等综合考虑用户的行为一致性和信息熵两个指标对数据进行评价,减少了因为数据质量问题导致推荐结果出现偏差的可能性。协同过滤推荐算法使用较为简单,效果较好,适用于特征提取较为困难的数据,例如视频数据,但是可能会因为用户的数据较少而遇到冷启动问题。

深度学习是输入目标用户和视频的相关数据,使用深度学习模型,得到给目标用户的视频推荐。高睿[6]提出了两种基于深度神经网络的视频个性化推荐算法,分别为基于深度语义模型和基于概率语言模型的推荐算法,提升了推荐效果。李同欢等[7]提出了一种基于深度学习的多交互混合推荐模型,输入在深度学习模型的基础上得到的信息,使用多层交互的网络结构进行学习,最后聚合进行推荐。黄立威等[8]对基于深度学习的推荐系统的研究进行分析,提出了未来推荐算法的发展方向。

除了单纯考虑用户和视频之间的关联,也要考虑目标用户在做出某种行为时的具体场景,文献[9]将情境信息添加到传统的推荐中,使得推荐更加立体。

2.2 采用混合算法推荐

虽然每种推荐算法都有各自的优点,但是单独使用一种推荐算法又有一定的缺陷,所以一般将不同的推荐算法进行混合后再进行推荐,能够较好地避免各自的缺陷,提高整体推荐效果。比较常用的是将基于内容和基于协同过滤的两种算法结合,汤伟[10]提出了基于Web挖掘的个性化视频推荐系统,通过对用户的Web日志进行分析生成目标用户模型,针对稀疏数据使用PCA进行降维,并使用内容和协同过滤结合的算法进行推荐。文献[11]提出将传统的推荐算法改进为可以在分布式平台上使用的算法,使用Hadoop平台并结合其他工具来进行推荐。翁小兰等人[12]则针对在使用传统协同过滤算法进行推荐时遇到的数据稀疏、冷启动等问题,将协同过滤算法与大数据技术、社会网络等技术结合对算法进行改进研究。

3 视频推荐具体应用

视频推荐也有着很多的应用,国外用户使用较多的视频网站有YouTube、Netflix等,YouTube在全世界是被广泛使用的视频网站,每个用户都可以在网站上上传和观看视频,用户上传视频所标记的标签会影响用户对视频的关注程度,很多学者对视频标签进行了研究,Xu等人[13]提出了可以直接为用户上传的视频生成标签的EventDemo系统,保证了标签的准确性。夏冬晨[14]提出了一种方法,可以提高YouTube视频的关注度,使得视频可能被更多用户所观看,增加视频的点击率。Netflix[15]是世界最大的收费视频网站,从Netflix的发展历史来看,正是举办的Netflix Prize比赛,推动了视频推荐的发展,并且吸引了更多的人来研究推荐系统,网站本身也受益很多,早期比赛主要目标是预测用户对视频的评分,现在则是通过分析用户的观看行为,来为用户进行推荐。

在国内,用户普遍使用的是优酷、腾讯、爱奇艺、哔哩哔哩等视频网站,推荐视频采用的是召回+排序,因为视频数量大,全部排序会低效,所以先进行召回找到值得推荐的视频,然后再对已经筛选过的视频进行排序,将最优的视频推荐给目标用户。

4 具体视频网站推荐时存在的问题及相关建议

哔哩哔哩视频网站视频内容的独特性,吸引了很多的用户使用,但是在向用户推荐视频时可能会遇到以下问题。

4.1 视频标题、标签与内容不匹配

上传者上传视频时会给视频起标题,并添加标签,方便用户进行搜索,但是可能会出现标题、标签和视频的具体内容不匹配的情况,这会降低用户的观看体验。针对这个问题可以通过分析视频的具体内容,结合观看过该视频的用户的评价,对标题和标签进行适当的修改,提高其与视频的匹配度。

4.2 用户观看信息难以区分

用户对视频的操作不能简单的用“是否观看”“是否评价”等标准来评判,因为用户对视频的喜好程度是不同的。例如用户观看视频时是否有跳过、加速、手滑点错等行为都会影响观看视频的时长,用户的观看信息也是不同的。所以在特征提取的时候再进行细化,对用户的观看行为不能用一个标准来衡量,而是针对具体情形设置特征的取值。

4.3 评价信息没有价值

用户在手机上可以对视频进行点赞、差评等操作,但是在网页上却没有差评这个选项,这就导致用户对同一视频的评价产生差别。在收集用户对视频的评价时,不同等级的用户对视频的评价的重视程度应该有一定的差异。还有部分的恶意行为,例如某些用户不观看视频却对视频做出评价,或者该用户评价与其他用户评价差距较大,这种评价会对推荐的结果造成一定影响。视频网站可以结合用户的观看具体信息来判断用户的评价的价值。

5 结 论

本文通过对视频推荐算法进行分析,总结了常用的视频推荐算法,在此基础上,针对哔哩哔哩视频网站在推荐视频时存在的问题提出了改进的建议,希望能有一些借鉴价值。

参考文献:

[1] 匡俊,唐卫红,陈雷慧,等.基于特征工程的视频点击率预测算法 [J].華东师范大学学报(自然科学版),2018(3):77-87.

[2] David Goldberg,David Nichols,Brian M. Oki,et al. Using collaborative filtering to weave an information tapestry [J]. Communications of the ACM,1992,35(12):61-70.

[3] Deshpande M,KarypisG.Item-based top- N,recommendation algorithms [M].ACM,2004.

[4] 李姗姗.基于协同过滤的视频推荐系统设计 [D].南京:南京邮电大学,2017.

[5] 苏梦珂,杨煜普.基于信息熵和用户行为一致性的协同过滤分组推荐 [J/OL].计算机应用研究:1-6.http://kns.cnki.net/kcms/detail/51.1196.TP.20181009.1405.010.html,2018-10-26.

[6] 高睿.基于深度神经网络的视频个性化推荐系统研究 [D].深圳:深圳大学,2017.

[7] 李同欢,唐雁,刘冰.基于深度学习的多交互混合推荐模型 [J/OL].计算机工程与应用:1-9.http://kns.cnki.net/kcms/detail/11.2127.TP.20180913.0636.010.html,2018-10-26.

[8] 黄立威,江碧涛,吕守业,等.基于深度学习的推荐系统研究综述 [J].计算机学报,2018,41(7):1619-1647.

[9] Gediminas Adomavicius,Ramesh Sankaranarayanan,Shahana Sen,et al. Incorporating contextual information in recommender systems using a multidimensional approach [J]. ACM TranSactions on Information Systems,2005,23(1):103-145.

[10] 汤伟.基于Web挖掘的个性化视频推荐系统设计与实现 [J].电子设计工程,2018,26(18):102-106+112.

[11] 韩皎.基于分布式平台的个性化推荐算法研究 [D].西安:长安大学,2017.

[12] 翁小兰,王志坚.协同过滤推荐算法研究进展 [J].计算机工程与应用,2018,54(1):25-31.

[13] Xu H,Ye G,Li Y,et al. Large Video Event Ontology Browsing,Search and Tagging (EventNet Demo) [C]// ACM International Conference on Multimedia. ACM,2015:803-804.

[14] 夏冬晨.基于YouTube的视频社会关注度提高方法的研究 [D].杭州:杭州电子科技大学,2017.

[15] Netflix官网.https://lunhem.com/s.php?t=Netflix.

作者简介:刘焱昕(1995-),女,汉族,山西长治人,2016届计算机应用技术专业,硕士研究生,研究方向:数据挖掘。

猜你喜欢

视频网站用户行为推荐系统
电力高校图书馆转型智库服务的研究
基于用户偏好的信任网络随机游走推荐模型
社会化媒体用户使用动机与行为探析
基于个性化的协同过滤图书推荐算法研究
我国视频网站自制节目的发展浅析
个性化推荐系统关键算法探讨
从《拜托了,冰箱》看视频网站自制节目
浅谈Mahout在个性化推荐系统中的应用
基于用户行为分析的智能家居系统的研究与设计