APP下载

对网络视频影评推荐方式的探讨

2018-03-11焦沫青

科技资讯 2018年35期
关键词:网络视频探讨

焦沫青

摘 要:现如今,随着网络技术的高速发展和网络技术的广泛普及,互联网已经成为大众生活中不可缺少的一部分。然而越来越多的网络用户正面临着一个问题,即当使用网络时,大量的网络信息同时展现在用户面前,用户无法第一时间找到需要的信息:淘宝网上有上千件同样的商品,Netfix上有数万部影片,用户何以快速得其所需?就此问题本文展开探讨。

关键词:网络视频 影评 推荐方式 探讨

中图分类号:J905 文献标识码:A 文章编号:1672-3791(2018)12(b)-000-02

1 诸论

1.1 研究背景

基于互联网进行的信息推荐技术,正是解决以上这些难题的有效手段。它有利于用户从因特网这个信息海洋中寻找所需的信息资源,并推荐其所需要的服务,同时也能够让商家获得用户对其产品的反馈信息,比如阿里巴巴公司的淘宝网、国外购物网站Amazon、视频网站Youtube等。用户将基于推荐系统接受这些建议并给予反馈,这些反馈可以存储在推荐数据库中,并在未来的交互中生成新的建议。

在电影网站中很多用户在看完电影后都会发表相应的评论和评分,在被应用于推荐系统方面时,用户的电影评论非常有价值,这些评论信息直接反映了用户对某个电影的喜好程度。当用户浏览网站寻找电影时,网站可以利用這些信息推荐给目标用户可能感兴趣的一些电影,提高了用户体验,帮助用户在最短的时间内找到自己喜欢的电影欣赏。

然而如今视频网站中,大部分采用的仍是以标签为主的推荐系统,仅有少数视频网站尝试过以用户评论为基础的推荐系统,使用过此种推荐系统的网站收到了不错的用户反馈,如国外知名的视频网站Youtube与全球有名的在线影片租赁商Netfli。在非视频网站中,知名电商Amazon和国内的每日头条等使用评论推荐系统。目前在结合评论挖掘的推荐方面,Adomavicius等通过深入研究各种推荐算法,指出推荐系统在应用评论挖掘的方面还有待发展。针对目前推荐系统中结合电影评论研究相对缺乏的情况,本文希望对如今互联网环境下以用户评论为基础的推荐系统的使用现况,优点和发展前景进行调查研究。

1.2 本文主要目的

探究如今互联网环境下基于用户评论的推荐系统的应用情况,调查此种推荐系统与其他推荐系统相比有何优缺点之处,分析基于用户评论的推荐系统未来发展前景。

1.3 本文结构

本文的内容安排如下。

第一章介绍了本文的研究和实践背景,基本阐明了意见挖掘和推荐系统的结合在当今互联网时代下的意义以及本文对基于用户评论的推荐系统进行研究的原因。

第二章描述了对基于用户评论的推荐系统在当今时代下的使用现状。

第三章利用评论推荐系统对随机选定的影片进行了过滤,并用影视网站原有的标签推荐系统进行过滤,通过对两种推荐系统过滤出的影片进行阅览,比较出评论推荐系统的优缺点。

第四章综合二、三章对用户评论推荐系统进行了综合分析,分析了基于用户评论的推荐系统的发展前景。

2 对基于用户评论的推荐系统使用现状的调查

本章的第一部分是对基于用户评论的推荐系统(以下简称“评论推荐系统”)使用现状的调查。

2.1 使用评论推荐系统的视频网站

目前全球主流视频网站中,Youtube在其混合推荐系统中加入了评论推荐系统。Youtube巨大的用户量所提供的用户评论为评论推荐系统提供了可能。

2.2 非视频网站上对于评论推荐系统的应用

除视频网站外,其他类型的大众用户型网站也对评论推荐系统有应用,例如猫途鹰,其基于大量用户评论的推荐系统已经成为其网站招牌。

除以上网站外,还有其他使用评论推荐系统的网站,在此就不再一一论述。从以上的网站来看,评论推荐系统已经被部分网站所使用,但在视频网站上使用相对较少,而在非视频网站的应用则相对广泛。

3 评论推荐系统的优缺点调查

为了实际调查评论推荐系统的优缺点及视频网站用户对评论推荐系统的满意度,本章利用作者设计的评论推荐系统进行调查。

3.1 数据准备及预处理

本文的数据来自豆瓣电影网页信息,对豆瓣电影网页信息抓取的基本思路是:首先得到网页中电影的基本信息,包括电影名、评分、导演、演员、类型;其次再抓取整个电影的所有用户评论,将所有元素保存在一份文件中。

本文选择了豆瓣电影网上对电影《大侦探福尔摩斯》的影评,使用网络信息搜集软件八爪鱼进行用户评论采集,并提取用户评论中的关键词进行过滤,经过分词并将出现次数最多的关键词与豆瓣网站其他电影评论进行逆向比较,选择出与《大侦探福尔摩斯》影评最相近的3部电影。

3.1.1 影评数据采集

选定随机目标,本文此次选择豆瓣网对电影《大侦探福尔摩斯》的影评进行采集过滤。利用网络信息采集软件对影评进行采集。本文此次选择“八爪鱼采集器”软件。

3.1.2 影评元素预处理

将前面抓取到的所有电影的评论,进行分词,本文采用的是结巴分词。分词后词表有很多无用词,采用哈工大中文停用词表,在此基础上人工加入一些涉及到电影评论领域的停用词,进行了去除停用词的处理。(1)排除停用词来减小词表文件的大小。观察统计好的词表发现,里面有很多词作为评价词没有价值,并且出现的次数很少,因此做了排除低频词的处理。(2)经过这三步预处理工作,电影的全部信息预处理完毕。如此,提取出5个高频词。

提取的5个高频词为:福尔摩斯、侦探、英、美、基,计算出高频词在总评论有效词语中出现的百分比并记录。将提取出的关键词与豆瓣其他电影的影评关键词进行对比,得出符合次数最多的两部电影:《大侦探福尔摩斯2》《福尔摩斯归来记》。同时记录下上文5个关键词在以上3部电影中有效词语的百分比。

3.2 利用标签系统提取视频

利用豆瓣电影网所使用的标签推荐系统进行视频筛选。

对于《大侦探福尔摩斯》,豆瓣标签为“动作/悬疑/惊悚/犯罪/冒险美国/德国”等。利用类型标签进行筛选,运用如上方法,随机选测其他两部电影《罗马假日》《复仇者联盟》。

3.3 评价指标

本文选择对关键词所占所有词语百分比高低作为评价指标,若关键词百分比符合度相似则证明筛选准确。

3.4 实验结果分析

總有效词取2458个,从百分比综合可以看出,评论推荐结果百分比更高,更加精确。其余两部电影均得出相似结论,如表1所示。

4 评论推荐系统的综合分析以及前景预测

4.1 评论推荐系统的综合分析

综上所述,评论推荐系统相较于标签推荐系统,因其直观的反映出了用户的感受,所以推荐更具准确性。但正如第三章中所演示的操作一样,评论推荐系统需要通过采集用户评论—提取评论关键词—视频评论关键词比对—筛选比对结果—反馈给用户这样一个相对漫长且复杂的过程,而标签推荐系统仅需将标签相同的对象反馈给用户即可,相对简略。因此在主旨为向用户提供视频,而仅仅将推荐系统作为一种附属系统的视频网站中,评论推荐系统并未像标签推荐系统一样的到广泛的应用。相反,在以向用户推荐为主的旅游网站中,准确度高的评论推荐系统得到了广泛运用。

4.2 评论推荐系统的前景预测

由现在的网络环境以及网络技术来看,评论推荐系统未在视频网站上的到广泛运用的原因是其复杂的操作程序,较大的操作量难以吸引视频网站对这种推荐方式进行开发研究,仅仅是具有代表性的Youtube对这种推荐方式进行了开发。在未来,随着硬件技术和网络技术的发展,提取—过滤—反馈的过程会变得更加快捷简单,评论推荐系统也会逐渐被各大视频网站所采用。而在以推荐为主的旅游等服务型网站上,高准确性的评论推荐系统会继续发展下去。

参考文献

[1] 周良,王璇.视频网站运营中用户评论的作用及实证分析[J].中国流通经济,2015,29(2):90-97.

[2] 李佳.基于意见挖掘与深度学习的推荐算法研究[D].吉林大学,2018.

[3] 扈中凯,郑小林,吴亚峰,等.基于用户评论挖掘的产品推荐算法[J].浙江大学学报:工学版,2013,47(8):1475-1485.

猜你喜欢

网络视频探讨
爱奇艺竞争战略研究
网络视频节目的特点及优势简析
网络视频的著作权侵权分析
环境科学专业《环境生态学》课程教学改革探讨
刍议小学足球教学的训练教学方法
体育旅游产业的特征及发展策略探讨
税收筹划的效应问题
网红形成与papi酱现象的社会成因
探析网络视频的产业化发展
网络视频行业的发展策略探析