APP下载

网络视频中的影视评论分析技术研究

2018-01-12浦晓亮

戏剧之家 2017年23期
关键词:网络视频信息采集数据处理

浦晓亮

【摘 要】随着目前我国社会经济的快速发展,人们物质生活在得到极大满足的同时,对于精神生活的需求也愈发凸显。基于这一现状,近年来国内的影视市场得到了极大繁荣,尤其是受到互联网技术的发展影响,影视作品也呈现出了许多新的特征。对此,就针对网络视频中的影视评论分析技术展开相关的研究工作意义重大。本文简要介绍了影视评论的基本概念,从信息采集、数据预处理、评论分析等三个方面对网络视频中的影视评论分析技术展开了具体探讨。

【关键词】网络视频;影视评论;信息采集;数据处理

中图分类号:G2 文献标志码:A 文章编号:1007-0125(2017)23-0067-01

随着当前互联网信息技术的快速发展,各种专业化的影视网站也有了长足的发展与进步,这些网站在为网民提供相关影视节目信息查询工作的同时,也为广大用户提供了对影视节目进行评论的平台。对此,有关影视节目的评论内容近年来呈现出了指数级的增长趋势,对于影视节目的评论已经从专业的影评人员扩展到了广大的网民群体。针对网络环境中的影视节目评论内容进行搜集、分析,能够对影视节目的制作、发行,以及宣传等工作提供重要的促进、推动作用。因此,影视节目评论分析现已成为互联网评论分析研究的一个重要领域。

一、概述

评论即为评论者针对某项话题发表带有鲜明个人情感色彩的观点表达,评论的构成主要包括了话题、创作者、观点与情感等要素。评论的对象通常也就是所评论的话题,亦可将其称作影视作品的某一项特征。以电影评論为例,其通常评论的特征主要就有电影作品当中所涉及到的各项元素以及相关的演职人员。电影构成元素则包括了剧本、台词、布景、摄影、音乐等内容,所牵涉到的工作人员则有编剧、演员、导演、制片人等。做出评论分析内容即为主动发现评论内所牵涉到的相关评论对象,以及评论人员做出的具有明显倾向性与代表性的观点表达。

二、信息采集

应用人工维护方式针对影视节目信息开展持续性的追踪及维护工作,往往有着较大的工作量。对于目前在互联网上已经公布出的共享性数字资源信息,针对影视节目基础性信息内容开展自主化采集与选取,是促成影视节目库建设的重要方式之一。

对于影视节目数据信息库的建设,常规的做法是利用当前的互联网视频网站采集系统,这一系统可以促成对各主要视频网站信息的采集和数据调取,利用技术化手段改造处理后,完成对于相关影视节目信息的搜集工作。当前的主流视频网站采集系统所获取的目标对象基本都是以视频形式为主,其中重点包括视频内容的标题、发布人员、发布时间以及相关的描述性信息等有关内容。影视节目信息系统所需采集的数据内容即相应的影视节目信息,其中主要有影视节目名称、演员、导演、播放量、每集时间等相关信息内容。

三、数据预处理

这项技术内容主要是对所采集的影视节目信息进行统一化的标准文本处理,其整体系统设计处理最终所要达到的目标对象即简体中文评论信息,而要实现这一目标需要把搜集到的相关评论信息进行文字形式与分词等文本转换处理。因为一些评论内容存在着繁简字的映射关系,要想实现完全转换过程较为复杂,在具体实施的过程当中,可先将繁体字处理成简单的单个汉字予以映射,便能够满足要求。

在分词处理时,则可选用ICTCLAS软件进行处理。当前所采用的分词系统较难达到对影视节目名称等相关专有名词的自动化检出,但是分词的精准性又会对最终的信息应用产生较大的影响。对此,可将在信息采集过程当中所搜集到的演员或是导演等相关专有名称词汇加入到附加词典内,由此系统便可仅选取专有名词作为选取特征要素,将形容词作为情感词,在进行影视评论信息搜集时,仅需提取相关的名词与形容词来展开处理。

四、评论分析

由词汇特征出发所创建出的影视节目评论分析系统,应当要先确定评论内所包括的特征词汇,即所评论的目标对象。因在数据预处理环节新加入了演员与导演名称等相关专有名词,此时再进行分词之时,所得到的结果便可直接发现影视评论内容中的有关专业词汇,相关的词汇也便能够充当评论的候选特征要素。

此外,因汉语言分词系统在针对评论文本开展分词处理之时,会把没有包含在词典内的命名实体或是词组分隔开来,这样以来,将会导致只依靠分词系统所获得的名词无法对评论特征做出精准描述。对此,可采取基于频繁项挖掘的特征提取手段来解决以上问题。

基于给定的窗口范围当中和名词共现程度超过特定阈值的字符串作为候选抽取特征,这一方法不但可以将具有频繁性特征的评论抽取出来,而且还可以有效弥补因为分词系统把复杂特征分隔为多项专业词汇导致的特征抽取错误情形。

总而言之,在本次研究中,基于网络视频当中的影视评论分析技术展开了相关的探究工作,基于自动网页抓取技术以及模板之上的信息抽取技术,建立起影视资源信息库,同时利用网络技术来主动抓取相关的评论内容。然后再通过之前所创建的影视专业词汇与汉语言分词技术,对评论内容实施分词处理,借助于频繁项分析方法,主动探究影视评论中的频繁特征,作为备选标准,进一步综合具有典型性的感情词汇,获取到影视作品中不同特征的情感倾向分析结果。

参考文献:

[1]卢娟.网络影视评论的现状及生态构建[J].电影文学,2017,(14).

[2]张亚伟.试论新时代下影视评论的现状与建构[J].剑南文学,2013,(10).

[3]吴飞.网络影视评论功能研究[J].科学咨询,2015,(41).

[4]赵悦婧.略谈网络影视评论的传播与分化[J].中国科技投资,2017,(4).

猜你喜欢

网络视频信息采集数据处理
认知诊断缺失数据处理方法的比较:零替换、多重插补与极大似然估计法*
ILWT-EEMD数据处理的ELM滚动轴承故障诊断
如何提高卷烟零售市场信息采集的有效性
网络视频节目的特点及优势简析
网红形成与papi酱现象的社会成因
基于希尔伯特- 黄变换的去噪法在外测数据处理中的应用
基于POS AV610与PPP的车辆导航数据处理