APP下载

关于智媒平台网络水军对青少年影响的研究

2022-07-01鲍磊曾子济闫瑾

江苏广播电视报·新教育 2022年14期
关键词:聚类分析

鲍磊 曾子济 闫瑾

摘要:哔哩哔哩(以下简称B站)作为近几年快速发展的视频网站,吸引了大量的年轻人将时间与精力投入其中,使其用户年轻人居多,B站用户平均年龄在21岁左右。以对B站的热门视频的评论进行分析,探究青少年使用智慧媒体的情况及智慧媒体对青少年的影响。通过爬虫爬取B站的热门视频的评论作为数据集,对这些数据处理通过聚类分析和神经网络处理得出结论。现阶段网络智慧媒体平台的评论区存在明显的网络水军行为,这些网络水军行为极易诱导青少年的情绪和思考方式,这种影响可能比学校和家庭对青少年的影响更加严重。因此,在青少年教育中如何避免网络水军对青少年产生不良影响需要政府,教育工作者和网络智慧媒体平台共同使用技政策和教育手段来遏制网络水军对青少年产生不良影响。

关键词:聚类分析;智慧媒体;青少年行为;网络水军

1绪论

本研究的目的在于使用神经网络和机器学习的方法探索和发现青少年在使用智慧媒体时的行为模式,为研究青少年受智媒影响的行为模型的建立和定量分析智媒对青少年行为影响的数据建模与算法提供基础。

本研究的意义在于通过使用聚类分析和神经网络的方法研究智媒中与青少年相关内容的产生机制和传播方式以及青少年受智媒影响的行为模型,从中发掘出对青少年教育。

2研究过程

2.1数据收集

本文研究所采用的评论数据使用的是B站排名前一百的热门视频评论,由于B站的活跃用户平均年龄在23岁左右;因此,B站热门视频的很大程度上反映了年轻人的行为模式,故选择其排名前一百的热门视频评论作为研究数据。

2.2数据预处理

将收集到的评论进行分词,然后根据每个评论的分词结果计算每个词的词向量,并将每个评论里每个词的词向量进行加和为每个评论的特征向量进行后续的数据分析。

2.3数据分析

将处理过评论根据其特征向量进行聚类分析。本研究使用的是K-means聚类分析,本次研究采用同时评估手肘法和轮廓系数这两种指标来确定最佳k值。

手肘法评估k值是否合适的标准为SSE,评估方法为,当k值小于最佳聚类数时,SSE的下降幅度会很大,而当k值到达最佳聚类数时,SSE的下降幅度会减小,然后随着k值的继续增大而趋于平缓。将本研究的数据进行K-means聚类分析并输出SSE值后,根据手肘法评估最佳k值应为3。

轮廓系数法:使用轮廓系数来确定,选择使系数较大所对应的k值。公式:

其中,a表示质心与同一簇中其他点的相似度;b表示样本点与下一个最近簇中其他点的相似度。将数据进行K-means聚类分析并计算输出轮廓系数后,根据轮廓系数评估最佳k值应为2。

根据上述的评估结果,会发现手肘法计算和根据轮廓系数计算出的k值不一样,可能是b和a都很大的情况下b相对a大的更多,从而导致SSE较大,所以,综合评估轮廓系数得到的k值和手肘法得到的k值,最终确定最优k值为3,将样本分为3类。

3结果分析

根据上述数据分析可以将所获取的约18万条评论分为3大类。其中第一类占比最多约为51.65%,第二类占比约为31.13%,第三类占比约为17.22%,同时使用神经网络对评论进行情感倾向判断,其中33.65%的评论情感倾向为积极,41.13%的评论情感倾向为中立,25.22%的评论情感倾向为消极。

第一类评论(图3.1)中42.98%的评论情感倾向为积极,25.65%的评论情感倾向为中立,31.36%的评论情感倾向为消极,带有情感倾向的评论占比明显高于未分类的占比,因此,对“积极”和“消极”的评论所属的用户名进行聚类分析,发现“积极”和“消极”的评论其所属的用户名格式存在大量雷同现象,约占第一类评论中带有情感倾向的评论的32.15%,如:一串字母+数字,xx+在+地区名和一串随机字母等组合,因此可以判断存在水军刷评论的可能性;然后对“中立”的评论的用户名进行上述聚类分析,发现其中用户名格式雷同的数量约占其总体的5.45%,存在水军刷评论诱导舆论的可能性较小。

第二类评论(图3.2)中25.86%的评论情感倾向为积极,54.87%的评论情感倾向为中立,19.27%的评论情感倾向为消极,第二类评论中的情感倾向占比较弱,无情感倾向的评论增加;对第二类评论中“积极”和“消极”的评论所属用户名和“中立”的评论所属用户名分别进行聚类分析,结果为“积极”和“消极”的评论所属用户名中用户名雷同的情况约占其总体的12.78%;“中立”的评论所属用户名中用户名雷同的情况约占其总体的2.63%,因此可以判断水军刷评论的可能性较小。

第三类评论(图3.3)中19.74%的评论情感倾向为积极,62.72%的评论情感倾向为中立,17.54%的评论情感倾向为消极,由此可知第三类评论中评论情感倾向积极和消极的占比大幅度低于未分类时的占比。使用聚类算法对第三类评论中“积极”和“消极”的评论所属用户名和“中立”的评论所属用户名分别进行分析,结果为“积极”和“消极”的评论所属用户名中用户名雷同的情况约占其总体的5.28%;“中立”的评论所属用户名中用户名雷同的情况约占其总体的0.86%,因此可以判断水军刷评论的可能性很小。

4结论

根据上述分析结果可知,b站绝大多数评论多带有较重的情感因素,与此同时,在有明顯情感倾向的评论中容易混杂网络水军发言,网络水军通过众多的小号可以大量发表明显情感倾向的评论煽动他人。青少年的三观正处于成型的关键阶段,且更加频繁的接触网络,容易受到他人在网络上发言的影响,因此网络水军对青少年的影响也更加显著,青少年也容易在自己不知情的情况下情绪被诱导,从而忽视了自己想法,为网络水军所造成的事态推波助澜。

综上所述,现阶段网络智慧媒体平台(如:B站)的评论区存在明显的网络水军行为,由于B站等智慧媒体平台的用户平均年龄较为年轻,且青少年更容易受到网络上的言论影响,这种影响可能比学校和家庭对青少年的影响更加严重;因此,在青少年教育中如何避免网络水军对青少年产生不良影响需要政府,教育工作者和网络智慧媒体平台共同使用技术,政策和教育手段来遏制网络水军对青少年产生不良影响。

本论文为国家社会科学基金项目《数据赋能的智慧媒体对青少年行为模式变化影响的研究》(项目编号:19BXW120)支持的阶段性研究成果。

参考文献:

[1]田海燕.智慧媒体对青少年价值观影响探析[J].传播力研究,2020,4(11):171-172.

[2]杜建民.智媒时代青少年传统文化阅读推广策略[J].中国出版,2018(14):29-31.

[3]王柳涵.基于内容分析法的科普视频内容与弹幕解读——以B站“罗翔说刑法”系列视频为例[J].新闻研究导刊,2022,13(08):82-84.

[4]何苑,张洪忠,苏世兰.基于算法推动的文化传播“破圈”机制研究——以B站“法国音乐剧”的传播为例[J].福建师范大学学报(哲学社会科学版),2022(03):113-126+172.

[5]孙强.基于Word2Vec词向量维度媒体与公众潜在语义的网络议程设置研究[J].长江师范学院学报,2021,37(05):56-63.DOI:10.19933/j.cnki.ISSN1674-3652.2021.05.007.

猜你喜欢

聚类分析
基于谱聚类算法的音频聚类研究
基于Weka的江苏13个地级市温度聚类分析
我国中部地区农村居民消费行为阶段特征分析
基于聚类分析的无须人工干预的中文碎纸片自动拼接
浅析聚类分析在郫县烟草卷烟营销方面的应用
农村居民家庭人均生活消费支出分析
基于省会城市经济发展程度的实证分析
基于聚类分析的互联网广告投放研究
“县级供电企业生产经营统计一套”表辅助决策模式研究