APP下载

基于评级和文本度量在线评论有用性研究

2020-08-03吕心怡

价值工程 2020年21期
关键词:在线评论指标体系

吕心怡

摘要:文章通过建立评论有用性指标体系,评级指标体系模型,以及回归模型对数据进行分析,建立一种在大数据分析下评价客户对产品评论质量的评级体系。商家通过建立的评价体系,能从客户的评论中得到有帮助的信息,以便更好的在网络市场上销售产品。

Abstract: The article analyzes the data by establishing a review usefulness index system, a rating index system model, and a regression model, and establishes a rating system that evaluates the quality of customer reviews of products under big data analysis. Through the established evaluation system, merchants can get helpful information from customer reviews in order to better sell products in the online market.

关键词:在线评论;有用性;指标体系

Key words: online reviews;usefulness;index system

中图分类号:F724.6                                       文献标识码:A                                  文章编号:1006-4311(2020)21-0215-02

0  引言

在创建在线市场以来,网上购物越来越普遍。网络口碑平台为客户提供了对产品进行评分和评价的机会。因此,商家可以根据客户对产品评价所得到的数据,深入了解其参与的市场,参与的时间以及产品设计功能选择的潜在成功,制定产品的销售策略,以便能更好的把握网络市场的需求。

本文通过建立评级指标体系模型和评论指标体系模型,可以在产品出售后得知产品的优缺点。对于评论与星级之间的关系和评论特定质量描述符与评论水平之间的关系,建立回归模型,从中了解它们之间的联系。

1  理论模型

对于评价的度量,本文主要通过星级来评判。通过对星级的分析,可以利用满意星级指标来度量评价标准。通过客户对产品的评定的星级数据,可以知道客户对产品的满意程度,其中,星级越高,说明产品越受客户欢迎。

对于评论的度量,根据Liu等所作的工作,发现产品设计师更青睐包含更多有用信息的评论[1]。因此,提取影响评论的特征指标,建立评论有用性指标体系。

1.1 评论的语言特征

对于评论的语言特征,本文通过对评论文本的分析了解到:产品的优缺点包含在评论的字数N,句子数L,平均句子长度L′中。同时客户会将自己对产品的喜爱程度用形容词数ADJ.和副词数ADV.来描述。

1.2 评论的元数据特征

在线评论中,元数据包括有用的投票数和评论有用度?茁。

1.3 評论人的特征

根据相关文献[2],评论人的等级对评论有用性有正向的影响。对于评论人的特征,本文使用评论人等级描述评论人的特征。评论人的等级是基于客户是否为Amazon Vine Voices,即Amazon邀请那些在Amazon社区中撰写准确而有见地的评论的客户。一般来说,能够成为Amazon Vine Voices意味着客户对产品的评论是比较准确、有见地。

2  数据处理

2.1 数据预处理

数据来源于阳光公司的三种产品在亚马逊平台上的顾客评论信息。在建立模型前,需要数据预处理。在数据集中发现没有购买产品的客户也对产品做出了评论,这些评论显然不能作为研究的数据。因此,将没有购买产品却对产品做出评论的客户信息进行剔除,剩下的评论都是购买了产品的客户。

2.2 评论的度量参数

2.2.1 评论有用度

由于有用的投票数据和总共的投票数据不一致,得出初步结论:对于一条评论,并不是对所有客户有用。通过查阅文献,可以得到有用的投票数或有用的投票数占总投票数的比例作为衡量指标[3][4]。因此,建立评论有用度?茁,即有用的投票数H与总共的投票数V的比值。

根据张镇平等人所作的工作[5],得知:评论的质量与评论的字数、句子数、平均句子数、形容词和副词数,以及评论的主观和客观的句子数、产品数等有关。因此,可以根据这些变量将评论的文本量化处理,得到评论质量的度量指标。

2.2.2 评论的字数和句子数

利用EXCEL筛选功能筛选出每条评论的字数和句子数,通过计算得到客户对三种产品评论的总字数和平均字数,总句子数和平均句子数。

2.2.3 评论的平均句子长度

根据相关文献[6],句子平均长度可以作为衡量评论可读性的指标,评论的平均句子越长,可读性越低。因此,为了更加客观的描述,本文将评论的字数和句子数进行综合,定义了一个新的变量:平均句子长度L′,即评论的字数N与评论的句子数L的比值。

2.2.4 评论的形容词数和副词数

根据相关文献可从情感词、程度词、否定词、标点符号、修辞等方面来分析句子的情感和特征[7]。因此,本文使用形容词和副词表达评论中句子的特有情感。

2.2.5 满意星级

因为客户在购买产品后,会根据自己的看法来评定产品的星级,以此来表现自己对产品的满意度。星级越高说明客户对产品越满意,相应的评论也就将会出现满意的词。因此,从星级评定的角度来分析客户的评论质量。

3  数据分析与结果

3.1 描述性统计

利用MATLAB编程软件求解数据,得到吹风机有用性指标的描述性统计结果如表1。微波炉和奶嘴的有用性指标的描述性统计结果可按同理进行计算。

3.2 参数估计与分析

为了确定参数的可靠性,可以把参数数据带入模型中,对吹风机进行参数估计,结果如表2。微波炉和奶嘴的参数估计分析可按同理进行分析。

根据吹风机参数估计的结果,得到:吹风机各参数的样本均值近似等于总体均值,样本标准差近似等于总体标准差。这个结果说明样本均值和标准差是总体均值、标准差的一致无偏估计。

4  总结

本文建立评级指标体系模型和评论指标体系模型。对于评级指标体系模型,得到星级评分和评论的正能量性作为评级度量标准。对于评论有用性指标体系模型,得到了评论有用性指标体系和体系的模式图,以此作为评论的评价度量标准。

为了确定最能表明潜在成功的基于文本的度量和基于评级的度量的组合,建立回归模型表示它们之间的在组合关系。

参考文献:

[1]Liu, Y., et al. Identifying helpful online reviews: A product designe's perspective[J]. Computer-Aided Design, 2013, 45(2): 180-194.

[2]廖成林,蔡春江,李忆.电子商务中在线评论有用性影响因素实证研究[J].软科学,2013,27(05):46-50.

[3]Kim, S. M., et al. (2006). Automatically assessing review helpfulness. Proceedings of the 2006 Conference on Empirical Methods in Natural Language Processing.

[4]Korfiatis, N., et al. (2008). The Impact of Readability on the Helpfulness of Online Product Reviews: A Case Study on an Online Bookstore, Springer Berlin Heidelberg.

[5]張镇平.基于商家维度的在线评论研究[D].北京邮电大学,2016.

[6]殷国鹏.消费者认为怎样的在线评论更有用?——社会性因素的影响效应[J].管理世界,2012(12):115-124.

[7]史伟,王洪伟,何绍义.基于语义的中文在线评论情感分析[J].情报学报,2013,32(08):860-867.

猜你喜欢

在线评论指标体系
浅谈公路统计指标体系的构建
层次分析法在生态系统健康评价指标体系中的应用
供给侧改革指标体系初探
在线评论情感属性的动态变化
城镇排水系统量化指标体系研究
消费者个体行为偏好对在线评论真实性的影响机理研究
测土配方施肥指标体系建立中‘3414
土地评价指标体系研究