APP下载

基于TextRank的用户感性需求挖掘研究*

2021-12-17王扶东刘曦冉孙增耀东华大学旭日工商管理学院

品牌研究 2021年22期
关键词:工学感性词典

文/王扶东 刘曦冉 孙增耀(东华大学旭日工商管理学院)

随着经济的飞速发展和人们生活水平的不断提高,用户不再只是单纯的重视基于功能特征的理性需求,而是逐渐更加在意基于使用体验的感性需求。因此对于企业而言,充分考虑用户对产品的情感诉求,深入挖掘用户的感性需求就变得至关重要。感性体现在当消费者面对产品时,会被产品的造型、颜色、触感等打动,引起心理和生理上的反应,在这个背景下,感性工学概念应运而生[1]。利用感性工学,可将人们这些模糊不明的感性需求及意象转化为产品的设计要素,在产品设计等领域得到广泛应用。

目前,挖掘用户感性需求的方法,主要有传统感性工学和结合在线评论的感性工学。在传统感性工学中,不少学者进行了将隐性的用户情感外化于显性的产品特征的研究。林晨晔利用语义差异法定量地研究了用户关于办公文具的色彩偏好[2]。王雪洁和肖旺群利用问卷调查法收集感性意向词汇和用户对不同工业机器人外形组合的评价[3]。田正清等将Kano模型与感性工学相结合,通过主成分分析结合多重线性回归探究了用户的感性需求与产品造型设计之间的关系[4]。王年文等人利用主成分分析等方法,对用户的感性需求偏好进行挖掘,并研究了用户感性情感与产品设计要素的映射关系[5,6]。这类研究积累了一批质量较优且高度领域化的感性情感词。然而,用户感性需求是多样且动态变化的,如果简单依据现有研究积累的领域词汇,结果可能会产生偏差。因此,部分学者考虑采用结合在线评论的感性工学方法,即以在线评论为数据源,进行用户感性需求的挖掘。Hsiao等利用词性标注和N元统计语言模型抽取感性情感词和产品特征词,分析两者关系,以协助跨境物流服务的改进[7]。贾丹萍等以产品评论为语料,利用深度学习的方法扩充生成领域用户感性情感词典和产品特征词表,并进行用户情感分析上的细化和量化[8]。Wang等利用WordNet词表生成了通用感性情感词典,并将之用于挖掘玩具产品评论中的用户需求[1]。刘征宏等通过构建RKE模型获得感性词汇,并结合用户需求感性值等匹配用户需求和设计方案[9]。李少波等以产品评论数据和产品参数数据作为语料,抽取用户感性词,同时,利用词聚类方法计算感性评价值并构建了映射模型[10]。

从以上的相关研究成果可以看出,目前相关学者已经在结合在线评论的感性工学研究中取得了一定的成果,但是在感性情感种子词的选取中,大多学者运用通用词典或者依赖于以往文献,较少学者考虑了从在线评论中挖掘感性情感种子词。

一、研究方法设计

本文的研究内容是借助感性工学的思想,通过在线评论挖掘产品标准的感性需求挖掘。利用LDA主题模型挖掘在线评论,确定基本产品特征词词典,利用依存句法分析提取在线评论中的关键意见,通过计算语义相似度将关键意见中的名词映射扩充,得到完备的产品特征词词典。采用TextRank方法提取每个产品特征的关键感性情感即感性情感种子词。最后为了更方便地描述感性需求,将产品特征与感性情感种子词结合得到标准感性需求描述。研究框架如图1所示。

图1 论文研究框架

(一)产品特征词提取

产品特征是用户感性情感的客体,本文采用LDA主题模型对评论文本进行主题挖掘,得到用户评论中所提及的主要产品特征。固有的属性体系可能会遗漏掉决策者需要的事物特征,LDA可以搜索出隐含的主题分布信息,适用于挖掘大量在线评论文本。本文通过LDA模型进行主题提取,确定文本与主题的分布以及文本与词语的分布,得到主题和词语分布,找出每个主题下概率较高的词语,通过计算一致性确定最优主题数量,将得到的每个主题定义为产品特征,每个主题下的概率较高的词语作为产品特征对应的产品特征词,构造基础的产品特征词词典。

然而,LDA提取的基础产品特征词词典并不能覆盖评论中所有的产品特征词,需要根据在线评论搜集未被基础产品特征词词典覆盖的产品特征词。感性情感词的表达总是针对某一产品特征的,因此在线评论一般是由产品特征和产品特征的感性情感词构成,并且在句法上存在特定的语法搭配关系,比如对某款手机评价 “这部手机外观好看”中“外观好看”构成主谓关系。因此本文利用依存句法分析每条在线评论中并输出词语的词性和语法关系,最后根据提取规则获得在线评论的关键意见,得到所有潜在的产品特征词及其对应的感性情感词。其次,利用word2vec算法计算所有关键意见中的潜在产品特征词分别,与每个基础产品特征词之间的余弦相似度,并根据语义阈值将语义相近的潜在特征词映射到对应的基本产品特征词词典中,扩充得到完备的产品特征词词典。

(二)基于TextRank算法获取感性情感词

用户关于某一产品的感性需求一般指用户对于产品特征的观点,会通过一系列感性情感词表达出来。感性情感词是用户感性需求的一部分,然而感性情感词的描述具有口语化、多样化、相似性强等特点,并且用户对于一个产品特征可能会产生多种类型的感性情感,因此本文对每个产品特征的关键评价意见进行关键感性情感词提取,能够快速提取在线评论种产品特征对应的关键感性情感,并得到感性情感词的标准化描述,为后续准确描述用户感性需求奠定基础。

在本研究中,在线评论量相对较大、领域较为集中,因此本研究采用无监督关键词提取算法进行感性种子词的提取。由于本研究涉及的在线评论普遍偏短、文档信息复杂,因此本文研究采用基于图的TextRank算法提取关键感性情感词[11],并通过人工筛选得出每个产品特征的感性情感种子词。TextRank算法公式为:

获取并筛选得到每个产品特征的感性情感种子词之后,将产品特征与其对应的感性情感种子词结合,得到最终的标准感性需求描述。

二、实例分析

(一)数据预处理

京东是中国最著名的电子商务平台之一,其数码产品门类丰富,因此本文选取京东电子商务平台中手机评论为研究对象,通过网络爬虫,获得38000余条用户在线评论,并对文本进行预处理,删除无效评论、字符小于10的评论等,最终得到34000余条在线评论。

(二)产品特征词词典构建

采用LDA主题模型进行训练,计算各个主题数下的一致性,得到效果最佳的主题数为7,人为归纳出手机的产品特征,然后通过依存句法分析对在线评论进行提取,得到每条在线评论中的关键意见,即名词形容词对。其中名词为潜在的产品特征词,对关键意见中的名词进行相似度计算,并设定语义阈值p=0.6,扩充得到产品特征词词典,如表1所示。

表1 产品特征词词典示例

(三)感性情感种子词提取

提取同一产品特征的关键意见,然后通过TextRank算法对每个产品特征的在线评论关键意见分析筛选得到感性情感种子词,将产品特征与其对应的感性情感种子词结合得到最终的标准感性需求描述,即:价格-便宜、电池-耐用、内存-流畅、功能-清晰、售后-快速、售后-耐心、外观-漂亮、外观-轻薄、网络-顺畅。

三、结论与展望

本文在感性工学的视角下提出一种挖掘用户感性需求的方法。该方法利用LDA主题模型获取基础产品特征词词典,并与word2vec算法相结合,扩充得到产品特征词词典,利用TextRank算法获取每个产品特征的感性情感种子词,以实现用户感性需求的标准化描述。最后本文通过实例分析验证了模型的可行性。从理论上看,本文提出了一种获取标准感性需求的方法,这能够帮助产品设计者更有针对性地进行产品优化,并辅助企业制定更为合理的营销策略,真正实现以用户为中心的产品设计与服务。

然而,本文也存在一定局限。本文侧重于前期评论者意见的表达,可以进一步考虑引入kano模型识别感性需求的类型,因为每个需求的类型不同,他们的重要度也各不相同,需求类型决定他们的改进迫切程度,以此形成更为全面准确的用户感性需求方案。

猜你喜欢

工学感性词典
盐工学人
——宋辉
面向用户感性意象的纵列双旋翼无人机造型研究与设计
理性的反面不是感性
理性的反面不是感性
米兰·昆德拉的A-Z词典(节选)
米沃什词典
词典引发的政治辩论由来已久 精读
2017-2018学年华东师范大学授予理学、工学博士学位人员名单
漫画词典
论国际商贸类专业课程工学交替实践之模式