基于LDA模型的快递服务质量评价指标研究

2019-01-21祝洪达

西部论丛 2019年3期

祝洪达

摘要：本文旨在建立适用于快递服务的评价指标，因为传统的SERVQUAL和SERVPERF量表存在依赖调查问卷以及行业通用性差等局限性，所以选择利用网络爬虫从互联网爬取用户对于快递服务的在线评论作为语料，对语料进行分句、判断文本有效性之后，利用LDA模型挖掘出用户对于快递服务的关注点，并将其作为评价快递服务的指标。

引言

近年来，依托淘宝、京东、苏宁易购等电子商务平台的兴起与繁荣，快递市场获得了极大的发展。根据国家邮政局公布的2017年邮政行业运行情况显示，业务总量累计完成9763.7亿元，同比增长32%[1]。目前在快递市场正处于各大快递公司快速扩张、竞争空前激烈的环境下，快递服务质量低下的问题逐渐暴露出来，丢件、损毁、延误、工作人员服务态度差以及投诉反馈效果不佳等问题层出不穷。在当前以消费者为主导的市场环境下，快递企业服务质量的高低会直接影响企业的形象。低端的服务质量会导致顾客源的流失，进而损害企业的经济效益。因此，提升服务质量，塑造良好的企业形象是快递企业竞争过程中不可或缺的一环。

1.相关理论

1.1传统的服务质量评价模型

传统的服务质量评价模型有SERVQUAL（Service Quality）模型和SERVPERF（Service Performance）模型。

SERVQUAL模型将服务质量评价指标分为可靠性、响应性、有形性、保证性以及移情性五个维度，五个维度下又分为22个具体因素。通过用户填写调查问卷的方式，对每个问题的实际感受值和期望值进行评分，由此来确立影响服务质量的具体因素，其核心是“服务质量差距模型”，即服务质量水平的高低取决于用户所感受的服务水平和用户期望的用户实际感受的服务水平之间的差值，即

2.准备工作

本文旨在建立一套合理的用于评价快递服务质量的指标体系，通过对互联网中的对于快递服务的评价进行文本挖掘，利用LDA主题模型发现用户对快递服务的关注点，并将这些关注点作为评价快递服务好坏的指标。

2.1快递服务评论文本的获取

本文利用Python3.6编写网络爬虫从互联网获取用户对于快递服务的评论，并经过数据去重等预处理后保存入本地硬盘，以备后续处理。本次实验共抓取3433条快递评论。

2.2文本预处理

文本预处理主要包括以下评论分句、人工标注有效性、分词和特征项选择、建立空间向量模型等。

（1）分句

对评论进行分句的原因在于，一条评论中并不是所有的信息都是有效的。本文将直接提及或从中能推断出评价的是快递服务某一方面的评论视为有效评论。以“虽然顺丰派送有时候会不及时，但是我对客服和跟踪的服务是非常满意的，每个人的需求不同，服务行业态度很重要！”该评论为例，该评论中包含了快递服务的派送、客服、信息追踪、服务态度等多方面的信息，但“每个人的需求不同”并不是对于快递服务的评价，属于无效数据，需要从文档集中去除。所以本文按照“，”、“。”、“？”等标点符号对评论进行分句处理，便于从中剔除无效的数据。

（2）人工标注其有效性

对评论分句处理后产生的新评论人工判断其有效性并进行标注，将有效的分句标记为1，无用的分句标记为0，目的是通过对评论进行少量的人工标注，利用有监督的机器学习算法训练判断文本有效性的模型。本实验标注了9000条数据作为训练数据集。

（3）分词和特征选择

采用ICTCLAS汉语分词系统的Python API对评论逐条进行分词，并进行词性标注。因为我们的关注的是关于快递服务方面的描述，所以需要将标点符号和方位词、时间词等词性的词语删除。

（4）建立空间向量模型（VSM）

经过分词之后，将每个单词表示为（T_i-W_i ）的形式，其中T_i表示语料库中的第i个单词，W_i表示第i个单词的权重。权重通过TF-IDF算法来计算，如（7）。所示。其中〖tf〗_i表示单词t_i在文档d_i中出现的频率，M表示语料库中的总文档数，m_i表示训练文档中出现单词t_i的文档数，表示单词t_i的逆文档频率[6]。

2.3文本有效性判别

文本有效性判别，本质是一个二分类问题，常用的分类模型有Logistic回归模型、决策树模型（Decision Tree）和支持向量机模型（SVM）等。本文对各个分类模型的准确率（precision）、召回率（recall）以及F度量值（F-measure）等性能进行比较，结果见（表1）。從表1可以看出，支持向量机模型的分类性能要优于其他的模型，这主要是因为支持向量机模型仅与支持向量有关，所以相对于其他的分类模型而言，需要的数据样本量要少，同时利用高斯核函数的支持向量机模型能将矩阵映射为高维空间中的一个点，从而提高文本有效性判别的准确率，所以本文利用采用高斯核函数的SVM模型来判断文本的有效性。

2.4在线评论主题发现

对在线评论进行主题挖掘之前，需要先将评论进行分句处理，利用训练好的SVM模型判断该评论每一个分句的有效性，舍弃无效的分句，将有效的数据再合并为一条数据，经过处理之后，每条评论包含的词语个数一般不会超过25个。然后利用LDA模型对全部评论进行主题发现。中国快递协会体验调查报告将快递服务质量评价体系分为发件揽收环节、收件环节、派件网点以及投诉受理情况4个维度共17个具体指标[7]；王洪伟等利用词频统计的方法，从企业整体、价格、时效性、快递员、信息化、安全性以及客户服务7个维度18个具体指标来评价快递服务质量的高低[8]，所以本次实验设置主题个数为25，迭代次数设置为50，得到的部分结果见（表 2）。

3.结论可行性分析

根据LDA模型的主题发现结果，可以将快递服务的在线评论分为配送环节、快递员、投诉环节等8个维度23个评价指标，详情见（表3）。经过与中国快递协会调查报告以及利用词频统计建立的快递质量评价指标对比发现，三者的具体指标大致相同，说明利用LDA模型建立快递服务质量评价指标具有一定的可行性。

结语

本文利用LDA主题模型对快递服务的在线评论建模，挖掘在线评论的主题，得到用户对于快递服务的关注点，并将其作为评价快递服务质量的指标。从用户对快递服务的关注点可以看出，快递服务不仅要优化业务流程，提高作业的效率，还要注意提升企业形象，特别是快递员以及客服等工作人员的专业素质以及工作态度，建立价格规范，并注意物流状态的实时更新。

参考文献：

[1]国家邮政局公布2018年4月邮政行业运行情况[EB/OL]. http：//www.spb.gov.cn/xw/dtxx_15079/201805/t20180512_1563793.html，2018-05-12/2018-05-20.

[2]黄敏.基于SERVQUAL模型的商业银行服务质量评价研究[D].重庆理工大学，2015.

[3]唐晓波，向坤.基于LDA模型和微博热度的热点挖掘[J].图书情报工作，2014，58（5）：58-63..

[4]刘兵.情感分析：挖掘观点?情感和情绪[M].机械工业出版社，2017.

[5]涂铭，刘祥，刘树春. Python自然语言处理实战核心技术与算法[M].机械工业出版社，2018.

[6]马刚.基于语义的Web数据挖掘[M].东北财经大学出版社，2014.

[7]快递服务体验式调查报告[EB/OL]. http：//www.cea.org.cn/content/details_21_13959.html，2017-10-09.

[8]王洪伟，宋媛，杜战其，等.基于在线评论情感分析的快递服务质量评价[J].北京工业大学学报，2017，43（3）：402-412.