APP下载

基于网络语义分析的武汉锦里沟风景区游客体验性评价

2023-07-10耿凌顶黄鑫萍

农业开发与装备 2023年5期
关键词:网络分析负面语义

耿凌顶 黄鑫萍

(1.大连大学国际学院,辽宁大连 116622;2.武汉轻工大学管理学院,湖北武汉 430048)

0 引言

语义分析是通过对语言本身的文字、符号、语境等进行解析,发掘那些不能通过普通阅读所掌握的深层意义。网络语义分析是在语义分析的基础之上,通过对人们在网络上留下的语言进行深层分析,充分发掘网络语言背后人们的观点、立场以及情感等要素。武汉锦里沟是武汉市木兰山5A旅游景区群的核心景区之一,本文主要运用“八爪鱼”这一爬虫软件和武汉大学开发的ROSTCM6这一语义网络分析软件,以武汉锦里沟风景区为实证对象,利用游客对景区评价作为研究数据来源,探究游客的情感倾向和具体需求,为景区的建设发展提出可行的建议。

1 数据收集及处理

1.1 数据收集

在互联网大发展的背景下,游客可以在各种网络平台上发表自己对景区的评论,这些评论蕴含着游客最真实的情感,不仅影响其他游客对于该景区的印象以及消费决策,也是对景区进行整改完善的直接依据。本文以武汉锦里沟为研究对象,利用“八爪鱼”软件搜集了景区在美团、去哪儿、携程以及飞猪四大在线旅游平台8 126条游客评论(表1)。

表1 四大平台游客评价统计表

1.2 数据预处理

由于互联网平台的开放性,游客评论语言在字数、语法、格式上都存在很大的随意性,因此需要利用爬虫软件对收集到的这些评论文本进行预处理。数据的预处理主要包含三个环节,首先是删除诸如“好”“很好”“不行”等等只有一两个字、过于简短且不能产生语义关联的游客评论。其次是去掉诸如“好好…”“差差…”“垃圾垃圾…”等将一个字或者一个词多次复制粘贴,凑字数的评论。最后就是删除那些为获取平台上的评价积分,直接复制粘贴其他游客的评价。

1.3 分词处理及二分化处理

经过数据预处理后,已经得出有效数据。但是游客评价大多是较长的句子,为了挖掘景区游客评价的热点,需要利用ROSTCM6软件的分词处理功能,将评论的长句子进行分词处理,抽取出游客评价的高频词汇和热点词汇。

分词处理以后就可以利用ROSTCM6软件进行情感分析,也就是将文本分成正面、负面评价,进行二分化处理。其基本原理是根据每条的字、词包含的情感积极性的高低打出不同的分数,一条评论中正面评价词汇越多,分数就越高,相反负面评价的分数为负数,0分为中性评论。表2是表1进行预处理后,剩余7 124条评论二分化处理结果。

表2 二分化处理结果表

2 基于语义网络分析的游客正面评价分析

为了更加深入地了解景区哪些具体因素引发了游客的积极情感,以及这些积极因素之间的相互关系,将5 137条正面评价和ROSTCM6语言网络分析功能,可以构建游客在线正面评价的语义网络分析图(图1)。

图1 武汉锦里沟景区游客正面评价语义网络图

通过图1可以看出景区存在以下优势:

1)“锦里沟”和“景区”这两个界定研究对象的节点同时指向了“风景”节点,而“风景”又指向了“很好”这一节点,说明大多数游客认为锦里沟景区“风景优美、景色不错”。

2)“工作人员”“服务”“态度”这几个一二级节点与“很好”这个一级节点构成了一个封闭的四边形,不难得出该景区内工作人员的服务态度很好是引发锦里沟景区的游客正面情感的一大因素。

3)一级节点“好玩”关联了“山道”“滑车”“玻璃桥”“玻璃”“漂流”“项目”等多个次级节点,说明景区内项目较多,收获了不少游客特别是小孩子们的喜爱。

4)“土家”“风情”“文化”这三个节点之间构成了一个封闭三角形,证明景区土家族的少数民族文化给较多游客留下了深刻的印象,事实上锦里沟景区是武汉市唯一的土苗文化风情区,文化特色鲜明。

5)“网上”“划算”这两个一级节点与“买票”节点形成了一个封闭的三角形,表明了大多数游客认为锦里沟景区在网上购票十分划算。实践中武汉锦里沟是木兰山5A旅游景区群中,最早“触网”并推行团购的景区。

3 基于语义网络分析的游客负面评价分析

同理,为了挖掘导致锦里沟景区游客产生负面情绪的主要因素,以及这些因素之间的相互关系,可以通过1 423条负面评价,构建负面评价语义网络图(图2)来完成。

图2 锦里沟景区游客负面评价语义网络图

通过图2可以看出景区存在以下问题:

1)景区收费混乱。图2中“项目”“收费”“门票”都是高频词汇,并且“景区”“项目”“门票”“玩的”这四个节点都指向了“收费”节点。在负面评价文本中通过搜索“收费”,可以发现很多游客反映景区存在胡乱收费现象。

2)景区配套设施不完善。在负面评价语义图中可以看到“配套”“设施”“不完善”节点之间形成了一个封闭的三角形,显然游客认为景区配套设施不够完善。通过在游客负面评价文本中搜索这三个词语发现,很多游客反映景区垃圾桶太少、没有路标。

3)工作人员数量少、素质较低。图2中,“服务”“人员”“态度”“管理”这四个节点构成了一个封闭的四边形,可以看出游客十分看重景区内服务人员的态度及管理。除此之外,“景区”“工作人员”“太少”节点之间也构成了一个封闭的三角形。浏览景区负面评价文本,可以得知该景区内的工作人员很少,无法问路,还有部分游客认为景区工作人员态度不热情。

4)景区环境卫生问题突出。在负面评价语义分析图中可以看到“垃圾”节点直接指向了“有点多”节点。在语义分析中,“垃圾”这一词汇可以是形容词,体现游客对景区的负面评价,同时也可以作为名词,说明游客认为景区内的垃圾较多,污染了环境。结合负面评价文本分析,确实存在部分游客为了吐槽景区而形容其很“垃圾”,而更多的游客评论景区环境卫生条件差,“垃圾很多”。

5)景区周边道路设计不合理。从图2中可以看到,“道路”节点上的连接弧较多,“不好走”以及“景区”节点直接指向了“道路”,说明游客认为该景区的道路不好走。通过结合所有的负面评价文本进行综合分析,发现游客主要抱怨这些交通问题:首先是景区内部路况很差,山路、泥巴路多,景区外部道理路弯弯绕绕,道路不平整,安全隐患较大,其次是景区的路上路标很少,游客导入性不足,最后是景区周边堵车严重,缺乏工作人员进行疏通。事实上,锦里沟景区位于武汉市边远的黄陂区,属于大别山南麓余脉,交通设施建设任重道远。

4 结语

在“互联网+”时代,各大网络平台上已经形成了海量的游客评论数据。与此同时,随着计算机科学的发展,人工智能改变了人类与计算机的交流方式,运用人工智能进行语义数据挖掘,可以在对现实世界中的事物进行描述的语言中探索出更多有用的数据和信息。本文以武汉市锦里沟景区的网络评价为数据来源,运用相关的语义网络分析工具,对这些文本正、负面评价进行了进一步挖掘,既为景区发展起到导向作用,也是对语义数据网络分析的一次有益的探索。

猜你喜欢

网络分析负面语义
基于ISM模型的EPC项目风险网络分析
语言与语义
负面清单之后的电改
远离负面情绪
铁路有线调度通信的网络分析
正面的人和负面的人
2016年社交网络分析
“上”与“下”语义的不对称性及其认知阐释
大班幼儿同伴交往的社会网络分析
认知范畴模糊与语义模糊