APP下载

基于知识图谱的社区团购媒体舆论情感倾向分析

2021-04-12胡振华舒行钢

财经理论与实践 2021年2期
关键词:知识图谱

胡振华 舒行钢

摘 要:基于知识图谱方法,依据Python爬取的数据,考量媒体舆论对社区团购的情感倾向。结果显示:不正当竞争、价格混乱、缺乏售后以及供应链条不畅等,导致媒体舆论对社区团购的情感倾向以“消极”为主。鉴此,应建立健全市场竞争机制和监管机制、完善质量导向定价机制、改进团长主理人培育机制、优化供应链共享合作模式等,以促进社区团购长效健康发展。

关键词: 社区团购;媒体舆论;情感倾向;知识图谱

一、引 言

随着社交媒体软件的广泛应用,具有“社交属性”的网络团购销售模式逐渐兴起[1],社区团购作为网络团购的衍生物[2],自2016年出现以来迅速发展。社区团购兼顾社区购物和网络团购的特性[3],是一种依托互联网等技术并以社区为基本单位为社区居民提供产品与服务的团体销售模式。京东、腾讯、美团等相关企业纷纷布局促使社区团购呈现爆发式增长,艾媒咨询数据显示,2022年我国社区团购市场规模预计将有可能达到千亿级别[4]。新冠疫情的冲击进一步刺激了社区团购的发展,多多买菜仅两个月覆盖城市数量就高达60座[5]。部分人认为社区团购的集采和预售模式有利于简化中间环节、降低库存成本和损耗;也有部分人认为社区团购存在商品质量难以保证、维权困难和人们的刚需“菜篮子”受到互联网平台威胁等弊端。因此,当前人们对社区团购关注的焦点,以及社会舆论对社区团购持有的普遍态度等问题有待进一步研究。

相关研究主要集中在团购、消费者社区团购意愿等方面。团购研究主要体现在:团购策略对消费者影响方面,Kauffman Wang(2001)和Yuan等(2004)指出消费者形成购物团体可增加影响力从而获取更低的折扣价格[6,7]。有学者认为团购并非总对消费者有利,如胡东滨等(2014)对比团购与传统边际策略发现消费者信息异质性较小时团购并非最佳策略[8]。影响消费者参与团购的因素方面,Hsu等(2014)、韩金星等(2016)、Hsu等(2018)发现消费者之间的社交信任、网络团购中社会互动、消费者评价等会显著影响购买意向或购买行为[9-11]。消费者团购策略对企业的影响方面,范丽繁和王满四(2016)基于Bertand模型研究双寡头商家的团购定价策略,发现团购可以使商家和消费者实现共赢[12]。以上更多考虑团购对消费者和商家的影响,随着团购业务的发展,社区团购模式应运而生,有学者对此进行了研究。如薛晓丽(2011)主要关注社区团购如何产生[2],Jing等(2015)分析便利性和产品服务如何影响社区团购[13]。李琪等(2020)研究消费者社区团购行为,发现信任、满意度和关系承诺在其中发挥作用[3]。Shui和Li(2020)针对社区团购新鲜农产品提出协作优化机制以应对开发和运营同质化竞争问题[14]。不同于以往多采用传统实证研究方法、从单一主体角度研究社区团购问题的文献,本研究拟通过爬取主流媒体对社区团购的评价,提取关键词、构建知识图谱,更全面解析不同主体和问题之间的紧密度,分析公众对社区团购的情感倾向。

少数学者研究了消费者社区团购的意愿。李勇等(2019)发现购买方便和节约时间是农村用户生鲜团购的主要动机,并为发展农村社群电商提供建议[15]。简惠云和杨欢(2020)研究了社区电商技术特性和信任对消费者购买意愿的影响,发现情感信任和认知信任都会对消费者购买意愿产生显著积极的影响[16]。李连英等(2020)发现倾向型、中间型和无感型三种类群的消费者购买社区电商生鲜农产品意愿及其影响因素都存在差异,故需采取差异化营销方式以实现对目标顾客的准确定位和精准营销[17]。本研究在已有文献基础上采用大数据技术,分析影响消费者社区团购意愿的主要因素。

现有研究更多关注消费者参与团购的影响因素及团购策略对消费者和商家的影响,且多从单一主体视角采用调查问卷等方法进行研究,鲜有学者探讨消费者社区团购意愿和社区团购的关键影响因素。基于此,拟在现有研究的基础上,运用爬虫技术获取主流媒体对社区团购的评价数据,构建知识图谱分析不同焦点之间的联系,并通过情感倾向分析提取媒体对社区团购的不同观点和态度,提炼当前社区团购存在的问题,以此提出针对性的管理建议。

二、样本选取与研究方法

本研究围绕“社区团购”这一中心词搜索了截止到2020年12月15日媒体上报道的相关文章,经过初步比较不同新闻网站和社交平台中有关“社区团购”的相关舆论,发现新浪网对当今主流媒体报道的覆盖比较全面,數据完整。因此,以新浪网为数据搜索平台,选取相关新闻报道为研究样本。借助Python爬虫技术,通过运行代码获取新浪网新闻标题中带有中心词的每条新闻链接,以此建立循环,借助代码点击链接,爬取该网页内属于新闻文本的部分,直至所有已获取链接都被点击、新闻文本均被抓取,循环终止。本次爬取的数据主要包括新闻标题、链接、正文、发布时间、作者以及文章来源六个部分。导出数据进行去重和清洗之后收集包括上述六个部分的共355条记录,再结合Excel自动去重功能与人工检查,确保筛除掉重复的新闻报道,最终剩余247条记录,每一条记录均为一篇媒体或自媒体文章,数据搜索有效率为69.58%。

知识图谱在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列图形,是将应用数学、图形学、信息可视化技术、信息科学等学科理论、方法与计量学引文分析等相结合,运用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的联系的一种方法,能实现多学科融合,可为相关主题研究提供切实的、有价值的参考。本质上,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。

三、基于知识图谱的情感倾向分析

(一)关键词提取

选取新浪网关于社区团购的247篇文章,得到50余万字的庞大文本数据。在此基础上,使用Python中的Jieba分词包对爬取的网络文本进行精确分词,采用NLPIR-ICTCLAS汉语分词系统兼容的标记法对切割好的单词进行词性标注,去除无效的停用词和功能词后进行词性过滤,选择有效名词,最后使用TF-IDF算法提取关键名词,在分词完成后自动统计词频。输出出现频率前30位的词语如表1所示。

从表1可以看出,社区团购的核心词汇是“社区”和“平台”,可能因为社区团购是以社区为核心、以平台为载体。“互联网”“市场”“公司”分别排第1—第5位,说明社区团购是依托互联网企业与市场成长起来的。“团长”排在第6位,团长是社区团购的主要线下负责人,每一次购买都离不开团长提货。“价格”排在第8位,说明社区团购的消费者可能为价格敏感型用户。近期热度很高的互联网平台利用价格补贴入驻社区团购相关新闻也在词频表中有所体现,“补贴”和“资本”分别位于词频的14和15位。“垄断”出现在第29位,说明互联网巨头入驻引发的关于行业垄断的问题也常被提及。

(二)知识图谱构建

构建网络文本关键词共现矩阵。获得网络文本中所有关键名词后,统计出现频率前100的关键词,借此构建关键词共现矩阵(Co-occurrence Matrix)。首先,构造前100位关键词的二维数组,建立关键词长度(维度为100)的高维稀疏矩阵,赋值矩阵的第一行和第一列为文章关键词,设置矩阵的对角线为0。随后,取出的行关键词和列关键词进行排列组合,对所有网络文本进行迭代遍历,如两个关键词同时出现在一句话中,则共现频率加一,遍历网络文本后,可得所有关键词组合的共现频率。设置关键词共现频率阈值为50,共获得4700+关键词组合。此时数据过大难以分析,再次筛选后仅保留共现频率高于5000的关键词组合。

构建知识图谱的网络布局。将关键词作为知识图谱中的实体节点,关键词共线矩阵为实体之间的关联关系,由此构建网状的无向度关联结构。将数据导入Gephi软件中,使用力引导布局中的FR算法(Fruchterman-Reingold Algorithm)对所有关键词节点进行布局,通过多次迭代,各实体节点及节点的关联趋于稳定,整体布局达到动态平衡。所得知识图谱共有67个节点,152条边,以社区团购相关的网络舆论热点话题为基础的知识图谱构建完成,如图1所示。通过高频共现关键词知识图谱可以发现,高频关键词的分布呈现中心扩散特征,以出现频率最高的社区为中心节点,以平台、巨头、团长等内容为二级节点依次扩散,最后的三级节点为菜市场、商业模型、订单、疫情等话题,可通过知识图谱发现媒体的关注焦点。

话题社区分类及主题聚焦。社区发现算法(Community Detection)一般用来探测网络中的块(Cluster)或者社区(Community),通过算法解析网络间的抽象拓扑连接结构,根据关联的疏密程度划分为不同的社区。基于高频共现关键词知识图谱各节点的之间关联度的稀疏程度,通过Louvain算法进行迭代解析,增加每个模块的模块度,以0.6的解析度标准对知识图谱进行社区划分。共划分四个社区,即数据大致可以分为四大研究群组,且覆盖了社区团购的整个产业链条。如图2所示,社区团购舆论四个焦点分别为:

一是社区层面。以“社区”为中心词,涵盖供应链、互联网、巨头、补贴、资本、流量、商业模式等关键词。2016年B2B平台芙蓉兴盛推出拼团模式时并无互联网巨头进驻,随着疫情爆发,更多用户通过线上渠道购买蔬菜、粮油等商品,大批互联网巨头投资、成立社区团购平台,如京东加码七亿美元投资兴盛优选。社区团购本意为创新商业模式,通过线上渠道满足消费者团购需求,但由于资本入驻,商业模式异化为以高额补贴吸引客户量,形成行业垄断后再提价獲取利润,因此社区团购商业模式成为媒体关注的焦点问题。

二是平台层面。关键词主要包含平台、渠道、供应商、经销商和低价。社区团购产业共有三级节点,经销商进行货物分发,社区团购平台进行商品转售,社区消费者作为产业链条终端承接商品。社区节点在知识图谱中连接度为67,即和所有话题相关联。社区团购的主要承载中介为各个平台,平台联通经销商、供货商和社区团购企业,为消费者进行商品配送。

三是消费者层面。集中于消费者、用户、团长等内容。社区团购是团长发单、消费者拼团的新型共享团购。团长是连接团购平台和社区用户的关键节点,负责扩展用户、商品订购和分发,对平台意义重大。目前团长多数是从社区中自发形成,缺乏专业训练,部分团长由于不能落实商品订购和售后服务导致客户流失。因此,优秀的团长成为诸多平台争抢的对象,有的平台甚至开出月薪三万的高薪吸引优秀团长加入,“团长”也成为媒体热论的内容之一。

四是企业层面。关键词为企业、公司、经销商和供应商等。媒体对公司和经销商等的关注集中于后疫情时代下水产、冷链供货带来的不确定风险。同时,由于部分社区团购经销商缺乏管理,使未经过安全检测的冷链产品分发给消费者,影响水产和冷链商品的市场和供货。因此,如何对水产和冷链相关商品进行抽检,确保安全性,也是媒体关注的内容。

(三)媒体舆论对社区团购的情感倾向分析

基于上述分析,根据知识图谱显示的中心词及关联词对相关新闻进行观点抽取,概括出媒体舆论对社区团购的情感倾向。通过调用百度AI平台中的自然语言处理模块API,使用百度AI文本情感分析的知识增强预处理算法对文本进行情感分析。将情感倾向分为积极、中性和消极三种,积极表明正面、肯定的态度,消极表示负面、否定的态度,中性则表示未有情感倾向。考虑到数据众多及分析的可行性,仅保留共现频率高于5000的关联词。

表2分析了以“社区”为中心词的情感倾向,关联词主要包括供应链、互联网、客户、补贴、巨头和垄断。搜索包含所有高频关联词的媒体评论共7条,其中4条评论持消极情感,约占总评论的57.1%,表明媒体在谈及社区的舆论中更多的是持否定消极的态度。进一步分析发现,媒体谈及社区与巨头、互联网、供应链、客户、补贴、垄断这些关联词时均以“消极”倾向为主,分别约占总评论数的55.3%、52.5%、57.8%、55.4%、49.0%,61.4%,尤其在报道社区与垄断的新闻中消极倾向最大。这是由于互联网巨头试图通过补贴和超低销售价格等垄断社区团购市场,使供应商只能以极低价格在团购平台上销售产品,严重打击供应链各主体进行优质生产的积极性,破坏了供应链效率并且最终后果由客户买单,由此催生媒体的负面态度。供应链配送效率低下、售后服务不到位等也是导致负面评价的主要因素。

表3分析了以“平台”为中心词的情感倾向,关联词主要包括价格、渠道和商品。包含所有高频关联词的媒体评论共30条,其中15条持消极情感。分析发现媒体主要对平台与价格、渠道、商品抱以“消极”倾向,分别约占总评论数的59.3%、57.9%、55.2%,尤其在报道平台与价格的新闻中负面报道最多,如“价格乱了,恼火得很”,有些也涉及社区团购平台大额补贴的情况,“之前出现过两次平台某款瓜子售价低于出厂价的情况,所以停了平台的货”。由于商品价格的差异,也出现了不同平台上商品质量的差异,破坏了消费市场规范性,对商业模式和商品渠道都是挑战。

表4分析了以“用户”为中心词的情感倾向,关联词主要包括市场和消费者。涉及所有高频关联词的41条相关媒体评论中,持消极情感的评论有24条,约占总评论的58.5%,表明媒体在谈及用户的舆论中更多持否定消极的态度。媒体报道用户与市场、消费者时均以“消极”倾向为主,分别约占总评论数的53.6%、55.3%。深入分析媒体报道的内容可知,社区团购加深了用户与市场和消费者之间的负面情感,如“社区团购平台暴露了虚假宣传、非法收集个人信息等问题”。报道中也有一些积极的情感,如“通过分布在各小区的团长,为居民提供快捷便利的服务体验”,作为连接团购平台和社区用户的节点,团长的作用非常重要。

表5分析了以“公司”为中心词的情感倾向,关联词主要包括市场、供货和水产。涉及包含所有高频关联词的8条相关媒体评论中,有7条持消极情感,约占总评论的87.5%,表明当媒体谈及公司时持否定消极的情感倾向更加明显。媒体报道公司与市场、供货和水产时 “消极”倾向分别约占总评论数的55.8%、68.4%、71.4%。进一步分析媒体报道的内容,发现其中涉及上市公司的债务、股票等信息,公司与市场和供货商的关系受到金融等因素的影响从而增加了负面情感。而水产质量难以保证的问题,导致负面情感的报道比例居高不下。

四、基于社区团购舆论的管理建议

(一)建立健全市场竞争机制和监管机制

电商巨头的过度投资或补贴,可能会形成社区团购行业的垄断,影响市场正常运行,需要稳健的社区团购市场竞争机制和市场监督机制推进社区团购的健康发展。一是形成传统企业与电子商务企业的双赢发展格局。通过加强对社区团购的有效引导,重新建立社区团购市场竞争秩序,确保整体市场的有序竞争。二是明确多方主体的责任监管。社区团购参与主体多元性决定了社区监管机制存在多方主体,加强对平台、供应商、经销商、团长等主体的监管,有益于社区平台的可持续发展。

(二)完善质量导向定价机制

有效的价格机制有利于正确引导企业生产行为,促进高质量产品的有效供给,因此,社区团购供货平台需要完善以质量为导向的定价机制。一是形成以质量为导向的差异化定价机制。社区团购平台需把控产品的质量,以质量为依据进行差异化定价,服务不同的消费者类型。二是建立社区团购供应链的质量溯源系统。社区团购在本质上也是网购,具有信息不对称的特点,基于大数据、物联网、区块链等技术建立产品溯源体系,有利于实现平台各供应主体或销售主体的信息共享,降低道德风险,同时能帮助消费者了解产品质量,提高信任度。

(三)改进团长主理人培育机制

团长是连接团购平台和社区用户的关键节点,兼具銷售、仓配、售后等职责,应改进团长主理人培育机制,以便更加妥善处理团长和消费者在这些环节上的关系。一是完善团长选拔制度。提高团长队伍的素质水平可以创造更多的销量,扩张团长队伍有助于扩大销售规模,抢占市场份额。因此,可以从源头抓起,通过完善团长选拔流程,培育与团长职位相匹配的人才队伍,同时增加入职培训等提高团长队伍整体素质。二是建立敏捷售后管理机制。社区团购平台在依赖资本快速扩张的同时,更要注重“精细运营”,借助团长直接与消费者接触的优势,了解消费者需求,完善平台售后服务流程,真正关注平台消费者的购物体验。依托互联网技术与信息技术,搭建良好的信息流通渠道,建立相应的敏捷售后管理机制,保证消费者反馈的问题责任到人,可以快速处理消费者反映的问题,提高团长统筹协调能力。

(四)优化供应链共享合作模式

社区团购供应链模式主要分为三类:以兴盛优选为代表的撮合模式,平台通过邀请商家入驻,集单后统一采购;以你我您为代表的依托中转仓的直销供应链,通过建造区域中转仓直采直销;以苏小团为代表的同时依托中转仓和前置仓的供应链。推进不同模式的融合,加强各主体间的联合互动,创建长效的共享供应链合作模式是保障社区团购健康发展的重要举措。一是打造社区团购全局供应链框架,优化整体运营效率。根据需求发生-订单汇总-集采-分拣-配送流程合理规划供应链每个环节的工作,提高供应链时效性与敏捷性,满足消费者对社区团购运营效率的要求。二是优化供应链各环节。采购环节优化供应商管理,与品牌供应商建立长期合作关系;物流环节合理规划分拣仓布局和物流路线,减少中间环节的成本和损耗;销售环节充分了解消费者实际需求,以需求定供给,最终实现共享供应链的合作模式。

参考文献:

[1] 张阳, 徐兵. 基于社交团购的电商平台引导拼团策略研究[J]. 管理评论, 2019, 31(10): 133-141.

[2] 薛晓丽. 基于社区的网络团购平台构建研究[J]. 电子商务, 2011(9): 19-20.

[3] 李琪, 李欣, 魏修建. 整合SOR和承诺信任理论的消费者社区团购研究[J]. 西安交通大学学报(社会科学版), 2020, 40(2): 25-35.

[4] 艾媒咨询. 2020上半年中国社区团购行业专题研究报告[EB/OL]. https://www.iimedia.cn/c400/74181.html, 2020-09-11.

[5] 观察者网. 互联网混战社区团购[EB/OL]. http://www.southmoney.com/caijing/caijingyaowen/202012/7886860_2.html, 2020-12-05.

[6] Kauffman R J, Wang B. New buyers' arrival under dynamic pricing market microstructure: The case of group-buying discounts on the Internet[J]. Journal of Management Information Systems, 2001, 18(2): 157-188.

[7] Yuan S, Lin Y. Credit based group negotiation for aggregate sell/buy in e-markets[J]. Electronic Commerce Research and Applications, 2004, 3(1): 74-94.

[8] 胡东滨, 李洋, 陈晓红, 等. 基于信息共享角度的团购策略研究[J]. 系统工程理论与实践, 2014, 34(11): 2849-2861.

[9] Hsu M, Chuang L, Hsu C. Understanding online shopping intention: The roles of four types of trust and their antecedents[J]. Internet Research, 2014, 24(3): 332-352

[10]韩金星, 张喆, 古晨妍. 网络团购中消费者社会互动对团购信任的影响[J]. 管理评论, 2016, 28(9): 148-162.

[11]Hsu S, Qing F, Wang C, et al. Evaluation of service quality in Facebook-based group-buying[J]. Electronic Commerce Research and Applications, 2018, 28: 30-36.

[12]范丽繁, 王满四. 基于Bertrand模型的双寡头商家的团购定价策略[J]. 系统工程, 2016, 34(4): 62-69.

[13]Jing R, Yu Y, Lin Z. How service-related factors affect the survival of B2T providers: A sentiment analysis approach[J]. Journal of Organizational Computing and Electronic Commerce, 2015, 25(3): 316-336.

[14]Shui W, Li M. Integrated pricing and distribution planning for community group purchase of fresh agricultural products[J]. Scientific Programming, 2020(3):1-15.

[15]李勇, 刘我, 谭小玲, 等. 基于线上线下数据的农村用户生鲜团购需求挖掘[J]. 农村经济与科技, 2019, 30(19): 118-120.

[16]简惠云, 杨欢. 社区电商技术特性对消费者购买意愿的影响[J]. 商業经济研究, 2020(23): 99-102.

[17]李连英, 聂乐玲, 傅青. 不同类群消费者购买社区电商生鲜农产品意愿的差异性分析——基于南昌市578位消费者的实证[J]. 农林经济管理学报, 2020, 19(4): 457-463.

(责任编辑:钟 瑶)

猜你喜欢

知识图谱
国内外智库研究态势知识图谱对比分析
国内信息素养研究的知识图谱分析
国内图书馆嵌入式服务研究主题分析
国内外政府信息公开研究的脉络、流派与趋势
基于知识图谱的产业集群创新绩效可视化分析
基于知识图谱的产业集群创新绩效可视化分析
国内酒店品牌管理研究进展的可视化分析
从《ET&S》与《电化教育研究》对比分析中管窥教育技术发展
专家知识图谱构建研究
面向知识扩充的实体关系挖掘