APP下载

基于事理图谱的游记文本知识发现

2022-07-05邓君彭珺孙绍丹鞠海龙

现代情报 2022年7期

邓君 彭珺 孙绍丹 鞠海龙

摘要:[目的/意义]本文利用叙事图谱化的方式对游记文本信息资源进行有效的知识组织和挖掘,直观、生动地展示旅游事件知识之间的关联与结构,为推行旅游用户需求精准化知识服务提供参考与启示。[方法/过程]网络康养游记文本为实验数据源。采用基于规则模板的顺承关系与事件抽取方法,结合基于Doc2vec和K-Means的语义相似度聚类实现事件泛化,最后利用社会网络工具构建康养旅游事理图谱对游客行为过程描绘和分析。[结果/结论]通过构建事理图谱能够快速揭示康养旅游的热门目的地、游客行为偏好特征以及趋势等。根据研究结果为旅游相关机构在康养行程设计上提供4类方案,并在产品开发、服务优化等方面提出了建议。

关键词:游记文本;旅游知识服务;事理图谱;知识组织;知识发现

DOI:10.3969/j.issn.1008-0821.2022.07.009

〔中图分类号〕G25073〔文献标识码〕A〔文章编号〕1008-0821(2022)07-0105-09

Travelogues Knowledge Discovery Based on Travel ELG

——Take Health Tourism as an ExampleDeng Jun1Peng Jun Sun Shaodan Ju Hailong

(1.School of Business Management,Jilin University,Changchun 130012,China;

2.School of Business,Guilin University of Technology,Guilin 541000,China)

Abstract:[Purpose/Significance]This paper uses the method of narrative mapping to effectively organize and mine the knowledge resources of travelogues,visually and vividly display the association and structure of knowledge of tourism events,and provide reference and inspiration for the implementation of accurate knowledge services for tourism users needs.[Method/Process]Travelogues of health tourism were used as experimental data sources.The sequential relation and event extraction method based on rule template were adopted.Event generalization was realized by semantic similarity clustering based on Doc2vec and K-means.Finally,the social network tool was used to construct the psychological map of health tourism to describe and analyze the behavior process of tourists.[Results/Conclusion]The popular destinations,behavioral preferences and trends of tourists can be quickly revealed by constructing the causal map.According to the results of the study,four kinds of schemes are provided for tourism related institutions in the design of recreational travel,and suggestions are put forward in the aspects of product development and service optimization.

Key words:travelogues;tourism knowledge service;Event Logic Graph(ELG);knowledge organize;knowledge discovery

隨着互联网的发展,旅游者越来越倾向在旅游攻略平台上分享旅行中或旅行后的心得体会,潜在旅游者可以通过浏览游记收集需要的信息来规划行程路线,相关企业机构则通过分析游记更好地获取游客的个性化需求以优化旅游产品[1]。发掘蕴含在游记文本中的事件和事件之间顺承关系信息,可以辅助其他事理关系以及隐性事件知识的发现,从而厘清游客行为及偏好的始末,能为计划出行者提供更为完整深入的旅游目的地信息推荐,还能让旅游相关机构更加高效全面地获知游客的行为潜在偏好及特征等,游记是旅游知识服务中不可或缺的一部分。

事理图谱是以事件作为基本知识单元、事件及事件之间事理关系和模式为知识组织形式而构成的事理逻辑知识库,其利用大数据技术和高效易读的图谱化形式对谓词性事件短语及其内外关系进行挖掘和呈现。通过识别和构建事件及事件之间事理关系并可视化的信息处理方法,能有效补充实体和实体之间关系无法表达的动态知识[2]。

作为旅游新业态、新模式的康养旅游,满足了当前人们对健康、养生的多元化追求,然而当前对于康养旅游产品开发、游客行为特征等的实证研究较少,因此,本文以康养旅游为实验对象,尝试采用事理图谱方法对网络中的康养游记文本进行知识的挖掘与分析,对文本中的旅游事件和事件之间顺承关系进行特征提取,同时结合语义聚类算法、可视化分析工具绘制出具有直观、动态特性的事理图谱,以叙述模式更加生动形象地揭示出康养旅游的热门目的地行程及相应的游客行为偏好演进和趋势等,为推行康养旅游用户需求精准化知识服务提供参考与启示。

1相关研究

11游记文本相关研究

近年来,从网络游记中获取旅游行程信息的文献越来越丰富,研究内容主要聚焦于优化地理信息抽取[3]、旅游信息抽取[4]等技术方法,对目的地特征及旅游实体关系等信息进行识别抽取和排序等,为相关需求者提供参考。

在目的地特征识别和排序方面,Hao Q等[5]提出一种基于位置—主题模型(Location-Topic Model)的目的地特征摘要方法,能够正确提取和概括旅游目的地信息,为旅游者制定出行计划提供帮助;Xu H等[6]采用了一种频繁序列挖掘算法(FSPM),从大量地理词向量中探索旅游地点的频繁序列关系并收集每个热门景区的局部特征,结合相关分析识别出与该景区相关的观光点,最终得到热门路线以及各景区对应的热门观光点排序;高原等[7]则首先运用基于文本相似度算法自动化识别游记中蕴含地理位置信息的景点,再结合历史数据统计和景点空间特征模型,实现自动化景点信息识别和行程重构,为个人旅游者高效制定旅游路线提供帮助。

在旅游实体关系挖掘方面,Zhu Z等[8]利用实体信息抽取和语义分析技术分步提取目的地特征概念及其相关性,为每个目的地实体构建一个具有代表性的概念网络,丰富了目的地的代表信息(例如景点、活动和风俗);Yuan H等[9]和Guo L等[10]通过将FSPM算法与紧凑模式挖掘算法、词网络构建等方法相结合,不但能够获得热门游览路线和景点排序,还能发现与景点位置相对应的日常旅游活动和旅游服务点。此外,部分学者运用实体信息抽取并结合词频统计、共现分析、语义分析和情感分析等方式,不仅可以得到热门景点排序和相关特征,还能获知与景点相对应的游客情感[11-12]以及旅游形象感知等[13-14],为潜在旅游者、旅游相关企业和事业机构提供客观和便捷的决策依据。

以上面向网络游记的信息挖掘与分析技术,不但能够实现行程中地理名称、景区和服务点位置信息的特征获取和出现频率,还能帮助发现与景点相关的活动项目以及游客的情感特征等。然而,这些信息处理技术大多都单纯地从旅游文本中的实体信息和关联或者它们之间的次序关系、语义关系等出发,仅仅通过实体以及实体之间的关系还无法实现对旅游过程中游客行为以及偏好发生、发展的动态过程的呈现与追溯。

12事理图谱的应用研究

事理图谱的结构是一个有向有环图,节点代表事件,有向边代表事件之间的事理关系,如并列、顺承和因果关系等。事理图谱所展示的是一幅以事件为知识基本单元的一系列事件的动态演进[15]。近年来,学者们大多将其应用在政治与舆情监控领域的事件识别、关系抽取、可视化分析等方面。如单晓红等[16]通过抽取与政策相关的事件及它们之间的顺承和因果关系,构建政策影响事理图谱,分析政策与利益相关者行为以及市场变化之间的影响关系;白璐等[17]则通过制定一套面向政治领域的事件分类标准对公开域中的政治事件进行识别和关系抽取,构建面向政治领域的事理图谱。在舆情监控上,如夏立新等[18]利用事理图谱的事件抽取和表示的特性,对网络舆情事件进行多维特征可视化摘要生成;田依林等[19]以新冠肺炎微博舆情为例,提取相关事件及因果和顺承的关系,构建网络舆情事理图谱,并对生成的舆情演化路径进行分析。

综上,事理图谱在旅游信息服务中的应用相当有限。事理图谱的主要作用是挖掘并呈现事件以及事件之间事理关系,实现对事件及其起源与演进全过程的动态描绘与总结,可见,事理图谱方法正好契合本文对旅游行程和游客行为偏好过程的研究需要。

2研究设计

游记文本中行程事理图谱构建与知识发现共分为文本采集和预处理、顺承关系和事件识别与抽取、事件泛化以及图谱构建和可视化分析4个流程,如图1所示。图1行程事理图谱构建与知识发现流程

21文本采集和预处理

本文采用网络爬虫程序收集互联网中的游记文本数据。首先对数据进行清洗、去重、去杂,去停用词处理则根据哈工大停用词表对文本数据中的助词、语气词等进行过滤。利用Jieba分词对目标文本进行分词分句、长短句切分等,并调用哈工大LTP工具对文本进行词性标注和依存句法分析等。

22顺承关系识别和事件抽取

事件及事件之间的顺承关系是指一件事与另一件或多件事在发生的时间上具有先后顺序。本文运用基于句法模式和规则的人工定义模板匹配与依存句法工具相結合的顺承关系和事件多元组抽取方法,可简单有效地实现中文文本中关系和事件的共同提取。首先,借鉴Liu H Y[20]的思路,参考中文文本中句法模式的组成方式选取固定的顺序关系连接词,如:(其次|然后|接着|随后|接下来|…)等,根据连接词构造模板并生成匹配规则。以等标点符号为分隔标记,对目标文本进行长句切分,对切分后的长句依次以“”等标点以及“和与及且跟并”等词为分隔标记进行子句切分;其次,利用构造好的模板对切分好的长句进行顺承关系识别匹配,同时将一个长句中的子句进行分解和词性标注,提取出vob谓词性结构的短语作为结构化的事件表示;最后,所有顺承关系和表示事件的短语依次向上汇集,得到一个文本集data={[‘id’],[‘events’]},[‘id’]为标签集合,[‘events’]为包含顺承关系的链式事件短语集合,一个id对应一个顺承关系事件链。

23事件泛化

考虑得到的文本集中隐含着具有相似主题关系的顺承关系事件链,通过对事件泛化处理,可以突出重点,便于挖掘隐性事件知识。本文采用Doc2vec模型和K-Means算法的语义相似度聚类方法实现事件泛化,对文档集data生成句向量表示并聚类。第一步,先将事件集data中的id和events看成一个paragraph即句子的合集,再利用Doc2vec句向量模型分别映射生成paragraph vector和word vector向量表示Xp={xp,xp,…,xp},Xw={xw,xw,…,xw}。paragraph vector和word vector虽然维数相同,但来自两个不同的向量空间,在训练过程中,paragraph id保持不变,共享着同一个paragraph vector,每个句子都有一个唯一的id,相当于为每一个word的预测同时都考虑到了主旨,这样一来,在进行文本相似度计算的时候就利用了整个句子的语义。第二步,从事件集data中随机选择k个句子样本作为初始质心向量,可通过轮廓系数法选择一个合适的k值。计算所有的句子到所有的质心的距离,即语义相似度,最大迭代次数N,直到所有的k个质心向量都没有发生变化则输出簇划分完成聚类。

24图谱构建与可视化分析

顺承事件链经过泛化后采用Gephi社会网络工具构建可视化的事理图谱。图谱中包含以节点代表的目的地和单个事件,每两个节点之间存在的单向边代表顺承关系,如:id→node1→node2→node3→node4→node5,id代表目的地,节点1是节点2之前发生的事件,节点3是节点2之后发生的事件。以此形成的顺承关系事件链,可将游客的旅游行程路线及对应发生的行为用可视化方式表示出来以进行下一步的分析。

3实验过程

31实验数据选择

在充分考虑数据的全面性、适用性以及可获得性等因素,决定选用携程网、驴妈妈和马蜂窝网中的网络游记作为来源数据。检索策略是在各网站“攻略”二级类目下输入“康养旅游”“养生旅游”“健康旅游”等关键词搜索游记标题,时间设置为不限。利用Web爬虫采集每篇游记的目的地和正文,从网页中获取的游记数量分别为携程网5 059篇、驴妈妈520篇和马蜂窝网1 135篇,进行数据清洗后共得到6 520篇。将所有游记文本建立成CSV格式的数据集content={[‘city’],[‘blogs’]}。

32康养行程事理图谱构建

根据22章节中提到的抽取方法分别获得顺承事件链events 4 057条,共涉及目的地id 337个,抽取结果示例如表1所示。

由于每个地名与顺承事件链是一一对应的,同一地名中可包含多条事件链,并且这些事件链的内容具有较大相似性,根据23章节中的事件泛化方法,把含有相似主旨的事件链聚成一类。以表1中的事件链为例,首先将这9条{[‘id’],[‘events’]}共同生成句向量,经过语义相似度计算后,隐含着相似主题的事件链被聚成一个簇类,表示为:

0[阿坝,保定];1[日本,衡山];2[北海,安徽,北京];3[百色;埃及]

其中隐含主旨分别为:放松身心→去目的地;到户外→看夜景;景区游玩→品尝食物;参观历史古迹→游河。

以此类推,结果共生成12个聚类的簇。将经过泛化的结果导入Gephi“邻接名单”建立有序的链式分配有向图,构建康养旅游行程事理图谱,其中包含34 798个节点和43 675条有向边。

33结果分析

331热门行程发现

旅游的热门行程是指那些旅游者高度关注、影响力大并很受欢迎的游览行程,一般表现为与行程相关的地名与事件大量涌现,反映行程的内容反复出现。在游记文本中,出现频次高的地名往往可以作为热门行程的目的地;高发的事件链是对游客行为的高度概括和凝练,是康养行程的核心与精髓所在。利用Gephi从康养行程事理图谱中筛选出频次大于25的高频地名进行观察,如图2所示。从图2中可以看到,厦门和三亚的出现频次最高,说明这两个地方是目前游客前往最多、最为热门的康养行程目的地;其他频次较高的地名还包括上海、广州、重庆和北京等。通过对这些高频目的地的观察可以发现,康养游客的行程大多聚集于长江以南地带,西南以及沿海城市是游客较为热衷的行程目的地。

通过分析厦门和三亚两地中的关键事件链,可以探知康养热门目的地中的游客偏好与具体过程。运用过滤工具从图谱中找出“厦门”和“三亚”以及对应的所有顺承事件链,选择在一定阈值范围内的高概率节点所构成的关键事件链,如图3、图4所示。

图3所展示的是厦门康养行程关键事件链,其中最大的几个节点主要包括吃牛肉面、去鼓浪屿、去南普陀等,通过观察这些高发事件节点之间的顺承关系可以发现,前往厦门的康养游客行为偏好主要可分成两类:第一类是以鼓浪屿为中心的行程,前往鼓浪屿后可以去吹海风、听涛声;或者去菜市场买海鲜和吃海鲜;还可以先去住酒店,再喝特色奶茶、吃烤鱿鱼等,接着去参观钟楼、钢琴博物馆等。第二类是以吃牛肉为目的的行程,包括可以先去南普陀吃牛肉面、尝小吃,再带卤味;还有是去吃牛肉火锅,再喝黏米酒等。

在图4三亚康养行程事件链中,游客最为热门的偏好是吃海鲜,可分成两条线路:一条是先去三亚湾放松身心,然后去春园海鲜市场买海鲜和吃海鲜;另一条是先去吃海鲜,接着买水果,然后再乘车去亚龙湾、海滩和森林公园享受下午茶。其中,在吃海鲜的同时可以选择露天的餐厅用餐、吹海风,或者选择室内餐厅吃炒菜以及充满诗情画意的采菊火锅。此外,从图中还可以看到,前往三亚的康养游客还热衷于前往位于三亚南端的南山景区参观和体验南山文化场景。

332游客行为特征发现

单个地对热门行程进行分析,还无法获知康养游客的行为特点。在经过泛化处理后的康养行程事理图谱中,具有相似主旨的事件链被聚为一类,通过对每一类中的关键事件链的分析,可以实现对康养游客行为特征的发现。运用Gephi对图谱中各节点进行概率计算,再过滤去除平均度低的节点,如图5所示,在图5的12个聚类簇中,同一类簇中的事件链主题相同,其中节点颜色的深浅代表了节点重要性的高低,以重要性最高的事件节点为切入点,再通过重要事件节点之间的顺承关系即可发现该类型行程的关键事件链。通过观察,共找到关键事件链38条和相关目的地31个,如表2所示。

在表2中,以安徽、铜川等为康养目的地的游客(类号1和2),主要表现为两类行为偏好过程,即“登山→赏景”和“登山→探洞→求仙问道”相结合的康养体验,游客们热衷于前往灵山圣地以达到修养身心的养生体验,可以坐缆车或行走于栈道上观賞怡人风景,感受人与自然的和谐,再到仙洞、仙顶等体会修道成仙的养生乐趣等。以北京、咸宁等为康养目的地的游客(类号3和4),以“寻古迹/游古镇→感受人文历史”是最为突出的偏好,游客前往具有历史文化的建筑、古镇等,去观赏人文风光,感受特色习俗,还会选择如博物馆等地方聆听历史感受情怀等。以广州、武汉等为康养目的地的游客热门行为是围绕着住酒店开展的(类号5~7),主要方式可分为两类:第一类是以酒店为出发点,先入住酒店,接着游览周边的景点感受轻松自在的生活方式;第二类方式是以酒店为归属点,游客热衷于先到景区或目的地,再回到酒店用餐或者体验休闲时光,如喝咖啡、喝花茶等。以上海、丽江和三亚等为康养目的地的游客(类号8~10),“享受美食→游览风景区”是他们共同的偏好,但各有偏重,比如有的游客偏好于选择有地方特色的食物,比如三亚吃海鲜、西安吃羊肉等,游客还注重于特色的吃法,比如在成都吃鱼蘸料没有腥味、厦门的烧仙草添加燕麦等。在以昆明、杭州等为康养目的地的游客中(类号11~12),“泡温泉→调养生息/品尝美食”是他们最主要的行为偏好,游客首先选择风景优美的温泉景区,通过泡温泉来滋润身心、沐浴养生,接着欣赏风景、呼吸氧吧,或者去品尝美食,感受风情。

综上,可根据康养游客的行为归纳出几个特征:第一,从目的地选择上来看,游客热衷于选择沿海地区作为康养行程地,此外,具有历史悠久、富含民族特色文化的西南部地区,也是游客偏好的康养胜地。第二,康养行程的主题并不是单一的,而是多种方式的融合演进。比如,登山的行为应该是运动养生的一种方式,但不少游客是以求仙问道的宗教文化养生为最终的目的;以吃为主的饮食养生方式往往与泡温泉、看风景等生态养生方式前后开展;住酒店与休闲相结合的酒店养生方式也是游客热衷的体验过程。第三,远离喧嚣、探寻返璞归真的生活态度以及能够舒适惬意地饮食、游玩等是康养游客共同的特点

333康养旅游趋势发现

康养旅游业持续健康发展的关键在于相关从业者需要针对市场需求而不断创新产品和升级服务模式,旅游消费者偏好便是影响市场需求的一个重要因素。由于游客的偏好并不是固定不变的,所以对其过程核心环节的发现,有利于完整和全面地探测游客的潛在偏好,为相关机构优化康养旅游产品与服务提供启示。利用Gephi软件中的k-Core子图挖掘算法能够实现康养旅游事理图谱中核心关系的发现。该算法通常指定一个k核心度,通过去除图中不符合核心度的顶点,得到在图中承担着核心地位的子图,子图中每个顶点至少具有k的度数,且所有顶点都至少与该子图中的k个其他节点相连。核心节点不仅仅是度数的高低,更依靠的是该节点在整个图中的重要性和传播能力[21],因此能够直观追溯康养游客潜在偏好和趋势,如图6所示。

图6中可首先看到核心图谱中的目的地包括三亚、厦门和杭州,表明除了三亚和厦门两个热门康养目的地之外,杭州是潜在的热门目的地。

在图中平均度最大的核心事件节点是欣赏风景,通过节点之间的有序有向关系,可以从图中找出在其之前紧密相连的顺序事件包括的泡温泉、坐车、吃午饭、喝茶以及品尝美食,同理可找到在其之后联系最为紧密事件是去博物馆、感受文化和拍照片;其中还存在较远的顺序事件有吃东西、带孩子和住酒店等。经过对核心事件之间关系的综合观察,可将核心行程的环节总结为:游客倾向于选择风景秀丽的南方近海、沿江城市作为康养行程的目的地,将自然环境与文化陶冶相结合是游客追求的养生方式。游客青睐慢节奏的颐养过程,到达景区后先进行一段时间的休闲娱乐活动休息放松,如去泡温泉、喝茶和吃美食等,之后才前往景区的名景、名山等景点进行登山、赏景等游玩活动,最终以参观富有人文和历史的古迹了解与感受养生文化结束行程。与此同时还可以看到,游客对行程中住宿的需求特别突出,与住酒店相关的顺序事件穿插于各个环节之中,而目的却不尽相同,如有的游客为了能够放松身心、有的游客考虑带小孩方便,还有的游客关注酒店提供的饮食方面等,说明游客越来越注重对康养细节的体验,高品质的酒店服务是游客趋向的核心内容之一。

4讨论分析

由上述对康养游记文本的知识发现的一系列结果,可为康养旅游信息需求用户提供建议和启示。康养行程设计上可分为4个主题行程:

第一,以运动、自然与人文养生相结合为主题的康养行程,行程设计可包括:登山→体验养生历史→宗教养生,目的地可选择北京、咸宁等的历史传统养生文化游;贺州、丽江等省内的少数民族聚集地景区中具有民族特色的养生文化游以及以铜川、天柱山为代表的宗教养生游等。

第二,以温泉养生为目的的生态主题游。旅游行程主要为:赏景→泡温泉→特色餐饮。推荐目的地比如惠州、昆明和腾冲等森林温泉和露天温泉等特色项目,既能欣赏风景,还能在泡完温泉后品尝地方特色美食。

第三,以饮食养生为主题游项目。行程如到三亚、厦门等沿海地带品尝颇具海港风情风味的美食,还有寻味广州、顺德等地的粤式餐饮,上海、杭州、南京等地的苏杭菜式,以及重庆、成都等地的川式辣味等。

第四,以酒店康养为行程的休闲主题游,特色内容可包括:住度假酒店→体验休闲项目→下午茶,代表目的地有丽江、长沙、珠海等,对休闲娱乐项目的体验以及观海、看日出、赏花等自然风光的游览等,娱乐过后可返回酒店享受精致下午茶等。

在产品和服务升级上,可先把文化养生与生态养生相互融合作为未来发展的主题,在依托旅游地优美的自然风光的基础上,深度挖掘养生历史、地方特色或宗教养生文化等,让传统文化与良好的生态环境相结合,满足康养旅游者对观光、养生和求知的共同需求。其次,养生酒店的产品开发和服务提升应作为发展的主线,为了提升景区游客感知,应将温泉康养和饮食康养贯穿其中;酒店选址和定位方面可选择位置毗邻景区,房间设计上以自然主题为佳,突出景区特点;还可划分区域,设立功能型康养屋,配备不同的设施,如温泉疗养屋、生态或者特色饮食疗养屋等。

5结语

本文借助事理图谱理论与技术,以康养游记文本为实验数据展开研究。首先找出了康养旅游的热门目的地、热门游客行为过程,实现了与行程相对应的游客行为特征及偏好和趋势的发掘。结果表明,运用事理图谱可直观、较全面地描述旅游中的事件及事件之间的顺承关系,有利于揭示康养旅行的热门行程路线以及行程相对应的游客行为的起源、发生以及发展趋势,符合对康养旅游及其特殊性方面的探索需求,为旅游相关机构提供决策依据。本文也存在不足之处,如只选择了“康养旅游”进行分析,由于与其他旅游相比特殊性较多,实验结果可能会有所不同。另外,本文未能按照将关键顺序事件与其发生的具体景点以及体验感知结合起来等问题都是今后研究的方向。

参考文献

[1]吴恒,陈燕翎.基于UGC文本挖掘的游客目的地选择信息研究——以携程蜜月游记为例[J].情报科学,2017,35(1):101-105.

[2]赵军.知识图谱[M].北京:高等教育出版社,2018:138-140.

[3]Shi G,Barker K.Extraction of Geospatial Information on the Webfor GIS Applications[C]//IEEE International Conference on Cognitive Informatics and Cognitive Computing 2011,IEEE,2011:41-48

[4]Fujii K,Nanba H,Takezawa T,et al.Enriching Travel Guidebooks with Travel Blog Entries and Archives of Answered Questions[M].Information and Communication Technologies in Tourism 2016.Springer,Cham,2016:157-171.

[5]Hao Q,Cai R,Wang C,et al.Equip Tourists with Knowledge Mined from Travelogues[C]//Proceedings of the 19th International Conference on World Wide Web,2010:401-410.

[6]Xu H,Yuan H,Ma B,et al.Where to Go and What to Play:Towards Summarizing Popular Information from Massive Tourism Blogs[J].Journal of Information Science,2015,41(6):830-854.

[7]高原,施元磊,張蕾,等.基于游记文本的游客游览行程重构[J].数据分析与知识发现,2020,4(Z1):165-172.

[8]Zhu Z,Shou L,Chen K.Get Into the Spirit of a Location By Mining User-generated Travelogues[J].Neurocomputing,2016,204:61-69.

[9]Yuan H,Xu H,Qian Y,et al.Make Your Travel Smarter:Summarizing Urban Tourism Information from Massive Blog Data[J].International Journal of Information Management,2016,36(6):1306-1319.

[10]Guo L,Li Z,Sun W.Understanding Travel Destinations from Structured Tourism Blogs[C]//Proceedings of 2015 Wuhan International Conference on e-Business,2015:144-151.

[11]王昕天,汪雷.基于文本挖掘的在线旅游热词情报分析——以携程网为例[J].情报理论与实践,2017,40(11):105-109.

[12]吕琳露,李亚婷.游记文本中的知识发现与聚合——以蚂蜂窝旅行网杭州游记为例[J].情报杂志,2017,36(7):110,176-181.

[13]瞿华,梁燕坤.基于网络游记的广州旅游目的地形象感知研究[J].广东社会科学,2017,(6):202-209.

[14]张瑛,史凯静,刘建峰.基于网络游记的大运河文化遗产游客感知研究[J].地域研究与开发,2020,39(4):79-85.

[15]Ding X,Li Z,Liu T,et al.ELG:An Event Logic Graph[EB/OL].https://arxiv.org/abs/1907.08015,2019-08-07.

[16]单晓红,庞世红,刘晓燕,等.基于事理图谱的网络舆情事件预测方法研究[J].情报理论与实践,2020,43(10):165-170,156.

[17]白璐,周子雅,李斌阳,等.面向政治领域的事理图谱构建[J].中文信息学报,2021,35(4):66-74,82.

[18]夏立新,陈健瑶,余华娟.基于事理图谱的多维特征网络舆情事件可视化摘要生成研究[J].情报理论与实践,2020,43(10):157-164.

[19]田依林,李星.基于事理图谱的新冠肺炎疫情网络舆情演化路径分析[J].情报理论与实践,2021,44(3):76-83.

[20]Liu H Y.Causality Event Extraction[EB/OL].https://github.com/liuhuanyong/CausalityEventExtraction,2020-12-15.

[21]肖明.图书馆学情报学知识图谱研究理论、方法与应用[M].北京:中国书籍出版社,2017:154-155.

(责任编辑:郭沫含)