APP下载

基于CiteSpace的鼻咽癌研究文献计量学分析

2020-09-11陈大洋宗曾艳熊丹王萌萌豆小文纪翔张秀明

肿瘤防治研究 2020年8期
关键词:词频鼻咽癌数据库

陈大洋,宗曾艳,2,熊丹,2,王萌萌,2,豆小文,纪翔,张秀明,2

0 引言

鼻咽癌具有独特的地理和种族分布。世界范围内鼻咽癌属于较罕见肿瘤,发病率仅为1/10万,但东亚及东南亚华人聚居地区发病率高达20/10万[1-2]。2013年的一项调查中发现鼻咽癌在中国的估计发病率和死亡率为3.09/10万和1.57/10万,男性的发病率和死亡率明显高于女性[3]。在调查的7个中国行政区中,南方地区的发病率和死亡率明显高于其他地区,具有明显的种族和地域分布特征[3]。鼻咽癌易发生淋巴结转移和远处转移,5年总体生存率为50%~70%[4]。目前放射治疗是首选的治疗方法,但经治疗后仍有1/3的患者局部复发[5]。鼻咽癌的发生机制目前仍不清楚,对鼻咽癌的发生发展、治疗、预后等研究已经成为肿瘤领域的重要内容。为全面了解鼻咽癌领域研究现状和最新进展,本文采用文献计量的方法分析了美国Web of Science(WOS)核心数据库2009—2019年鼻咽癌相关研究性文章,对文章的总体发展趋势、研究机构、引用文献、关键词和突现词五个方面进行分析,以期为鼻咽癌的研究提供借鉴。

1 资料与方法

1.1 数据来源

数据来源于美国WOS核心数据库,检索方式:标题为“nasopharyngeal carcinoma”or“nasopharyngeal cancer”or“nasopharyngeal neoplasms”,时间跨度2009—2019,文献类型为ARTICLE,语言为English,检索时间为2019年10月23日,共查询到4 962篇文献。这些文献在2009—2019年期间被引用频次总计62 424次,每项平均引用次数为12.58,h-index[6]为82,即至少有82篇文献被引82次。

1.2 统计学方法

用CiteSpace(version 5.5.R2)[7]和WOS数据库自带的文献统计工具对鼻咽癌相关文献进行梳理统计及可视化分析,并相互验证结果保证分析准确性。数据分析之前用CiteSpace对WOS格式的数据进行去重,去重后剩余4 841篇文献。根据研究内容不同,设置不同分析参数。

2 结果

2.1 发表年份分布

2009—2019年鼻咽癌相关文献发表量4 841篇,2009年收录了201篇文献,此后文献发表量呈现逐年上升趋势,尤其2013年后文献快速增长至2017年的622篇,2018年发表文献数据量较2017年减少22篇。截至2019年10月23日,2019年已发表文献561篇,见图1。

2.2 地理空间分布

基于CiteSpace软件,建立鼻咽癌研究地理合作图谱。中国以频次3 759位居世界首位,占总发表量的74.10%,具有绝对的优势。第2到第6名中除美国外均处于亚洲地区,这与鼻咽癌的发病特点相对应,见图2。从中介中心性(Centrality)来看,美国、中国、瑞典、法国排名前4,表明这些国家的研究成果更加受到其他国家的认可。

2.3 研究机构分布

图2 国家/地区的发表文献数量Figure 2 Number of articles published by different countries/regions

设定网络节点类型为“Institution”,构建研究机构的分布图谱。发文量前5的研究机构均位于中国南方鼻咽癌高发区。前三占了总发表文献数量的80.38%。中山大学以频次1108,占发表文献数量53.68%居首位,具有绝对高的研究实力。其次高产的机构依次是中南大学,占15.70%,香港大学,占11.00%,见图3。从中介中心性来看,中山大学(0.43),香港大学(0.21)和香港中文大学(0.18)排名前三,表明这3家研究机构的文章认可度较高。

图3 研究机构发表的文献数量Figure 3 Number of articles published by different institutions

2.4 被引用文献分析

文献被引频次可以较客观地反映该文献被学术界认可的程度。本研究利用WOS数据库中的“被引频次”标签进行排序可知,Lai等[8]2011年所著的《How does intensity-modulated radiotherapy versus conventional two-dimensional radiotherapy influence the treatment results in nasopharyngeal carcinoma patients?》引用率最高,紧随其后的是Lee等[9]2009年著的《Intensity-modulated radiation therapy with or without chemotherapy for nasopharyngeal carcinoma:radiation therapy oncology group phase Ⅱtrial 0225》。这两篇文章都围绕调强放疗技术(intensity-modulated radiotherapy,IMRT)治疗鼻咽癌的效果展开。这足以看出IMRT在鼻咽癌治疗方面被广泛应用。排名第3的是Lu等[10]2011年所著的《MiR-26a inhibits cell growth and tumorigenesis of nasopharyngeal carcinoma through repression of EZH2》。

2.5 研究热点分析

通过分析关键词词频和中心性来研究2009—2019年鼻咽癌的研究热点,使用CiteSpace,数据来源为“Title”、“Abstract”、“Author Keywords(DE)”、“Key words(ID)”,设定网络节点为 “Key word”,运行软件后得出关键词词频和中心性值。关键词在一定程度上可以代表一篇文献的研究内容。

本次分析词频最高的关键词是“nasopharyngeal carcinoma”,其次是“cancer”,因为这两个属于疾病名称,所以排除在外。其后排名前10的关键词,见表1。从中可知鼻咽癌的研究热点主要围绕以放射治疗、化疗为代表的鼻咽癌治疗方式研究;以细胞凋亡、肿瘤转移、生存分析、预后分析、EB病毒为代表的鼻咽癌致病机制研究。

表1 高频和高中心性关键词统计Table 1 Top 10 keywords with the highest frequency and top 10 keywords with the highest centrality

中心性指标用来衡量某个节点在网络中的重要性和与其他节点之间联系的密切程度。本次分析依然先去掉中心性值排名第1的“cancer”和第2的“nasopharyngeal carcinoma”。从其后排名前10的关键词中可以看到,前7个关键词主要围绕鼻咽癌相关的致病机制,后3个关键词围绕鼻咽癌的治疗方式。

聚类分析显示,鼻咽癌研究相关高频主题词主要聚类于4个类别,分别为不良预后(poor prognosis)、晚期鼻咽癌(advanced nasopharyngeal carcinoma)、临床靶区描绘(clinical target volume delineation)、异戊烯基异黄酮(prenylated isoflavone)。对应类别词频前100的关键词,见表2。

表2 高频关键词的共词聚类分析结果Table 2 Co-word clustering analysis of high-frequency keywords

2.6 突现词分析

基于CiteSpace的词频增长算法,将短时间内快速增长的专业词汇检测出来,分析研究领域的发展趋势。在2014—2016年期间预后因素为引用最强的突现词。鼻咽癌患者的治疗效果可能受多因素影响,通过临床随机研究与回顾性研究,明确影响鼻咽癌患者生存率的预后因素,有助于临床医生选择更合理地治疗方案,提高患者生存率[11-13]。最近两年研究的突现词为侵袭、通路,说明研究方向更关注鼻咽癌相关的机制研究,可能在鼻咽癌细胞侵袭和各类生物学通路层面有新的发现,见图4[14-16]。

图4 鼻咽癌研究相关突现词出现的年度排序Figure 4 Annual ranking of keywords with the strongest citation bursts related to nasopharyngeal cancer research

3 讨论

本文用文献计量学方法对WOS数据库中有关鼻咽癌的文献进行分析,发现文献发表数量随时间的变化呈上升趋势,并在2017年达到高峰,2018年有略微下降,预计2019年与2018年持平,说明鼻咽癌研究发展比较迅速,在肿瘤领域关注度越来越高。从研究国家、地区来看,受鼻咽癌患者地理分布的影响,中国在该领域的发文数量远高于其他国家,在鼻咽癌研究领域做了很多工作,与之前的报道[17]中以美国发文量最多的结论不同,原因可能是数据库不同,所收录的文献来源地区不同造成的。中国的研究机构主要聚集在南方地区,尤其在鼻咽癌高发生率的广东省,中山大学在文章发表量方面遥遥领先。聚类分析显示,不良预后和晚期鼻咽癌为两大研究热点。与不良预后相关的关键词主要围绕鼻咽癌的转移、复发、扩散等导致患者死亡的因素展开,不良预后生物标志物的研究也有相关报道[18-20]。与晚期鼻咽癌相关的关键词包括辅助化疗、IMR(intensity modulated radiation)、随机试验等,可见这类研究主要从晚期鼻咽癌的治疗策略展开,人们对鼻咽癌的关注已从病因诊断逐渐转移到预后、治疗等方向,希望能找到有效治疗方式,提高鼻咽癌患者的生存率。值得注意的是,被引文献频数第三的是关于miRNA的报道,研究发现miR-26a可显著降低鼻咽癌细胞中癌基因EZH2的表达,抑制细胞生长和肿瘤发生,表明与鼻咽癌相关的miRNAs也将会越来越受到关注[10]。

基于关键词分析可知目前的研究热点是:鼻咽癌的治疗方式;鼻咽癌细胞的侵袭、凋亡、扩散等生物学活动;鼻咽癌患者的预后因素研究。从关键词中心性来看,研究者之间相互认可的内容集中在鼻咽癌致病机制方面。从聚类结果来看关键词主要分为两个类别:预后因素和晚期鼻咽癌,这两个也是研究热点领域。从突变词来看,近两年新增的研究主要围绕细胞侵袭和各类生物学通路,以期能发现更有效的治疗手段。

综上所述,本文通过系统分析WOS数据库中有关鼻咽癌的文献,多维度展示了近10年的研究成果,可为研究者未来的课题布局和决策提供参考依据。

猜你喜欢

词频鼻咽癌数据库
非编码RNA在鼻咽癌转移中的研究进展*
基于词频比的改进Jaccard系数文本相似度计算
保守与手术治疗鼻咽癌放疗后慢性鼻-鼻窦炎的疗效比较
中医药治疗鼻咽癌研究进展
词汇习得中的词频效应研究
数据库
数据库
数据库
数据库
EB病毒miR-BART4*和miR-BART18-3p在鼻咽癌中的表达及意义