APP下载

2016—2021年全球结核研究现状及热点:基于VOSviewer的可视化分析

2022-04-16吴利俊王钰琛张文宏

复旦学报(医学版) 2022年2期
关键词:结核结核病聚类

李 杨 吴利俊 王钰琛 应 峻 张文宏

(1国家传染病医学中心,复旦大学附属华山医院 上海 200040;2上海市传染病与生物安全应急响应重点实验室 上海 200040;3复旦大学图书馆 上海 200433;4复旦大学文献信息中心 上海 200433)

结核病是由结核分枝杆菌感染引起的慢性传染病。世界上近四分之一的人口、约17亿人身上潜伏着结核分枝杆菌感染,一生面临罹患结核病的风险[1]。2020年全世界估计有990万例新发结核病患者,因结核病死亡的人数高达150万[2]。

中国是30个结核病高负担国家之一,2020年估计有84.2万例新发结核病患者,占全球总数的8.5%,预计发病率为59/10万[2]。肺结核作为我国乙类法定报告传染病,经呼吸道传播,对公共卫生产生持续威胁。贫困和生活条件恶劣是导致结核病患病的高危因素。而结核病又导致和加剧了不良健康和贫困的循环,给家庭、社区和国家带来了潜在的灾难性社会和经济后果。

为了应对结核病的严峻疫情,联合国将结核病流行状况以及如何终止其流行的讨论提升至国家元首和政府首脑级别,WHO设定了2030年消除结核病流行的具体目标。目前的结核病发病率离消除流行的目标仍有很大的距离,消除结核病的研究长期进展缓慢。为了推动结核病领域后续研究,本文以结核病高被引论文和热点论文作为基础,深入探究国际结核领域科研进展,以可视化形式揭示结核病研究发展趋势,以期为科研人员、临床医师、公众和政策制定者掌握该病特点和研究现状提供参考。

为了尽可能纳入结核病领域高影响论文和研究,本研究选择全球最大、覆盖学科最多的综合性学术信息资源平台Web of Science数据库作为研究工具,该数据库收录了自然科学、工程技术、生物医学等各个研究领域最具影响力的学术期刊,具有较高的代表性和权威性,其用于评价期刊影响力指标的影响因子(impact factor,IF)已成为国际上期刊评价的重要指标。为兼顾文献计量分析的科学性和数据展示的可视性,本研究选择了VOSviewer软件作为文献数据处理软件。

资料和方法

数据来源本研究基于Web of Science核心合集数据库,选择标题和主题检索途径,设置检索词为tuberculosis、Koch's Disease和TB,文献类型为研究论文(article)或综述(review),文献索引时间设置为2016年1月1日至2021年11月18日,文献检索时间为2021年11月18日。

数据清理将Web of Science核心合集数据库中的命中文献以纯文本格式导出“全记录与引用的参考文献”数据,并导入VOSviewer软件进行关键词共现的聚类分析,将文献中的作者关键词提取到Excel表格,针对关键词存在单复数、同义或近义词、缩写等情况,通过两名专业人员分别对关键词进行干预处理,并彼此验证核实的方式,反复对关键词进行清理,例如将MDR、multi-drug resistance、

multidrug-resistant TB、 multi-drug-resistant tuberculosis、MDR TB、MDR-TB、multidrug resistant tuberculosis等十余个关键词合并为multidrug-resistant tuberculosis,从而保证最终获得合理、准确的关键词词频统计和聚类分析结果。

数据分析InCites数据库创立于2011年,是基于Web of Science核心合集引文数据所建立的科研评价平台,涵盖多个学科,并预设了8个重要文献计量评价指标,能够全面深入地分析不同国家/地区、机构、人员和研究领域的科研表现[3]。VOSviewer是一款科学知识图谱软件,由荷兰莱顿大学科技研究中心Van Eck和Waltman研发,能够在文献关键词构建共现矩阵的基础上进行聚类分析,并获得聚类标签图谱,从而以直观可视的方式展现不同的聚类主题[4]。ESI数据库高被引论文是领域内高水平论文的代表,被定义为近10年来每个研究领域中被引频次排名位于前1%的论文。针对高被引论文的具体内容进行挖掘和分析,有助于提炼学科研究的热点,也能够指引学科的发展方向[5]。因此,本文以2016—2021年全球结核相关的研究论文和综述作为样本数据,基于InCites平台作为评价工具,并以VOSviewer作为可视化工具,分析本领域的总体发文情况、高被引论文、主要研究国家/地区、重点研究领域,并进行主题聚类分析,再基于主题聚类结果,对领域内高被引论文的内容深入分析,从而凝练出结核领域内近年的研究热点。

结 果

年度发文情况分析截至检索时间,共检索到文献22 264篇,其中研究论文(article)19 892篇(89.35%),综述(review)2 372篇(10.65%)。年度发文情况如图1所示,可以发现2016—2021年期间,全球结核相关研究的发文数量呈相对平稳趋势,因数据采集时间截至2021年11月18日,故图中2021年的出版数据比实际数值低。

图1 2016—2021年结核相关年度发文情况Fig 1 Papers published annually in TB area during 2016-2021

高被引论文分析截至调研时间,获得本领域ESI高被引论文共77篇,总被引频次为14 186,篇均被引频次为184.23,其中作者署名中包含中国机构(包括大陆地区和香港地区)共9篇(11.69%)。全球排名前10位的高被引论文主要信息如表1所示。高被引论文讨论内容聚焦在结核病新的治疗药物[6]、结核病及潜伏结核感染疾病负担[1,7]、深度学习技术在肺结核影像学中的应用[8]、结核感染转录组学特征[9]和结核病临床诊治指南。

表1 2016—2021年被引频次排名前10位的结核相关论文Tab 1 The top 10 most frequently cited papers in TB area during 2016-2021

国家/地区分析由于InCties平台根据作者所属机构来标引文献所属国家或地区,因此同一篇论文如果存在合作,可能会被标注2个或以上的国家或地区。通过对纳入文献的国家/地区进行统计分析,发现全球共有187个国家/地区有发文贡献。发文量排名第一的是美国(5 026篇,22.57%),篇均被引频次12.55,中国大陆地区排名第三(3 116篇,14.00%),但篇均被引频次仅6.38,相对较低。其他发文量排名靠前的国家/地区见表2。

表2 2016—2021年结核相关发文量排名前20位的国家/地区Tab 2 The top 20 countries/areas in the quantity of publishing TB papers during 2016-2021

重点研究领域分析基于InCites平台对每篇发文所属的研究领域进行标记,发现结核相关发文涉及190个领域。发文量排名前10位的研究领域为感染病学,微生物学,免疫学,呼吸病学,公共、环境和职业卫生,药理学和药剂学,生物化学和分子生物学,研究与实验医学,热带医学,药物化学(表3)。

基于纳入样本的发文数量、被引频次和学科规范化的引文影响力分别作为横坐标、纵坐标以及气泡大小衡量标准,我们进一步绘制了发文量排名在前20位的研究领域散点图(图2),以直观展示目前具有一定影响力的研究领域。可见感染病学、微生物学、免疫学和呼吸病学是目前最有影响力的4个研究领域。中国大陆地区在这4个领域发文量分别为714篇(13.25%)、526篇(13.54%)、441篇(14.78%)和237篇(7.96%),论文的篇均被引频次分别为6.35、8.25、8.83和7.83。

图2 2016—2021年发文量排名前20位的研究领域散点图Fig 2 The scatter diagram of top 20 research areas in the quantity of publishing TB papers during 2016-2021

关键词共现及主题聚类分析用VOSviewer软件对纳入文献的关键词进行提取和统计,发现共有26 401个关键词。首先筛选出现频次超过4次以上的关键词,获得2 872个(10.88%),进一步通过人工干预方式对关键词进行合并等处理,获得关键词统计频次结果,排名前20位的主要关键词如表4所示。可见耐多药结核病及耐药结核病频次排名分列第3和第7,是结核病最受关注的领域。耐多药结核病不足60%的治疗成功率引起全球的持续关注和研究兴趣,是目前结核病防控的重点和难点[10]。合并HIV感染、潜伏结核感染在结核病领域亦备受关注。前者是全球极为重要的公共卫生问题,后者是个巨大的结核储蓄池。据估计,目前全球范围内有17亿结核潜伏感染人群[1]。其他研究热点包括结核病诊断及治疗、儿童结核、以Xpert MTB/RIF为代表[11]的快速分子学诊断、肺外结核等。

表4 2016—2021年间结核相关研究出现频次排名前20位的关键词Tab 4 The top 20 frequent key words of TB research during 2016-2021

我们进一步选取出现频次排名靠前的500个关键词进行聚类分析,共获得10个聚类簇。表5显示了聚类簇的标签和总共现频次(total link strength)。图3是关键词共现的10个聚类簇的可视化分析结果,在图中重点标注了其中6个聚类簇,所得不同聚类由不同颜色表示,节点标签越大表示关键词出现频次越多,基于聚类结果可以获得领域内主要研究主题。(1)聚类1#:红色区域主要围绕结核病作为一种疾病的相关科学问题,包括诊断、治疗、合并症(如HIV)等,疾病负担亦是该区域的重要组成部分。准确评估疾病负担是正确开展消除结核病流行战略并进行及时调整的先决条件,也是结核病研究的重点方向。因此,该区域突出的关键词还包括中国、南非、印度等结核高负担国家。(2)聚类2#:绿色区域主要是围绕结核分枝杆菌的基础研究,围绕结核分枝杆菌与巨噬细胞之间相互作用的研究能为有效杀灭结核分枝杆菌和研制新疫苗提供科学依据,亦是重要方向。(3)聚类3#:深蓝色区域主要涉及儿童结核和肺外结核病。由于肺外结核临床诊断十分依赖免疫学技术,因此该聚类中突显关键词中也包括了评估结核感染免疫状态的各类技术手段如γ干扰素释放试验、结核菌素皮肤试验等。(4)聚类4#:黄色区域以肺结核为主,关键词包括培养、痰涂片等。(5)聚类5#:紫色区域围绕耐药结核病展开,其差强人意的治疗成功率不断刺激新技术和新药物的发展。因此,突出关键词可看到全基因组测序、贝达喹啉、氟喹诺酮类等。全基因组测序已经从科研领域迅速发展成为临床实践中的重要工具,用于指导结核病防控过程中的所有环节:结核病诊断、分子耐药预测、公共卫生监测等[12]。而贝达喹啉、氟喹诺酮类药物是近年来耐药结核病治疗的核心药物[13]。(6)聚类6#:浅蓝色区域的聚类标签为抗结核治疗,这部分研究内容一方面与结核病基础研究(聚类2#)密切相关,同时又服务并指向耐药结核病(聚类5#)的研究进展。突出关键词包括分子动力学模拟、分子对接等。

图3 2016—2021年结核相关研究关键词共现网络视图Fig 3 Network view of key words co-occurrence in TB research during 2016-2021

表5 2016—2021年结核相关研究关键词共现聚类簇Tab 5 Co-occurrence analysis of thekey wordsin TB research during 2016-2021

讨 论

近年来结核病的防控仍面临巨大压力,特别是新冠疫情凸显了呼吸道传染病对公共卫生健康的重要性,激发了各国学者新的研究热情。本文采用文献计量学的方法对近六年的结核病相关文献进行分析,总结出该领域近年研究现状和热点:

一、从目前结核领域发文特征,可以发现近两年结核领域研究进度明显放缓,推测与新冠疫情有关。正如WHO《全球结核报告》所阐述,新冠疫情有可能使结核防控倒退5~10年。事实上,中国在结核病消除上曾经有过骄人成就,在2003年非典型肺炎(SARS)疫情后中国加大了对重大传染病的防控力度,提前5年超额实现了联合国千年发展目标(2015年结核病患病率和死亡率在1990年的基础上下降50%),并从结核病高发病率国家转变为中发病率国家。而今新冠疫情的流行使得传染病的控制再次成为重要议题。目前中国的公共卫生安全完全可以与消除结核病工作协同发展,有力实施消除结核病的干预措施,加速实现结核病可持续发展目标。

二、美国、印度、中国大陆地区、英国和南非是全球结核领域发表数量最多的5个国家(地区),其中印度、中国大陆地区和南非是结核病高负担国家。为加快结核病科学研究进程,需要扩大结核病研究活动范围并提高其质量,鼓励不同国家研究人员围绕需求驱动的研究课题开展协作,并利用高效网络实现成果和信息共享。

三、结核研究方向包括感染病学、呼吸病学、微生物学、免疫学、公共卫生等多个方向,其中感染病学发文量最多。提示结核病本质仍是结核分枝杆菌感染机体所引起的疾病,且前四个方向在目前仍具有较大影响力,而结核的公共卫生研究未得到足够关注。呼吁政府相关层面进行结核病防控的资源整合和顶层设计。结核病不仅是临床疾病,也与多种社会因素高度相关,易引发公共卫生危机,因此迫切需要政府和相关组织在公共卫生领域增加资金投入,创造良好的防治环境。

目前,各类新技术、新工具和新药物的开发正在蓬勃发展,为补充结核病研发管线作出了巨大努力。然而,要使其服务于公共卫生利益,还需要加大产品后期研究阶段的投入,以优化其传播,转化为国家政策和现场实践。因此,我们拟从结核疫苗、潜伏结核管理、诊断、治疗四大环节对结核病研究的未来进行展望:

首先,结核疫苗的研发仍需持续推进。推广COVID-19疫苗接种的初步经验表明,要快速控制疫情,疫苗与实施策略同等重要。这个经验同样适用于防控结核病。针对成人提供有效保护的结核疫苗研发工作已历尽多年,但大多失败。目前主要有两项研究较有前景:一项是针对南非开普敦地区所开展的H4:IC31亚单位疫苗和卡介苗复种的Ⅱb期研究中,对青少年进行卡介苗复种可能保护其免受持续性结核分枝杆菌感染[14];另一项是疫苗M 72/AS01E(葛兰素史克)的Ⅱ期和Ⅲ期临床试验分别证实其良好的免疫原性和安全性,且该疫苗接种后3年内预防从感染到发病的有效率达50%及以上[15-16]。增加主动免疫是减少药物使用、继而避免药物耐药的重要手段,不能期望依靠一种疫苗解决所有问题。未来不仅需要新的结核疫苗,也需要针对不同年龄、不同疾病背景的接种方案。中国目前结核感染患者以老龄、复发结核为主,因此感染后预防以减少潜伏感染的活动比预防结核感染本身更为重要。另一方面,由于潜伏性结核病感染无法测定感染菌株的药敏性,使得耐药性感染的预防性治疗变得复杂,而通过疫苗接种或可获益。

第二,潜伏结核管理仍需加强。目前全球约四分之一人口为潜伏结核患者,对他们的科学管理是全球消除结核病流行的重要组成部分。高风险人群LTBI筛查与预防性治疗是2035年消灭结核战略的重要举措。WHO推荐在HIV、密切接触人群等高危人群中进行预防性抗结核治疗,但如何平衡预防治疗的有效性及药物相关安全性一直是难题,也是影响患者依从性的重要原因。既往推荐异烟肼单药治疗,但该方案疗程较长,药物性肝损伤等不良反应较多。因此,各大团队针对如何提出更加有效、安全的结核病预防性治疗方案正展开系列研究。相关进展主要为包含利福霉素类药物的超短程方案出台。3个月每周一次利福喷丁联合异烟肼的方案已被广泛应用[17];4个月利福喷丁的方案被证明疗效不劣于6个月异烟肼方案,而安全性更佳[18];短至1个月每日一次利福喷丁联合异烟肼的方案也正在开展实施,其安全性及有效性都较理想[19]。联合国制定了2018—2022年5年3 000万例结核病预防治疗目标,相信预防治疗方案的不断改良可以早日实现该目标,大幅度增加全球预防治疗的覆盖率。另一方面,潜伏结核患者的管理需要特别关注重点人群,逐步建立防控合作机制,尤其是加强与艾滋病治疗规划的整合与协作。

第三,如何通过快速分子诊断高效发现结核病例有待优化。结核分枝杆菌分子生物学诊断方法的革新是近十年结核病诊断领域最突出的进展之一。以Xpert MTB/RIF和Xpert MTB/RIF Ultra为代表的快速分子学诊断彻底改变了结核病发现和诊断模式[11]。Xpert MTB/RIF能同时检测结核分枝杆菌和利福平耐药(rpoB),不仅结果准确可靠,且 结 果 报 告 时 间 短(通 常<2 h)[20]。Xpert MTB/RIF Ultra是2017年WHO推荐使用的新一代检测方法,较Xpert MTB/RIF显著提高痰涂片阴性结核患者和肺外结核的检出率[21]。数十年以来,结核病确诊主要依靠痰涂片和痰培养,前者快速但敏感性不高,后者敏感但耗时太久。而快速分子诊断可以在富有挑战性的环境中扩大主动发现病例的规模,在与病原体的斗争中领先一步。这种“早识别、早诊断、早治疗”的防控策略与我国新冠疫情防控的成功经验不谋而合。因此,加快实验室服务建设,将结核病快速分子检测整合到疾病控制中将是未来实现终止结核病流行的关键环节。

最后,活动性结核病,特别是耐药结核病的治疗困境仍待解决。活动性结核病的治疗是结核病防控的核心与基石,也是结核病研究最受关注的领域[6]。目前耐药结核病治疗进展主要体现在两大趋势:首先是以缩短疗程为导向的治疗策略推广。2010年孟加拉方案出台,开启了耐多药结核病短程治疗时代,该方案成功地将疗程缩短至9~11个月、治疗成功率提高至87.9%[22]。在此基础上,耐多药结核病首个短程治疗的随机对照研究——STREAM研究结果于2019年正式出炉,证实9~11个月治疗方案在疗效和安全性上与20个月长程方案相当[23]。其次,淘汰注射剂的全口服方案成为第二个重要变革。2018年WHO将氟喹诺酮类(fluroquinolones)、利奈唑胺(linezolid)、贝达喹啉(bedaquiline)正式提高到A组核心药物[24],代表全口服治疗时代的到来,长期以来由于备选药物有限,耐多药结核病治疗离不开漫长的注射剂治疗。但随着贝达喹啉、利奈唑胺、德拉马尼、PA-824等更多强效杀菌药物的出现,全口服治疗方案得以实现[13]。融合以上两大趋势,目前十数个前瞻性临床研究正在对各种全口服短程方案进行探索,包括Nix-TB 研 究 (NCT 02333799)[25]、 TBPRACTECAL研究(NCT 02589782)、NeXT研究(NCT 02454205)和STREAM研 究(第2阶 段)(NCT 02409290)等;在我国,由国家传染病医学中心复旦大学附属华山医院团队牵头的全口服短程方案的随机对照试验(TB-TRUST)、首都医科大学附属北京胸科医院主持开展的含贝达喹啉治疗耐多药结核病短程新方案的多中心随机对照研究等,亦受到国际关注[26]。尽管围绕耐药结核病治疗的研究较之前有了数量和质量的提升,但高水平临床研究(随机对照试验)仍屈指可数,重要原因之一是研发支出的明显匮乏。近年来制药公司在结核病研究和创新方面支出比例逐步下降。因此,有必要将新的资源和供资模式引入结核病研究领域,以建立更广泛、更多样化的基础和平台;另一方面,应在高负担国家积极开展实施性研究,以临床研究形式开展患者管理,并对项目数据进行持续评价,为治疗指南的更新提供不断叠加的证据。

综上所述,本文针对结核病近六年来的国际研究特征及演化进行了分析,获得了一定研究成果。本研究局限性在于为了保证数据的规范性,仅检索了Web of Science数据库文献,数据缺乏一定完整性;其次,以英文文献为数据源,未纳入中文文献等其他非英文文献,研究成果欠全面。期待未来更多研究整合不同国家英文及非英文文献结果,总结各国自身结核病研究特点,提出符合各国自身国情的结核病防控策略。

结核病在我国负担之重、情况之复杂不亚于新冠肺炎。但作为一类呼吸道传染性疾病,结核病与新冠肺炎一样,遵循流行病学的基本规律。想要实现2030年前实现全球终止结核病流行的目标,只有大幅扩展工作,并形成可持续发展机制,从多个环节合力推动政策改革和实施。

作者贡献声明李杨 数据整理,前沿分析,论文撰写。吴利俊 文献查阅,数据分析,论文撰写。王钰琛 数据查阅,论文撰写。应峻 研究设计,数据分析指导,论文修改。张文宏 研究设计和指导,论文修改。

利益冲突声明所有作者均声明不存在利益冲突。

猜你喜欢

结核结核病聚类
一种傅里叶域海量数据高速谱聚类方法
艾滋病合并结核病的诊断和治疗
生命至上 全力投入 终结结核
贵州省结核病定点医院名单
基于数据降维与聚类的车联网数据分析应用
个性化护理对结核患者肺结核知识知晓率的影响
基于模糊聚类和支持向量回归的成绩预测
长得丑?但价值无限!
背上长“包”,小心结核作怪
为什么全球结核病人数增多