APP下载

基于献血队列研究的计量学可视化分析*

2023-12-02杜小安杨茹马梦迪柯颂庆许敬武汉血液中心湖北武汉430000

中国输血杂志 2023年10期
关键词:献血者队列发文

杜小安 杨茹 马梦迪 柯颂庆 许敬(武汉血液中心,湖北 武汉 430000)

随着“健康中国”战略的深入推进,我国医疗卫生服务正在从“以疾病为中心”向“以人民健康为中心”发生转变,贯彻落实“预防为主”的思想方针。 与此同时,与医疗卫生服务体系高质量发展的要求和人民群众对高水平血液安全供应需求相比,我国血液安全供应能力仍需提高。 一方面,人口老龄化现象不断加剧,年轻献血者健康问题越来越凸显,致使有意愿参与无偿献血的且符合献血健康征询要求的个体不多。 另一方面,输血是血源性疾病从一个个体传播到另一个个体的近乎理想的模式,输血传播感染风险仍不可忽视。此外,新发传染病不断出现也给血液安全带来不小的隐患。早在二十世纪八九十年代,国外学者们开始建立献血和输血数据库[1],其后一直更新完善数据库[2-3]。 该数据库被用于研究献血者的疾病风险、献血的健康后果、输血传播疾病、用血模式、输血患者的健康以及血液筛查的卫生经济学评价等方面。 队列研究作为1 种探讨疾病病因或健康影响因素、疾病自然史的流行病学方法,其论证强度较高,能较好地揭示因果关系,已有不少学者开展了献血队列研究。 在国外,开展献血人群的前瞻性研究较为普遍,而我国学者们大多数局限在横断面调查研究上,这可能不利于我国献血人群的健康研究及输血安全持续发展。 鉴于此,本文通过CiteSpace 工具,全面梳理和分析献血人群队列研究领域的研究热点、前沿和趋势情况,回顾性分析国外献血队列研究发展历程,梳理当前研究领域的热点主题和薄弱环节,为未来研究领域的拓展提供一定的参考与借鉴,为我国无偿献血事业的持续健康发展提供依据。

1 资料与方法

1.1 文献来源与检索策略 为探究建立献血人群队列研究的概况,本研究数据来源于Web of Science 核心合集引文索引数据库(以下简称“WOS 数据库”)。 限定字段为“主题”,检索年限范围不限,检索式分为两个部分,再进行组合检索(如表1 所示),共检索出746 篇文献。 设定语言为English,选取文献类型为Article、Review Article,排除会议论文、报纸新闻、学位论文等,然后阅读每篇文献的标题和摘要且剔除与献血人群队列研究无关的文献之后,最终获得672 篇文献(其中,研究型论文654 篇,综述类论文18 篇)。 检索日期为2023 年5 月24 号。

表1 文献检索式

1.2 数据转换与处理 将WOS 数据库中检索的数据以纯文本形式,导出文献所有完整记录,并重命名为“download_xxx.txt”形式。 运用Citespace 自带的“Remove Duplicates”功能对数据进行筛选清洗,将最终获得的1 644 篇文献导入Citespace 5.6 R5 软件。

1.3 研究方法

1.3.1 文献计量分析 利用WOS 数据库自带的统计分析功能得到以下结果:1)通过频数统计分析该研究领域的发文量趋势,以Excel 软件绘制;2)排名前10 位的作者及其发文量、总被引次数、篇均被引次数、h 指数(h-index);3)排名前10位的机构及发文量;4)排名前10 位的研究方向及其发文量。h 指数是重要的科学计量学指标,其中h 代表“high citations(高引用次数)”,可同时反映文献数量和质量信息。 一名科研人员的h 指数是指至多有h 篇论文分别被引用了至少h次。 h 指数越高,表明论文影响力越大。

1.3.2 文献可视化分析 Citespace 是1 款科技文本挖掘和可视化分析及知识图谱绘制工具软件[4],本文利用Citespace 5.6 R5 软件对文献关键词进行可视化分析,通过绘制关键词共现图谱、聚类图谱、突现图谱和文献共被引图谱,分析献血人群队列研究的热点、研究前沿和研究趋势。

2 结果

2.1 献血人群队列研究的发文量趋势分析 总体来看,国际上基于献血人群队列研究领域的发文量整体呈现平稳且略有上升趋势(图1)。 1991 年开始发表献血队列研究相关的论文共有8 篇,2009 年(12 篇)至2011 年(29 篇)、2019 年(22 篇)至2020 年(43 篇)发文量增长迅速,2021 年发文量达到了近年来的最高值(49 篇),这表明开展献血队列的研究工作,在近两年得到的关注有所增加。

图1 发文量变化趋势

2.2 献血人群队列研究的空间分布情况分析

2.2.1 学科分布 献血人群队列研究领域涉及临床医学、基础医学、生物学以及预防医学等多门交叉学科,其主要学科分布如图2 所示。 发文量排名前3 位的学科是“Hematology(血液学,154 篇)”、“Infectious Diseases(传染病学,81 篇)”、“Gastroenterology Hepatology (胃肠病肝病学,73 篇)”,总和约占全部学科发文量的45.8%。

图2 发文量排名前10 位的学科

2.2.2 作者及机构分析 如表2 所示,有4 位学者的发文量超过了15 篇,分别是Erikstrup C (18 篇)、Hjalgrim H (16篇)、Kaaks R (16 篇)和Ullum H (16 篇);在被引频次方面,Kaaks R (1301 次)、Rinaldi S (1186 次)、Riboli E (1130 次)位居总被引次数前3,结合h-index 的数据,说明这3 位学者的研究论文在献血队列研究领域具有较大的学术影响力,受到学术同仁的广泛认可。 发文量排名前10 位的机构(如图3)中,英国RLUK 图书馆(RLUK Research Libraries UK)、加州大学(University of California)、哥本哈根大学(University of Copenhagen)位居前3。 此外,在发文量排名前10 位的机构中,来自丹麦的研究机构占了3 家,除了哥本哈根大学(University of Copenhagen),还有哥本哈根国家血清研究所(Statens Serum Institut)和哥本哈根国立医院(Rigshospitalet)。

图3 发文量排名前10 位的机构

表2 发文量排名前5 位的作者

2.2.3 国家与地区分析 运用Citespace 软件,选择节点类型为“Country”,绘制国家/地区合作网络图谱(图4),共有591 个节点,910 条连线,672 篇文献共来自75 个国家和地区。 表3 列举了发文量排名前10 位的国家/地区,其中发文量排名前5 的国家/地区分别是美国(176 篇)、德国(64 篇)、法国(54 篇)、意大利(53 篇)和瑞典(52 篇)。 丹麦、荷兰和澳大利亚的发文量分别位列第8、第9 和第10 位,排在我国发文量后面,但中心性均大于0.10,说明这3 个国家虽在发文量上不及我国,但与国际上的合作及影响力均强于我国。我国学者最早在1997 年对1 875 名当地献血者的血清进行了前瞻性研究,用于开展抗丙型肝炎病毒抗体酶免检测筛查的成本-收益及其可行性分析[5]。 2022 年,杨江存等[6]也发表了文献介绍陕西省队列研究的建立概况,该队列研究是我国首次以献血者为研究对象建立的队列,以探索献血者与非献血者相比,献血是否对献血者的健康状况产生积极影响。 中国台湾地区学者们的研究主要集中在通过对献血者的血清抗-HCV 检测来了解丙型肝炎病毒的自然史及其影响因素[7-9]。

图4 国家/地区合作网络图谱

2.3 献血队列研究的知识基础 美国情报学家Small 于1973 年首次提出文献共被引的概念,作为测度文献间关系程度的1 种研究方法。 运用Citespace 软件,节点类型选择“Reference”进行文献共被引分析,帮助获取献血队列研究建立的重要经典文献知识。 文献共被引网络图谱(见图5)中节点数为1 014,连线数为2 502,被引频次较高的文献集中在1990 年前后。 在共被引网络图谱中,红色节点代表经过突发性检测(burst detection)识别的具有突变特征的论文,表明这些论文在短期内被大量发表,本研究的突变文献大多数也是被引频次较高的文献。 表4 列举了共被引频次≥10 次的文献,其中心性均小于0.1。

图5 文献共被引网络图谱

表4 文献共被引频次≥10 次的文献

2.4 献血人群队列的研究热点与演化趋势

2.4.1 关键词共现分析 一般认为,一些关键词同时出现在同一篇文献称之为关键词的共现。 两个或多个关键词在同篇文献中出现的频次越多,越能代表这些关键词所代表的主题关系密切,由此,进行关键词共现网络分析可以分析领域内的热点。 运用Citespace 进行关键词共现分析,节点类型选择“Keyword”,绘制关键词共现网络图谱(见图6),共709 个节点,2 395 条连线。 除“blood donor”、“donor”与检索策略相关的关键词以外,出现频次位居前15 位的关键词见表5。 其中,频次居首位的关键词是“prevalence(流行)”。 “infection(感染)”“antibody(抗体)”“disease(疾病)”“association(联系、关联性)”的中心性均大于0.10,说明这些高中介中心性关键词至关重要。

表5 出现频次排前15 位的关键词

2.4.2 关键词聚类分析 采用LLR 算法对关键词进行聚类分析,即将联系紧密的关键词聚集成1 个“簇”(即聚类),选出最具有代表性的关键词作为这个“簇”的聚类标签。 本研究共形成19 个聚类,聚类图谱(见图7)中模块值(Modularity Q,简称Q 值)=0.791 9>0.3,平均轮廓值(Mean Silhouette,简称S 值)=0.678 1≈0.7,表明此聚类结构显著且结果令人信服[10]。 对19 个聚类标签进行归纳总结发现,献血人群队列研究领域主要围绕以下3 个主题:1)经血传播疾病病原体血清流行情况:#0 liver disease(肝脏疾病)、#1 alloimmunization(异体免疫)、#2 association(关联性、联系)、#3 HIV(人类免疫缺陷病毒)、#7 seroconversion(血清转化)、#9 seroprevalence(血清流行率)、#13 atopy(特异反应性)、#18 chronic carriers(慢性带原者);2)献血者健康状况流行病学研究: #4 c-peptide(C 肽)、#8 interferon(干扰素)、#11 store(储存)、#12 inflammation(炎症)、#14 metabolic syndrome(代谢综合征)、#15 shbg(性激素结合球蛋白)、#16 follow up(随访)、#17 hyperhidrosis(多汗症);3)献血人群特征分类:#5 donor(捐赠者)、#6 male gender(男性)、#10 type 1(I 型)(表6)。

图7 关键词聚类图谱

表6 聚类群分析

2.4.3 关键词突现分析 关键词的突发性检测是指某一关键词的词频在短时间内激增[11],可以直接反映研究领域的热点前沿和发展趋势。 在关键词聚类的基础上,进一步对关键词进行突现分析(见图8)。 图中“Strength”代表突现的强度,“Begin”“End”分别代表突现开始、突现结束的时间,与图中红色部分的长度相对应。 图8 展示了献血人群队列研究领域前21 个突现词,其中突现强度最大的关键词是“non B hepatitis(非乙型肝炎)”;突现时间最长的有“non B hepatitis(非乙型肝炎)”“posttransfusion hepatitis(输血后肝炎)”“polymerase chain reaction(聚合酶链式反应)”“liver disease(肝脏疾病)”“serum(血清)”“donation(捐赠)”,跨度达11 年。“donation(捐赠)”“seroprevalence(血清流行率)”“donor(献血者)”“management(管理)”从突现开始一直持续至今,那么未来很有可能朝着与这4 个关键词有关的方向继续发展。

图8 关键词突现图谱

3 讨论

本文通过回顾WOS 数据库中关于献血队列研究发表的672 篇文献,发现献血队列研究的热度随时间的变化呈现平稳且略有上升的趋势。 根据作者和机构分析,来自德国癌症研究中心的Kaaks R 是献血队列研究领域最具有学术影响力的学者,与伦敦帝国理工学院的Riboli E、世界卫生组织国际癌症研究中心的Rinaldi S 等学者们合作紧密。 这些学者们主要以欧洲癌症与营养前瞻性研究(European Prospective Investigation into Cancer and Nutrition, EPIC)为平台,开展与癌症风险相关的血液反应标志物指标及其影响因素的研究[12-14]。 EPIC 研究[15]在欧洲10 个国家的23 个研究中心招募参与者,其中来自于意大利和西班牙队列的成员包括当地献血者协会的成员。 之所以纳入献血人群,可能有两个方面的原因:一方面,献血人群可看作表观健康人群纳入研究对照组;另一方面,国外献血者的血液标本(血浆和/或血清)储存时间较长,且易获得用于开展科学研究。

根据国家与地区分析图谱所见,美国、德国、法国、意大利、英格兰以及丹麦等国家/地区的合作影响力(中介中心性)均领先于其他各国,尤其是美国最为突出,说明30 多年来美国一直主导着献血队列研究的发展方向。 1989 年,在美国国家卫生研究院的资助下,美国血液中心建立了逆转录病毒流行病学捐献者研究(The Retrovirus Epidemiology Donor Study, REDS)[16],收集来自6 个不同血液中心的供者数据,其主要目的在于对在献血者中发现的HIV、HCV 和HBV 毒株进行分子监测、新发病原体研究以及开展一些国际血液安全研究项目。 与美国不同的是,丹麦的血液中心以医院为基础,哥本哈根大学医学院血液中心负责整个首都大区的血液检测、分配及控制,以全国人口健康数据为基础建立了大型献血者研究数据平台(the Danish Blood Donor Study,DBDS)[1-3],该数据库作为献血健康效应研究和公共卫生研究的平台。 国家监测是保障血液安全监测的关键,能够识别可能在地理上有差异的感染趋势。 但对于拥有超过1 个采供血机构的国家而言,建立献血队列用以监测研究往往相对复杂,其原因可能有:献血数据的机密性在一些国家受到高度保护;信息技术问题使得数据的整合变得有挑战性;成本可能在某些发展中国家也是1 种阻碍。 我国献血队列研究的发文量排在前10 位,但国际影响力却远远落后于美欧发达国家,可说是当前我国献血队列研究现状的反映。 20 余年来,我国已建成覆盖城乡的血站服务体系,形成以省级血液中心为龙头、地市级中心血站为主体、中心血库为补充的血站服务网络。 《全国血站服务体系建设发展规划(2021-2025年)》[17](以下简称《规划》)提出,血液中心、中心血站、中心血库、医疗机构之间衔接协作机制尚不完善,部分血液中心辐射带动作用发挥不充分,区域血液安全监测和联动保障有待强化。 此外,各省级血液中心、中心血站之间的合作研究较少,且研究内容不够深入、创新能力不强等问题较为突出。这些问题可能是导致我国献血队列研究类型单一、研究对象少、研究内容不深入等原因所在。 《规划》还强调,依托高水平省级血液中心建设区域血液安全中心,负责区域内血液安全风险监测、新发再发传染病血液风险监测预警等任务。 到2025 年,我国可能建成6 个区域血液安全中心,一旦建成将很可能整合区域血液数据,建立区域血液安全联动机制,加强我国区域献血队列研究合作,为血液安全预警等前瞻性研究迈出至关重要的一步。

通过文献共被引分析得到当前献血队列研究的知识基础。 1989 年Kuo 等[18-20]的研究表明HCV 是全球慢性非甲型非乙型病毒性肝炎(NANBH)的主要病因,此研究为在献血人群开展HCV 抗体检测以阻断大量经血传播疾病病原体的流行病学应用奠定了基础。 随后,1991 年Aach 等[21]的研究进一步通过对比试验证实了第二代免疫测定检测方法进行筛查可提高输血后肝炎患者和献血者丙型肝炎病毒感染的检出率。 1992 年Alter 等[22]研究了社区获得性丙型肝炎的自然病史。

综合关键词共现分析和聚类分析的结果,献血队列研究主要涉及3 类热点主题:经血传播疾病病原体研究方面,开展献血队列研究主要用于经血传播疾病病原体(如乙型、丙型肝炎病毒、人类免疫缺陷病毒等)流行的自然史研究、输血传播疾病病原体血液筛查、新发再发传染病血液风险监测、血清流行率研究、抗体检测开发等。 献血者健康状况流行病学研究方面,主要关注献血者铁储存及血红蛋白水平、慢性非感染性疾病血液指标筛查;献血人群特征分类方面,男性献血者得到更多关注。 根据关键词频次和聚类标签大小,我们发现献血队列研究大多数以输血传播疾病为研究主体,这也从侧面说明了有效监测献血者和输血受者之间可能存在的疾病传播成为血液警戒系统中的重要组成部分[1];其后开始关注到献血者自身的健康状况,表明了采供血机构正在努力扩大其在公共卫生服务体系中的作用,他们可能开展额外的疾病筛查和管理,包括心血管风险评估、糖尿病筛查等,保持社区健康的既得利益以维持源源不断的健康献血者。 尤其对男性献血者的关注越来越多,男性献血者的招募和保留在确保血液供应方面越来越重要,可能由于男性献血者比女性献血者更不可能因为医疗原因而被暂时延迟,例如低血红蛋白水平[23]或低体重(<50 kg)[24]。

关键词突现图谱显示,在不同的时间阶段,献血队列研究呈现出不同的问题。 从1991 年到2004 年,“非甲非乙型肝炎”“输血后肝炎”“肝脏疾病”“丙型病毒肝炎”以及“人类免疫缺陷性病毒”等关键词出现频率突增,成为输血传播疾病在献血人群中的研究热点。 1985 年,美国科学家Mullis 发明了聚合酶链式反应(polymerase chain reaction,PCR)技术,此后PCR 技术得到了生命科学界的普遍认同。 在乙型肝炎病毒被发现以后,很多国家的血库都对献血者实行了强制性的乙肝表面抗原筛查,以借助此措施降低输血后肝炎的发病率。 2001 年到2010 年,“危险因素”成为献血人群研究中突现强度最大的关键词。 在发现了各种输血传播疾病之后,紧接着寻找病毒传播感染的危险因素成为流行病学调查研究的重要环节。 在这一时间段内,“乳腺癌”突然出现。 通过阅读在此期间发表的文献,我们发现这些文献主要是以献血者作为健康对照组来开展乳腺癌的相关研究。 2017 年至今,“管理”一词成为献血人群研究中的前沿问题。 血液管理从采供的角度出发包含两个方面:一方面,加强采供血机构和血源管理,保证血液质量和安全。 同时,保障献血公民的健康,加强对献血者的健康管理。 另一方面,加强医疗机构临床用血管理,推进临床科学合理用血,保护血液资源,保障临床用血安全和医疗质量。

展望今后对献血人群的研究,可以重点围绕以下几个方面进行开展:一是要加强不同研究团队之间的合作,献血队列研究不是某一个单位或机构独立完成的,需要深化机构间、区域内的合作关系,利用各自的优势和资源,搭建起良好的合作平台,为献血队列的深入研究建立坚实的基础,同时也要加强与当地公共卫生部门的合作,尤其在一系列新出现的病原体的监测方面;另一方面,研究者可以着重从献血人群健康管理入手,分析探索围绕献血者自身可开展的健康状况、隐匿性疾病筛查等未来研究方向。

利益冲突:所有作者均声明不存在利益冲突。

猜你喜欢

献血者队列发文
[聚焦6·14]世界献血者日来临前,了解一下无偿献血流程吧
10条具体举措! 山东发文做好返乡留乡农民工就地就近就业
队列里的小秘密
基于多队列切换的SDN拥塞控制*
影响单采献血者保留的相关因素分析
在队列里
校园拾趣
爷孙趣事
以牙还牙
丰田加速驶入自动驾驶队列