人工智能如何改变指南的未来

2021-02-03陈耀龙罗旭飞史乾灵王健健高东平商洪才杨克虎

协和医学杂志 2021年1期

陈耀龙，罗旭飞，史乾灵，吕萌，周奇，王健健，杨楠，高东平，杨书，商洪才，杨克虎,4,5

1兰州大学公共卫生学院，兰州 730000 2兰州大学健康数据科学研究院，兰州 730000 3兰州大学基础医学院循证医学中心，兰州 730000 4世界卫生组织指南实施与知识转化合作中心，兰州 730000 5Cochrane中国协作网兰州大学分中心，兰州 730000 6兰州大学第一临床医学院，兰州 730000 7中国医学科学院北京协和医学院医学信息研究所/图书馆，北京 100020 8成都中医药大学，成都 610075 9北京中医药大学东直门医院中医内科学教育部和北京市重点实验室，北京 100700

在医学领域，人工智能(artificial intelligence，AI)目前不仅被广泛应用于辅助诊断、治疗选择、风险预测等[1]，还被引入循证医学(evidence-based medicine，EBM)领域，用于系统评价和临床实践指南(下文简称“指南”)的制订、评价、传播与实施等[2-3]。虽然目前该领域很多方面仍处于理论探索阶段[4]，但进展迅速，未来可期。本文通过分析AI在指南中的应用现状，探讨如何通过AI缩短指南的制订周期，提高其制订效率，创新其传播与实施模式，并对促进AI与指南领域的有效结合提出思考与建议。

1 人工智能在临床实践指南领域的发展

美国食品药品监督管理局迄今已批准29款AI相关医疗产品[5]。尽管AI在医学领域的应用取得了一系列较为重要的成果，但其在指南领域的应用仍处于起步阶段。目前国际上AI与指南结合的领域主要集中在模型、算法及工具的开发方面，其相关方法已在指南的制订、评价、传播与实施等某些环节小范围内试用，常用的算法和技术包括朴素贝叶斯法和决策树等。表1列举了近年来AI在指南领域应用的重要事件及进展情况。

表1 人工智能在临床实践指南领域应用的重要事件

我国相关研究人员已在该领域开展积极探索。2013年，李博等[6]基于语义关系，将高血压指南文本转变为临床实践指南知识库，以提高指南的转化和利用；2019年，罗旭飞等[4]将AI在指南领域的应用现状和发展进行了概况评价，结果显示来自美国、澳大利亚、英国和加拿大的研究居多，但大部分研究仍停留于理论探索和算法的验证阶段；2020年，蒲晓蓉等[7]提出了一种基于机器学习的计算机辅助智能分析方法，自动分析不同版本《新型冠状病毒肺炎诊疗方案》的异同。此外，北京大学第三医院开发的EBM AI-Reviewer(http://www.ebm-easyreviewer.com/login)，致力于协助系统评价人员快速筛选文献。

2 人工智能与临床实践指南的结合

2.1 人工智能在指南制订中的作用

AI应用于指南制订领域，旨在缩短指南的制订时间、提高制订质量、优化和加速整个制订流程，现就其中较为重要的5个方面展开阐述。

2.1.1 筛选临床问题，确定指南领域

关于研究选题的确定，传统方法主要依靠研究人员的经验。随着AI的发展，Chen等[8]采用结构主题模型(structural topic modeling，STM)与文献计量分析相结合的方法，从近十年AI辅助人脑研究的6317篇文献中自动识别突出的研究主题，通过对主题趋势、相关性和集群的分析，以及对其在有影响力的国家/地区和研究机构中多样化分布的描述，揭示了有研究前景的主题方向。

关于临床问题的遴选，传统方法一般需耗时数月，对临床一线医务人员进行多轮调查后方可完成，但AI技术可对数据库或网络上已有的相关临床问题进行快速分析，自动筛选出高频问题清单，作为指南拟解决问题的重要参考。AI可对已发表的指南、系统评价及临床研究进行快速、全面的文献扫描和分析，发现指南与研究领域的关联分布，以及指南与临床问题的涵盖关系。

2.1.2 寻找合适专家，管理利益冲突

关于指南专家的遴选，传统方法多采用“方便抽样”，而AI有助于查找到最适合参与指南制订的成员，特别是在专业、地域、性别等方面更具代表性。同时，可借助算法分析出每位专家潜在的利益冲突。如AI通过对不同渠道信息和数据的关联分析，可发现某专家多次出席某企业产品的推广活动或其直系亲属与医药企业关系密切，指南利益冲突管理委员会可以此作为其存在潜在利益冲突的证据。Graham等[21]使用机器学习法对159种期刊发表的128 781篇文章的利益冲突进行分析，发现有商业利益关系的期刊更有可能发表存在利益冲突的文章。

2.1.3 进行研究合成与评价

使用自动化软件可极大缩短系统评价制作过程中文献检索、筛选及质量评价等过程的周期[22-23](表2)；国际系统评价自动化小组(International Collaboration for the Automation of Systematic Reviews，ICASR)提出的系统评价自动化维也纳原则[19](表3)，为AI加速系统评价制作指明了方向。此外，为方便读者选用合适的自动化工具，Marshall等[24]于2015年建立了系统评价制作工具箱(systematic review toolbox)，用户可登录网站进行文献搜索和选取。AI技术的应用使系统评价的制作周期缩短至几天甚至几个小时。Clark等[22]使用自动化技术，仅用2周时间完成了一篇评估患者增加液体摄入量对泌尿系统感染(urinary tract infection，UTI)的复发、抗菌素的使用及UTI症状影响因素的随机对照试验的系统评价。

表2 系统评价中的自动化工具汇总[22-23]

表3 系统评价自动化维也纳原则[19]

2.1.4 形成当前最优推荐意见

传统方法制订的指南推荐意见，主要依靠专家对干预措施的安全性、有效性、成本、可实施性及患者意愿等进行综合分析后得出。然而，在指南制订过程中是否对这些因素进行了全面考虑，以及各因素之间相互作用对指南造成影响的系统考量，是传统方法的主要局限性。AI可以在更广阔的视野下对相关数据进行挖掘和分析，为制订者提供更全面的有效信息，协助制订者更好地平衡干预措施的利弊，形成对患者最优的推荐意见。

2.1.5 改编和更新指南

传统依靠人工更新指南的方法，已满足不了对最新文献的跟进与整合。借助AI可推断出最佳证据的出现时间，协助完成指南的及时更新，并确定指南中推荐意见最适合的实施环境。特别是随着动态指南(living guideline)的出现，指南更新的频率和要求越来越高[25]。如关于新型冠状病毒肺炎的文献已超过20万篇，占2020年所有文献的4%。新型冠状病毒肺炎指南的更新频率已从每月缩短至每周甚至实时[26]。AI可对新文献进行更快速和更高效地监测和遴选；另一方面，还可帮助缺乏指南制订能力的国家改编现有的指南[27]。与指南的制订过程不同，指南的改编需评估已有的指南推荐意见，以及与本地区人群和临床环境的匹配性，通过AI提供更为全面的当地数据，可协助指南改编人员，作出更合适的推荐意见。

2.2 人工智能在指南传播与实施中的作用

当前指南传播与实施最常用的方法为媒体、期刊或学术会议宣传等，通过多种途径让使用者知晓指南，进而应用于临床实践。研究显示，这种模式花费时间较长，从指南发布到被指南使用者知晓和应用，需数月甚至数年不等[28]。应用AI技术，则可将该过程明显缩短。AI技术将指南中的推荐意见整合至电子病历(electronic medical record，EMR)系统中，通过OpenMRS及DHIS2等开源EMR平台，进一步加速了指南信息的传播，惠及更多医疗资源匮乏的机构或地区[29-30]。此外，研究显示，美国约25%的医疗费用被浪费掉，每年约合7600亿～9350亿美元[31]；若采用AI技术，则可以促进指南或医疗信息在患者中的传播，通过去伪存真，为患者提供有价值的信息，从而节约医疗资源。

2.3 人工智能在指南评价中的作用

目前针对单个临床研究的风险偏倚AI评估工具已经产生[32]。而指南的评价工具，有针对方法学质量的指南研究与评价工具(Appraisal of Guidelines for Research and Evaluation Ⅱ，AGREE Ⅱ)，包含6个领域的23个条目[33]；以及针对报告质量的国际实践指南报告标准(Reporting Items for Practice Guidelines in Healthcare，RIGHT)，包含7个领域的22个条目[31]。然而，研究显示使用这些工具时存在一定挑战，即不同的使用者对标准的把握不一致，人力和时间成本亦不可控[34-35]。如使用AGREE Ⅱ评价一部指南，常规情况下需要3～4名经过培训的研究人员，每人至少耗时1 h；如评价糖尿病领域百余部指南的质量，则需500 h以上。但通过开发、训练相应的AI算法，不仅可以降低评价的主观偏倚，还可较大程度上缩短评价所需的时间。此外，对指南的评价还包括对推荐意见的对比分析，而快速提取其中的推荐意见是关键步骤。Hussain等[36]开发的AI算法，用于提取高血压指南中的推荐意见，其准确度可达85.54%。

3 促进人工智能与临床实践指南结合的思考与建议

就目前科技进步的速度和学科交叉的深度而言，AI技术与指南的结合已是箭在弦上。指南的制订已从1.0时代迈向2.0时代[37]，而AI很有可能引领指南发展的3.0时代。为提前做好应对并促进其科学发展，笔者提出以下思考与建议。

3.1 政策制定者与管理者层面

AI在指南领域的发展和应用，除技术支持外，还有赖于政策支撑。2021年，国家自然科学基金委新增设了交叉科学部，为AI与指南结合相关研究工作的开展提供了获取更多支持的可能性。近年来，“国家重点研发计划”“科技创新2030-重大项目”等也加大了对AI、大数据在医学领域应用的支持力度。此外，多所高校先后设立了人工智能学院，开设AI与医学交叉相关课程，招收本科生和研究生，并在基础理论和关键技术等方面开展相关研究和培训，是未来在该领域把握机遇和掌握话语权的重要途径。

3.2 指南制订者和实施者层面

在指南制订者和实施者层面主要提出以下建议：(1)制订指南或开展指南研究时，应纳入AI相关学科人员。(2)使用已被证实可靠的AI算法、模型和工具时，应提供相应的指导手册或操作规范。(3)撰写基于AI的指南手册或专著。英国国家健康与临床优化研究所(National Institute for health and Clinical Excellence，NICE)在其指南制订手册中纳入应用机器学习搜索和筛选文献的内容[38]，其他指南制订手册则无相关内容的描述。(4)借助AI加速指南的传播与实施，促进医患沟通，改善患者关系。正如斯坦福大学AI实验室主任Christopher Manning教授所言：“AI可以把指南带入每一次的患者咨询中，让每一次咨询都安全、稳妥地支持医患双方沟通。”[39]

3.3 研究者层面

在研究者层面主要提出以下建议：(1)研发基于AI的系统评价工具。指南制订的限速环节主要是系统评价的制作，尽管当前已有AI协助系统评价制作的案例，但仍需进一步深入研究，推动AI大范围应用于系统评价的制作是当前指南制订最重要和最需优先开展的研究。(2)研发AI相关的报告规范。指南制订过程中应用AI的关键步骤和信息应予以充分、透明地报告，故应研发AI应用于指南的报告规范“RIGHT for AI”，现已成为RIGHT工作组扩展版内容之一。目前，AI声明“CONSORT(Consolidated Standards of Reporting Trail) for AI ”已完成研发，其成果已在学术期刊上发表[40]。随着AI相关系统评价的不断增多，系统评价和Meta分析优先报告条目“PRISMA (Preferred Reporting Items for Systematic Reviews and Meta-Analyses) for AI”的出现将是必然。在AI相关的临床研究、系统评价和指南等领域形成完整的报告规范体系，对于促进AI发展、彰显其应用价值具有重要意义。(3)开展AI识别与管理指南参与人员的利益冲突、患者偏好及形成推荐意见等相关研究是未来需要探索的重要方向。如利用AI收集患者偏好与价值观等信息时，如何考虑公平性(当前关于患者偏好与价值观的研究基本上是基于西方患者人群)；管理指南参与人员的利益冲突时，如何保护其个人隐私等，都是研究者需要关注和解决的问题。AI为指南提供的信息越全面，制订者做出最优推荐意见的可能性越大。

4 小结

目前，AI在指南领域的应用仍处于起步阶段，未来前景广阔，其可在指南的制订、实施到自动更新全过程中发挥作用，但也面临诸多问题与挑战，这些问题和挑战将随着人们对AI的认识和掌握不断加深而转化为机遇。我们可以期待，未来指南的制订也许只需基于患者个体数据便可产出极具针对性的“基于证据的个体化指南”，届时精准医学的受益对象将不再是少数人的罕见病，而是所有人的大健康。

作者贡献:陈耀龙、罗旭飞负责统计数据并撰写文章初稿；史乾灵、吕萌、周奇、王健健、杨楠、高东平、杨书、商洪才、杨克虎负责修改初稿；陈耀龙负责文章审校。

利益冲突:无