APP下载

临床医学人工智能:典型应用与挑战

2021-11-29孙岳川高键东吴及

中国卒中杂志 2021年7期
关键词:医师机器人工智能

孙岳川,高键东,2,吴及,2

人工智能的概念最早于1956年在达特茅斯会议上提出,它是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新的技术科学。人工智能方法具有对多样化问题的适应性,对复杂关系的建模能力,以及远高于人类的计算处理能力。目前人工智能分为多个分支研究领域,包括计算机视觉、自然语言处理及数据挖掘等,在社会各行业均有广泛应用。在医学行业,人工智能领域获得了大量研究成果,且部分研究成果已成功进入应用阶段,但在不同医学细分领域中,人工智能方法适于解决不同问题,需要不同的应用条件,应用中需要注意的问题和不足各异。本文将对人工智能在临床医学中的应用现状进行总结,并对发展前景进行展望。

1 人工智能、机器学习与深度学习

人工智能是研究、开发用于模拟、延伸和扩展人智能的理论、方法、技术及应用系统的一门新的技术科学。机器学习是一种常用的实现人工智能的方法。研究者们在解决现实问题时经常需要对问题进行数学建模,即对现实问题中的原因和结果进行抽象和简化,用数学的形式语言进行描述,此过程中常常需要把握原因到结果的主要联系,忽略次要联系。机器学习本质上是借助优化算法对数学模型参数的搜索过程,其目的是找到一组模型参数使得该模型能够描述从原因到结果的主要联系,对实际问题有较好的近似或模拟。机器学习方法可大致分为传统机器学习和以神经网络模型为主的深度学习两类。传统机器学习方法模型简单、计算量小,对于复杂而大量的数据,其通常借助以矩阵分解为主的数学原理,在尽量保留数据样本之间关系的基础上压缩数据量,从而用较简单的模型实现问题的近似,但对于模型输入和输出之间复杂的非线性关系的近似程度不够理想。深度学习模型较复杂、计算量大,其通常借助梯度下降等方法直接构建从输入至输出的函数关系,对于复杂关系的拟合能力较好,但有时容易过度拟合数据中与问题无关的其他特性,过度关注从原因到结果的次要联系,甚至偶然的无关联系,从而削减了对问题本质关系的拟合[1]。

2 临床人工智能发展简史

用于临床的人工智能系统并非近些年才出现。从早期的专家系统,如斯坦福大学开发的为感染患者制订抗生素处方的MYCIN[2]系统;至临床决策支持系统,如哈佛大学研发的DXplain[3]和匹兹堡大学研发的QMR[4];再直至今日的以IBM Watson Health为代表的基于机器学习的复杂诊疗系统。

临床人工智能伴随着人工智能技术的发展慢慢走向成熟。今日的医学人工智能系统覆盖筛查、诊断、治疗、预后及管理等多个临床环节,可利用实验室检查结果、影像、文本、音频多种异质数据,完成系统性的复杂任务。

3 临床人工智能的典型应用

人工智能方法同时具有对复杂数据来源和复杂优化目标的强大处理能力,可以处理如图像、文本一类的复杂数据,也可融合处理多种形式的医学数据;可以完成多样化的任务目标,处理分类、回归、图像分割、知识图谱构建等机器学习任务,在此基础上完成数据整理及辅助诊疗工作。

临床影像数据包括CT、MRI、超声、X线等,是目前人工智能方法应用最为广泛的一类数据,经常用于快速获得病情诊断或病灶标定等结果。如利用神经网络分析眼底影像数据,并进行糖尿病眼底病变的诊断[5];基于皮肤影像设计的神经网络,可获得与皮肤专科医师水平相当的皮肤癌变诊断结果[6];根据超声数据诊断乳腺病变,以及利用CT数据判断肺小结节良恶性病变[7];根据心脏图像进行心血管病的诊断或预测[8-9],以及结直肠息肉的标定[10]与脑肿瘤的图像分割[11]等。

医学文本数据包括电子病历、影像学或其他检查报告等,通常采用自然语言处理技术进行处理和应用,其可形成病情诊断,也可以进行更高层次知识图谱的构建,并可辅助构建病历数据库等,可完成多样化任务。如根据患者病历分析得出可能存在的不良反应和术后并发症[12-13];从非结构化病历中提取结构化数据并进行癌症诊断[14],用于构建医疗知识框架并达到职业医师的知识储备水平[15];利用患者死亡证明上的文本信息,根据国际疾病分类标准进行癌症分类[16]等。

在以上研究的基础上,目前已有研究成果进入转化应用。基于人工智能方法的特点,其被更多地用于减轻临床医护人员的工作负担或辅助经验不足的医师进行疾病诊断。在各类疾病筛查阶段,人工智能方法可以辅助选择对病情诊断较为重要的放射影像技术[17];可以进行光学相干断层成像检查,评估患者患眼部病变风险,并决定该患者是否应该接受专业医师检查[18];也可以内嵌于手机应用程序中,可辅助筛查应该接受进一步检查的患者[19]。对于各类重复性的简单工作,人工智能方法可辅助临床节省人力,并提升工作效率,如采用放射影像技术进行骨龄检测[17],采用断层成像进行眼部疾病的检查[20],以及标定心血管影像中的狭窄血管段[21]等。

此外,人工智能方法也被用于开拓医疗诊断和医学研究领域。人工智能方法可以辅助医师进行病情诊断,使得诊断结果更加准确,超越以往专家或医疗设备单独工作能够达到的诊断水平[22-23],还可以自主进行治疗方案的探索[24]。传统方法对乳腺癌的分级仅依据乳腺癌上皮细胞的小部分形态特征,而人工智能方法探索了将间质细胞的形态特征和显微图像特征等增加至乳腺癌预测任务中的可能性[25],以及根据检查结果预测心血管疾病危险因素[26],如根据正常心率情况下获得的心电图数据检测心房颤动[27],根据CT检查结果获得早期的痴呆症诊断[28]等多种创新性工作。

4 人工智能实际部署的具体要求

尽管人工智能方法是一类功能强大的工具,但对于人工智能方法的研究和实施具有特殊要求。与人类的认知特点不同,计算机程序对于数据标准化的要求非常严格,对于包括文件格式,数据种类和顺序,数据单位等因素在内的数据格式,均需要明确的标准,否则可能造成输出乱码等不合常理的结果,甚至不能顺利运行程序。目前各医疗中心中临床影像数据、病历数据等格式各异,如果能够建立统一的数据标准,就可省略对不同数据建立不同程序流程的工作,并可促进一些成熟人工智能方法迅速部署至具有统一数据格式的医疗中心;也实现了科研数据通用化,使得科研人员能够方便获得多个医疗中心的数据,对其进行算法验证和调优。目前已有的数据标准化工作以“医学数字成像和通信(DICOM)”标准为先,其整合了CT、X线、超声及MRI等医疗影像技术,为一线医师和科研人员提供了统一的数据接口,使后续工作省略了数据整理等流程,同时有效地节省了人力。

数据格式标准的制定需要综合考虑现有条件,如程序接口、数据完整性及未来流程改进工作等多种因素,由各医疗中心协商制定。进一步建立统一的医疗数据库还需要考虑患者隐私及数据安全等因素。目前已有的医学数据库包括心脏地图集项目[29]和内脏解剖基准项目[30],随着人工智能方法在医学领域的普及,此类数据库的建立和完善将有长足发展。

目前人工智能的实施主要依靠机器学习方法,而大部分机器学习方法需要依赖人工总结的逻辑规律作为起点,进行高层次关系的学习或训练。在具体任务中,如病情的诊断和预测,则需要大量已知病情和其他信息的患者档案作为起始知识,进行从患者数据至病情诊断的关系构建,从而能够根据患者前瞻性数据获得病情的诊断或预测结果。对于一些较为复杂的任务,如器官区域的图像分割,则需要大量已知分割结果的医学影像数据,而分割结果往往由医师进行精细标注,一方面大量精细标注对医师的时间和精力具有一定要求,另一方面标注结果会受到医师主观因素的影响,使人工智能方法的参数拟合过程受到影响,进而使模型建立不准确的数据与标注的映射关系,并对模型性能造成不利影响。机器学习领域对无标注的学习方法也进行了研究,可以提取无标注数据内在的关系进行疾病表型分类等研究,但由于缺少客观一致的评价研究效果的标准,此种方法不易准确评价其性能,同时欠缺可解释性。

作为一种技术工具,人工智能技术并不能完全替代医学专家。医学知识在不断演进,医学也是一门复杂性学科,目前人工智能系统的构建仍然需要医学专家的深入参与。如从数据的角度分析,尽管特征筛选[31]等方法可以研究患者各类数据的重要性区别,但这类方法存在局限性,无法从更本质的病理学角度进行解释,因此人工智能方法常需要医师给定一种可能的数据集合,再从中选择较为重要的数据用来完成任务。从任务目标的角度分析,依赖于医学专家明确研究方向,将具体工作由机器学习模型实现。合理的问题定义和目标需要考虑目标实现的难度、临床意义及预期性能等多方面因素,从而使人工智能方法的研发流程更加顺利,并有利于合理进行实际部署。

5 人工智能的局限性与挑战

临床人工智能依然处于早期研发阶段。为了使得人工智能方法更好地辅助临床,研究人员需要就人工智能方法的局限性进行使用范围的界定,并警惕其产生不合常理的诊断或操作结果。

目前大部分人工智能方法均依靠具体的机器学习算法实现,而大部分机器学习算法均以数理统计和概率相关理论作为支撑,并假设各病患数据样本是“独立同分布”的。尽管满足“独立同分布”假设的数据在实际工作中较少见,利用“非独立同分布”样本训练得到的机器学习模型,其在与训练数据相独立的测试数据集上的性能仍然可以接受,但该模型能否在多变的实际应用条件下保持其性能仍然未知,其原因是机器学习模型严重依赖现有数据的分布情况,而数据集的体量总是有限的,无法穷尽所有可能的实际情况。

为寻找数据特点与标注之间的映射关系,机器学习模型可能会将一些无关的数据特性与标注联系起来。如将皮肤上的外科水笔标记作为黑色素瘤的诊断标准[32],或由于不同医学中心的诊断标准不同造成肺炎的诊断结果不一致[33]。数据上的漂移或偏见还可能造成社会问题或削弱病情诊断结果的稳定性,如对不同人群死亡率的预测差异[34],根据不同人群的胸部X线检查结果预测胸部疾病的效果差异[35],又如给皮肤图像添加人眼不可识别的微小噪声就会造成分类结果的差异[36]。研究者们往往尝试利用工科领域的方法解决上述数据漂移等问题。电子病历是机器学习算法的一大数据来源,而病患的临床表现、诊断方法、治疗方法等因素的变化使得电子病历数据在较长时间尺度上的分布不同[37]。为维持算法稳定性和较好的性能,可以采用非参数方法[38]及时更新模型,使其适应数据分布的变化。但现实问题复杂多变,工科领域提出的解决方案往往只针对模型的数学原理,而构建一种稳定可靠的人工智能系统不仅需要完善的数学理论,还需要结合医学知识的指导。

数据分布的不同会造成模型表现的不稳定,因此研究者们希望寻求增强模型可解释性的方法以了解模型结果的来源和过程。传统机器学习模型的可解释性要优于深度学习模型,如支持向量机模型可提供从数据到结果的解析表达式,决策树模型可提供每一步决策的理由,而深度学习模型常用激活图提供了图像中对分类结果重要的部分,或利用注意力机制形成自我解释,但目前对于人工智能可解释性的研究成果有限。医学领域对于人工智能的可解释性和安全性有迫切需求,对于患者的诊断和治疗过程,医师希望人工智能模型在提供结果的同时也有原因分析,从而提高该结果的可信度。由于模型可解释性的欠缺,目前的人工智能应用仍存在局限,无法完全替代医师对患者进行全流程诊断与治疗。

多数临床场景下,人工智能系统提供的结果仅作为参考信息。维也纳医科大学皮肤科探究了医师如何采纳人工智能系统提供的诊断建议,得到如下结论:①经验越少的医师越容易相信人工智能诊断结果而非医师的诊断(即使医师的诊断是正确的);②专家在信心充分时不易根据人工智能结果改变自己的判断,在信心不足时也可通过人工智能系统获得更多有助于诊断的参考信息;③不同经验水平医师在缺乏信心时均易接受人工智能的诊断建议;④若医师过度依赖人工智能系统的诊断结果,可能导致随着人工智能系统的误诊而改变自己正确判断的结果[39]。因此在临床应用中,医师仍需保持独立思考,应避免轻易采纳人工智能系统提供的诊断结果。

6 结语

人工智能的研究已进行了数十年,研究进程颇为曲折,目前借由计算机硬件技术的发展而得以发挥潜力。人工智能方法的优势在于快速大规模的数据处理能力及对复杂输入输出关系的强拟合能力,不足之处在于其良好性能依赖于数据质量,可解释性问题也限制了其应用场景。作为一种技术工具,人工智能进入实际应用需要数据标准化、人工数据标注、医学专家指导等外部条件的辅助。未来在疾病初筛、辅助和提升人工诊断效率,医学科研前沿探索等方面,将会出现更多优秀的临床人工智能产品;而在数据偏倚较大,误诊后果严重或对诊断逻辑要求高等多种应用场景下,人工智能方法仍有待深入研究和探索。

猜你喜欢

医师机器人工智能
中国医师节
韩医师的中医缘
机器狗
机器狗
2019:人工智能
人工智能与就业
未来机器城
中国医师节
数读人工智能
下一幕,人工智能!