APP下载

患者报告结局在健康医疗大数据领域的应用及伦理学挑战与应对*

2020-01-19吴傅蕾袁长蓉

中国医学伦理学 2020年2期
关键词:医疗信息患者

吴傅蕾,袁长蓉

(复旦大学护理学院,上海 200032,wufulei@fudan.edu.cn)

大数据正在为科学研究、经济建设和文化生活等社会各个领域的发展带来颠覆性变革。2015年,国家先后颁布了《促进大数据发展行动纲要》和《国家信息化发展战略纲要》,强调了推动大数据发展和应用以及实施国家大数据战略。其中,医疗大数据作为关乎健康中国的重要部分被纳入国家战略布局[1-2]。2016年6月国务院办公厅在《关于促进和规范健康医疗大数据应用发展的指导意见》中指出“健康医疗大数据是国家重要的基础性战略资源”,致力于规范和推动健康医疗大数据融合共享、开放应用[3]。健康医疗大数据应用和发展需坚持以人为本、创新驱动,其有利于激发和深化医药卫生体制改革的动力与活力,提升健康医疗服务效率和质量,拓展服务渠道,延伸和丰富服务内容,扩大资源供给,从而高效利用大数据以不断满足患者多层次、多样化的健康需求,也有利于培育新的业态和经济增长点。

健康医疗大数据的构成是多源的。临床实践是其中最核心、最庞大的来源。患者评估、治疗及护理的实施以及患者对治疗及护理的反馈使得临床实践成为一个不断产生数据的过程。且随着当前各大医院信息化进程不断加深,以上数据都得以通过电子病历记录、移动护理系统等被记录和储存。另一方面,随着移动医疗、远程照护等在近几年的快速发展,基于传感器、互联网及物联网的健康数据也成为健康医疗大数据的重要来源,如各类可穿戴设备、健康相关的智能手机应用程序等监测的患者健康数据。甚至通过深入挖掘各类社交媒体上的健康相关信息,我们可以大致描绘出个体的运动、饮食、作息等等健康相关的生活方式。这些健康医疗大数据的合理应用和深度挖掘必将带来健康医疗模式的深刻变化。

然而,我国在健康医疗大数据构建的顶层设计中忽略了医疗照护过程中最重要的一部分人群,即患者自身。当前临床实践产生和录存的数据多为医务人员评估的患者健康信息及客观的实验室指标、影像学结果等,而缺失了重要的人文数据——由患者自我报告的数据。被忽视的患者的声音主要表现在我国传统文化影响下,医疗决策主要依赖医护专业决策,缺乏对患者报告健康信息的长期、系统收集和及时反馈,使得极具价值的患者真实体验消失于空气之中。研究证实,单独使用临床客观指标,如实验室检查结果,可能会低估疾病对个体的影响,并高估医疗干预措施的有效性,从而影响患者疾病预后和生活质量[4]。因此,若这一缺失得不到解决,健康医疗大数据的来源必定是不完整的。而我们若继续仅依赖临床客观指标作为提供健康照护及决策的证据,则可能是我们向以患者为中心的医疗照护模式迈进过程中的倒退。

基于上述背景,美国食品药品监督局(FDA)于在2004年提出了患者报告结局(Patient-reported Outcomes, PROs)这一理念,用以描述来自患者的,与其健康状态有关的信息[5]。本文将通过介绍PROs的概念、内容、测量方式等及其与健康医疗大数据的整合,总结现阶段的几大主要研究和实践方向,以及潜在的伦理挑战和可能的解决策略,以期为健康医疗大数据的研究和应用补充新的视角和思路。

1 患者报告结局与健康医疗大数据

1.1 患者报告结局概述

PROs是指没有经过医生或其他人的解释,直接来自患者的与患者健康状态有关的任何信息[5]。当前,根据PROs收集的内容,一般可以分为5大类:①疾病对日常生活和社会功能的影响,如身体功能、社会角色、自尊及表现等;②症状相关信息,包括症状的严重程度、强度、频率、困扰程度以及对症状对功能及日常生活的影响等;③患者依从性,如最典型的服药依从性;④健康相关生活质量;⑤患者满意度,如医、护患沟通、合作治疗以及治疗获得手段等和卫生服务(health delivery)有关的结局[6]。但也有研究者指出满意度,包括患者对诊疗过程及结果的满意度,作为与卫生服务绩效有关的指标,属于患者报告体验(Patient-reported Experience, PRE)而非结局[7]。根据FDA的定义,我们认为PROs侧重于与患者健康状态有关的信息,因此更倾向于不包含患者满意度。

PROs是一个广义的概念,泛指任何形式的来自患者本人的健康相关信息。也就是说,通过患者主诉、患者访谈等获取的质性资料和通过由患者填写问卷及量表获得的量性资料均可被视为PROs。然而患者主诉往往是分散的、非系统的,难以完整地反映患者当下的健康状态;患者访谈则多为某一质性研究的资料收集方式,访谈主题取决于研究目的,其临床指导意义十分有限。且质性资料还需经过主题提取、降维、字段标准化等多种数据分析和整合技术才能与健康医疗大数据整合,在一定程度上影响数据转化和利用效率。为了更全面、系统地评估和评价患者生理、心理和社会的健康状态,我们所指的PROs往往是狭义层面上的,主要指通过问卷或量表系统收集的患者健康状态相关信息。如通过癌症治疗功能评价量表(Function Assessment of Cancer Therapy, FACT)评价癌症患者的生活质量[8],通过疼痛视觉模拟量表(Visual Analogue Scale, VAS)测量患者的疼痛程度[9]等。更进一步说,只有在规范化的、恰当的情境下,采用高质量的工具收集来自患者的声音,这部分信息才有可能形成大数据。

1.2 患者报告结局在健康医疗大数据研究和实践中的应用

PROs和大数据的相互结合可在多个层面上用于指导患者照护的研究和实践。如PROs可作为证据来源之一构建大数据决策辅助系统;作为预后模型的结局指标和预测指标识别在医疗照护需求上处于优先级的群体和个体[10]。在临床实践上,可通过对PROs的常规收集形成症状预警,实现症状的早期识别和干预[10]。

如Dr. Watson通过机器学习,结合输入的症状、影像学及实验室资料等可实现肿瘤诊断及治疗方案和临床专家的基本一致[11]。在诊疗之外,如症状管理,决策辅助支持系统同样大有可为。以乳腺癌为例,症状管理是乳腺癌救治和康复过程中的关键环节。不同患者在不同阶段出现的症状、可能的困扰和适宜的解决方案不尽相同。基于大数据发现症状规律,并基于规律推荐个性化方案以帮助预防和干预是大数据时代乳腺癌症状管理的新思路。因此,笔者所在课题组尝试通过整合循证证据和大数据构建症状管理的智能推荐系统作为一种临床决策辅助系统。其中,针对患者自我报告症状数据的缺乏,我们开发了乳腺癌阶段特异性患者报告结局测量系统[12],在此基础上统筹收集包括患者临床数据、生活数据和PROs数据,经过数据整理、清洗、转换和融合形成推荐系统所依赖的多源大数据库。

PROs应用的一大趋势是从出于研究目的的收集向临床常规实践转换。PROs最初引起研究者的重视是由于美国FDA指出,PROs必须被包括在临床试验中作为次要结局(secondary outcomes)指标综合评价药物或治疗手段的效果和长期效应[5]。因此PROs在临床试验中,尤其是在美国及英国等发达国家已有成熟的应用。多项研究也已经证实,将PROs作为临床诊疗和护理常规有助于医护人员尽早发现和识别患者在疾病过程中易被忽视的问题,从而提供及时的针对性干预[13]。加拿大公主玛格丽特癌症中心(Princess Margaret Cancer Centre, PMCC)的困扰评估和反馈系统(Distress Assessment Response Tool, DART)是目前较成熟的将PROs纳入临床评估常规的项目[14]。患者在门诊就诊时通过院方提供的iPad以就诊卡号及生日登陆DART系统,完成所有评估后,相关信息即被保存在患者个人医疗记录中,医生可进行即时浏览。DRAT项目的另一主要目的是PROs数据的收集,目前已累积6万余例患者数据,这部分数据的挖掘利用将是下一阶段的研究重点。也就是说,PROs数据的临床常规收集不仅有助于提升照护质量,更是数据持续累积的过程,是进行结合PROs的大数据研究的基础。

值得指出的是,以上研究及实践均要求我们在设计初始即考虑到PROs在其中的角色及作用,达到患者临床数据、生活数据和自我报告数据等各类数据的相匹配,才能完整的描画患者的“数字画像”。因此在收集内容、测量工具、以及收集程序等诸多环节的选择或设计上都需要研究者和临床工作者的细致考量。

2 患者报告结局作为健康医疗大数据的潜在伦理挑战与应对

2.1 应答偏倚对患者报告结局准确性的影响

PROs的原始收集多并非出于构建健康医疗大数据进行全方位分析的目的,而是此时的患者知情同意必然应遵照监管机构的要求对患者进行收集目的如实告知。然而当这部分数据被用于二次利用时,告知不当可能引起一系列问题,从而影响PROs数据的真实性和准确性。如果在患者进行PROs测量之前即明确告知患者这些数据将被用以共享以及二次使用,那么患者的应答可能产生偏倚。PROs作为患者主观感受的表达,涉及多个不同的方面,其中一些报告的内容对患者来说可能是十分敏感的,尤其是情绪状态,功能状态等。如当被试将严重的抑郁状态视作一种羞耻,那么很可能会在所对应的选项中有意地弱化自己的真实情况。对于患者认为十分敏感或不愿暴露的问题,患者在填写问卷或量表时可能采用隐私保护的应答行为(privacy-protective responding behaviors),包括谎报自己的健康状态、遗漏重要的细节或对某些问题不予以应答等[15]。同样地,在PROs数据收集完成后对患者进行告知也存在一定问题,主要体现在同意者和不同意者之间可能会存在如年龄、教育水平等不同因素的差异,导致整体数据集的偏倚。此外,在数据收集完成后重新联系如此大量的患者以获取知情同意存在相当的困难。

2.2 患者报告结局数据的匿外化策略

匿名化(Anonymization)是一种获取数据和完整数据集并确保数据安全的有效策略,经匿名化的数据无需经过明确的知情同意即可进行共享。随着信息技术的发展,健康医疗数据,包括PROs数据均储存于电子数据库,大量来自黑客的攻击加大了数据泄漏的风险。而有效的数据匿名化可极大程度上降低黑客攻击的成功率。研究显示,经过有效的匿名化后,仅有少于0.5%的数据可被精准再识别(re-identification)[16]。现有标准和指南提供了很多数据匿名化的策略,这些方法已被伦理监管机构接受,并已纳入最佳实践[17-18]。根据匿名化后所得的变量是否可进行分析,我们可将匿名化策略分为数据屏蔽(data masking)和去标识化(de-identification)两大类。

第一类:数据屏蔽。数据屏蔽多用于直接标识(direct identifiers),即可以单独或通过与其他易于获取的信息组合来唯一标识数据主体的变量,如姓名、寄件地址、就诊号、病历号等[19]。常用的技术包括字段抑制(filed suppression)、随机(randomization)和假名化(pseudonymization)等[19]。字段抑制指删除一列对于匿名数据集无用的信息,如自由地址字段。随机用于创造虚假的信息使数据看起来像原始数据,如从人口普查中随机选取名字替代数据主体的真实姓名。假名化则将直接标识符替换为其他一些唯一值。

第二类:数据去标识化。数据去标识化多用于间接标识或类标识(quasi-identifiers),即他人可结合其他变量,根据可获得的背景信息推断出数据主体的变量[19]。典型的例子包括出生日期、民族、疾病诊断、诊疗日期等。针对这些信息,可采用信息泛化的方法进行去标识,如将个体的具体出生日期改为出生年月、模糊疾病的具体诊断等。还可采用子数据集的方式保存数据,这样一来他人难以知道目标个体是否存在于某一个随机子数据集中。

除PROs数据匿名化储存外,在多个数据集合并和共享的过程中还需注意其他问题。如多个数据集的合并是否会增加信息,从而增加识别出数据主体的风险。这就要求数据所有者和使用者对数据集的合并十分谨慎,尤其严禁将数据集与未匿名化的数据集相关联。

3 结语

PROs进一步补充和完善了现有健康医疗大数据,而大数据及大数据技术的发展也为PROs的相关研究和实践带来了新的思路和生机。然而在PROs数据与其他数据相结合,形成健康医疗大数据的过程中,由于大数据对患者个体的精准定位的特性,数据匿名化存储及共享尤其重要。只有在保障患者信息安全和隐私的前提下,结合了PROs的医疗健康大数据才能在智能决策、精准干预等领域有可为,并最终提升照护质量,节约医疗资源。

(致谢:诚挚感谢加拿大PMCC Medline Li博士关于DART系统的分享。)

猜你喜欢

医疗信息患者
怎样和老年痴呆患者相处
《现代仪器与医疗》2022年征订回执
《现代仪器与医疗》2022年征订回执
甲减患者,您的药吃对了吗?
新型医疗废弃物焚化舱
认知行为治疗在酒精依赖患者戒断治疗中的应用
2020年来多名新冠患者隐私遭泄露 患者隐私应如何保护
订阅信息
遇到疾病,如何医疗
展会信息