APP下载

决策树算法应用于MIMIC-III数据库的ICU患者急性肾损伤预测研究

2021-12-18高文鹏吕海金周琅郭圣文

北京生物医学工程 2021年6期
关键词:血液学肌酐预测

高文鹏 吕海金 周琅 郭圣文

0 引言

急性肾损伤(acute kidney injury,AKI)在重症监护室 (intensive care unit,ICU)患者中很常见,具有较高的发病率与死亡率[1-2]。全球肾脏病预后组织KDIGO(Kidney Disease:Improving Global Outcomes)发表的 AKI 临床实践指南[3]中对AKI的具体判别标准为:48 h内血清肌酐升高≥26.5 μmol /L 或在7 d内血清肌酐增加到基线值的 1.5 倍以上,或尿量小于0.5 mL/(kg·h)且持续时间不少于6 h。研究表明,AKI导致ICU患者更高的治疗费用、不良的临床反应和慢性肾病的发展[3],并且是ICU患者高死亡率的独立影响因素[4-5]。

由于血清肌酐是AKI的非特异性标志物,对AKI的诊断具有一定滞后性[6],而临床中尿量不易监测且操作误差较大,故寻找影响AKI的重要临床因素并进行早期预测,是对ICU内AKI风险患者及时干预、指导治疗的关键。迄今为止,有关AKI的早期预测通常有以下两种方法:一种是寻找具有特异性的生物标志物,另一种是基于统计学或机器学习方法建立风险预测模型。由于生物标志物的方法费用高、可纳入样本量少且受个体差异影响较大,其临床应用受限。

随着开源重症数据库的建立和医院电子病历(electronic health records,EHR)的普及,ICU 患者临床数据的可用性不断提高[7],从而为AKI 预测研究提供充分的数据支持,相关研究逐渐增多。如Haines等[8]收集伦敦皇家医院ICU内830名患者的人口学信息和入院后24 h内的血液学指标,使用逻辑回归进行AKI预测,结果显示预测AKI 1~3期的受试者工作特征曲线(receiver operator characteristic curve,ROC曲线)下面积(area under curve,AUC)值为0.70,预测AKI 2~3期AUC值为0.91。Malhotra等[9]收集两家独立医院ICU共2 017 名患者的人口学信息、合并症、生命体征、血液学指标及干预措施,使用多变量回归分析进行AKI预测,独立测试集的AUC值为0.81。也有学者利用开源重症数据库进行AKI预测,如李千惠[10]从 Medical Information Mart for Intensive Care(MIMIC)重症数据库中提取1 690例患者(AKI患者840例)的生命体征和血液学指标,使用逻辑回归、Adaboost及多层感知机3种模型进行 AKI早期预测,结果表明多层感知机性能最好,F1.5分数为0.944。

张渊等[11]从MIMIC 数据库中提取1 166名患者(AKI患者884例)的人口学信息、生命体征和血液学指标,使用逻辑回归、随机森林及LightGBM 3种模型进行AKI发生前24 h预测,发现LightGBM 模型最优,AUC 值为0.92。Zimmerman等[12]提取MIMIC数据库23 950例患者的人口学信息及入院后24 h内、生命体征、血液学指标、干预措施,使用逻辑回归、随机森林与多层感知机进行AKI早期预测,平均AUC值为0.783。

目前对ICU患者AKI预测的研究主要存在以下不足:(1)纳入样本量不足,特别是AKI患者的样本量普遍偏少,使得模型可靠性不足;(2)临床或数据库信息利用不充分,可能遗漏重要影响因素;(3)预测时间不及时,缺乏连续预警功能,导致临床医生没有足够的时间进行干预。

针对以上不足,本研究基于30 020名ICU患者的人口学信息、入院信息、用药情况、生命体征、血液学指标、危重症评分、合并症、干预措施等8类临床信息,按4∶1随机划分训练集与独立测试集,分别应用逻辑回归、随机森林和LightGBM 3种机器学习算法,建立24 h、48 h和72 h 3个时间点的AKI预测模型,对不同模型的性能进行评估、比较与分析,并使用最优模型进行连续24 h预测,明确与AKI事件发生相关的重要因素。

1 研究数据

1.1 数据来源

本研究所用数据来自MIMIC-III数据库[13],MIMIC-III是美国麻省理工提供的一个公开免费的多参数重症监护数据库,包含了从2001年6月1日至2012年10月31日在波士顿的贝斯以色列女执事医疗中心ICU收治的46 520名患者的住院记录,具有样本量大、临床信息丰富的特点。

1.2 数据筛选

入组标准:年龄>18岁;ICU住院时长>24 h。排除具有以下合并症的患者:肾结石;输尿管结石;肾癌;肾盂癌;尿路梗阻性疾病。首测肌酐值属于正常范围(31.8~116.0 μmol/L)的患者,以首测肌酐值作为基线肌酐值;首测肌酐值不属于正常范围的患者,在排除慢性肾病的前提下,取116.0 μmol/L作为基线肌酐值;多次入住ICU的患者,若连续两次住ICU时间间隔超过48 h,则分别按照不同样本纳入。

根据以上标准,最终纳入30 020名患者,其中AKI患者共17 222名,占比57.4%。

1.3 变量纳入

(1)人口学信息:年龄、性别、体质量、身高。

(2)入院信息:入院方式、ICU类型。

(3)药物使用:抗生素、利尿剂、他克莫司、利福平、两性霉素、顺铂。

(4)生命体征:平均动脉压、心率、呼吸频率、收缩压、舒张压、体温。

(5)危重症患者健康评分:Elixhauser comorbidity score、SAPS II、SOFA score、APSIII。

(6)合并症:高血压、糖尿病、心肌梗死、心力衰竭、脓毒症、癌症。

(7)血液学指标:肌酐、血红蛋白、白蛋白、pH、碳酸氢盐 、碱剩余、乳酸、钾、氯、钠、白细胞计数、葡萄糖、血尿素氮、胆红素。

(8)干预措施:机械通气、肾脏替代治疗。

其中,入院方式包括ELECTIVE(有计划的入院)、URGENT(急诊,不危及生命)、EMERGENCY(急诊,危及生命)3种;ICU类型包括SICU、MICU、CCU、TSICU、CSRU 5种;合并症与干预措施用“0/1”表示,0表示无,1表示有;危重症患者评分中,Elixhauser comorbidity score是针对患者的合并症评分,SAPS II是简化急性生理学评分,SOFA score是器官衰竭评分,APS III为急性生理学及慢性健康状况评分。

1.4 数据收集时间窗

本研究对AKI进行提前24 h、48 h、72 h预测,参考Peng等[14]的数据收集方法,对于AKI患者,其数据收集范围为入ICU到AKI发生前24 h、48 h、72 h;对于Non-AKI患者,其数据收集范围为入ICU到出ICU前24 h、48 h、72 h。数据收集窗口如图1所示。

图1 AKI患者与Non-AKI患者的数据收集窗口Figure 1 Data collection windows for AKI patients and Non-AKI patients

1.5 特征构建

根据数据收集时间窗,获取特征参数后,对生命体征与血液学指标,分别计算它们在时间窗内的首检值、最小值、最大值、均值、标准差等,将统计特征纳入特征队列,以反映特征的统计分布特性。最后得到的特征维数为102。

2 研究方法

2.1 逻辑回归

逻辑回归[15]是一种经典的广义的线性分析模型。

如果用x、θ、h、y分别表示训练数据、模型参数、预测输出函数和真实标签,则分类问题实际上是一个伯努利分布:

P(y=1|x;θ)=hθ(x)

(1)

P′=P(y=0|x;θ)=1-hθ(x)

(2)

式(1)和式(2)可以合并为:

P′=(hθ(x))y(1-hθ(x))1-y

(3)

将式(3)的最大似然作为目标函数:

(4)

应用梯度下降法对L(θ)求对数,再对模型参数θ求偏导。

与线性回归不同,逻辑回归通过引入一个单调可微的Sigmoid函数作为输出函数,从而将线性方程预测的连续值映射成1/0两个离散值。

逻辑回归的计算代价不高,易于理解和实现,但对模型中自变量多重共线性较为敏感,容易欠拟合,分类精度较低,难以处理数据不平衡的问题。

2.2 随机森林

随机森林[16]以决策树为基本分类器,利用集成学习的Bagging思想,通过有放回的随机抽样,从原始数据集中随机选取数据子集与特征,构建多个决策树进行分类,其输出类别是单个树输出类别的众数。

随机森林通过将多个分类器进行结合,常可获得比单一学习器更优越的泛化性能,但在噪声比较大的数据上容易过拟合。随机森林的算法流程图如图2所示。

图2 随机森林流程图Figure 2 Flowchart of random forest

2.3 LightGBM

LightGBM(light gradient boosting machine)是对梯度提升决策树算法(gradient boosting decision tree,GBDT)的优化[17],主要包含两个算法:单边梯度采样(gradient-based one-side sampling,GOSS)和互斥特征绑定(exclusive feature bundling,EFB)。

GOSS算法通过区分不同梯度的训练数据,保留较大梯度数据的同时对较小梯度数据随机采样,从而达到减少计算量、提升运算效率的目的。定义O表示某个固定节点的训练集,训练集实例为x1,x2,…,xn,特征维度为s,分割特征为j,信息增益为V[17]。每次梯度迭时,模型数据变量的损失函数的负梯度方向表示为g1,g2,…,gn,则分割特征j在分割点d的信息增益为:

(5)

GOSS算法中,首先根据数据的梯度将训练数据降序。保留梯度最大的前a%的数据,作为数据子集A,再从剩余的数据中进行随机采样得到数据子集B。

EFB是通过特征捆绑的方式减少特征维度,从而提升计算效率。原始特征个数为feature,合并后特征个数为bundle,这种方式的特征复杂度从O1(data×feature)降到O2(data×bundle),由于bundle远小于feature,模型能够极大地加速GBDT的训练过程而不影响最后的精度。

此外,LightGBM将连续的浮点特征值离散化成k个整数,构造出宽度为k的直方图,当遍历完一次数据后,直方图累积了离散化需要的统计量,之后进行节点分裂时,可以根据直方图上的离散值寻找最佳分割点,减少对内存的消耗。LightGBM还摒弃了大部分GBDT使用的按层生长(level-wise)的决策树生长策略,使用带有深度限制的按叶子生长(leaf-wise)的策略,在分裂次数相同的情况下,可以降低更多的误差,得到更好的精度。

2.4 性能评价指标

评价指标采用精确性(precision)、敏感性(sensitivity)、F1值和AUC。

(6)

(7)

(8)

式中:true negative(TN),称为真阴率,表明实际是负样本预测成负样本的样本数;false positive(FP),称为假阳率,表明实际是负样本预测成正样本的样本数;false negative(FN),称为假阴率,表明实际是正样本预测成负样本的样本数;true positive(TP),称为真阳率,表明实际是正样本预测成正样本的样本数。

3 实验结果

3.1 预测结果

将30 020名患者按4∶1随机划分训练集和独立测试集,训练集和独立测试集的人数分别为24 016(其中AKI患者13 778名,Non-AKI患者10 238名)和6 004(包括AKI患者3 444名,Non-AKI患者2 560名)。模型训练阶段采用十折交叉验证,训练结束后,使用独立测试集评估所训练模型的性能。

各模型十折交叉验证与独立测试集的结果如表1、表2所示,不同模型在对相同时间点预测时,除了逻辑回归模型预测24 h后的AKI敏感性最高之外,逻辑回归、随机森林、LightGBM模型的性能依次递增;随着预测时间点由24 h、48 h至72 h增加,预测难度上升,同一模型预测性能逐渐下降。LightGBM的精确性和敏感性均比较高,且相差不大,随机森林也类似,因此,二者的F1值和AUC值也较高,但逻辑回归的精确性和敏感性相差较大,即逻辑回归不能有效平衡查准率与查全率,其F1值和AUC值较低。综合比较,LightGBM在3个时间点的预测性能均最优,在独立测试集上24 h、48 h、72 h预测AKI的AUC值分别为0.90、0.88、0.87。不同模型不同时间点预测的ROC曲线如图3所示。

图3 3种模型AKI预测的ROC比较Figure 3 Comparison of the ROC obtained by three prediction models

表1 不同时间点十折交叉验证的结果Table 1 Results of 10-fold cross-validation of different time points

表2 不同时间点独立测试集的结果Table 2 Results of independent test sets at different time points

应用性能最优的LightGBM,对AKI患者进行连续24 h预测,即从入ICU第1天开始,预测24 h后发生AKI的风险,第2天则根据当天及当天之前的数据,进行24 h预测,直至转出ICU为止。将临床确诊为AKI的时间减去模型首次预测AKI成功的时间,作为提前时间(天数),统计预测成功的天数与比例(表3)。表3说明,LightGBM连续24 h预测的成功率较高,提前1、2、3天预测AKI风险患者的成功率分别为89%、83%和80%。当对1 587名根据KDIGO标准确诊的AKI患者,模型能提前3天获知其中1 272名患者具有AKI风险,此时给临床医生预留了3天的时间进行干预治疗。

表3 LightGBM提前1~3天预测AKI的成功率Table 3 Success rates of AKI prediction of 1-3 days in advance using LightGBM

3.2 重要特征

特征重要性可以反映每个特征对模型预测能力的贡献程度。根据特征在模型训练过程中被使用的次数,得到LightGBM 24 h、48 h与72 h 3个时间点的所有特征权重列表,选择排列前35的特征,如图4所示。

图4 LightGBM 3个时间点AKI预测的前35重要特征Figure 4 Top 35 important features obtained by LightGBM at three time points

3个时间点预测模型得到的位居前列的特征大部分相同,均包括已住院时长、体质量、体温最小值、白细胞记数最大值/最小值、碳酸氢盐最大值、葡萄糖最小值、舒张压最大值、血尿素氮最小值/最大值、APS III评分、体温最大值/首测值、血红蛋白首测值、心率首测值、血清肌酐最小值/最大值、收缩压最大值、心率首测值/最大值、葡萄糖最大值/首测值、收缩压首测值和氯最大值等24个特征。

值得注意的是,3个时间点预测模型中:已住院时长、体质量均位列前2,提示在早期预测AKI时,应首先观察这两个指标;白细胞记数最大值、碳酸氢盐最大值、体温最小值均位列前10,需重点关注;而血清肌酐的重要性均未排入前10,表明血清肌酐对模型的作用不够理想,仅以肌酐作为AKI诊断标准敏感性不足,具有一定滞后性。

为进一步验证重要特征的作用,并对特征进行降维,在仅使用24个重要特征的情况下,对LightGBM不同时间点预测模型进行训练和测试。独立测试集的结果如表4所示。

由表4结果可知,当仅使用24个重要特征时,LightGBM预测模型24 h、48 h、72 h的AUC值分别为0.88、0.86、0.85。与使用全部特征相比,AUC值降低不超过2个百分点。说明在102维全部特征当中,24个重要特征对LightGBM模型的预测性能贡献了绝大部分作用,仅使用重要特征也能对AKI进行连续、有效的预测。

表4 LightGBM仅使用24个重要特征的预测结果 Table 4 Prediction results of LightGBM using only 24 important features

4 讨论

实验结果表明,3种机器学习模型中,LightGBM模型性能最优,随机森林次之,逻辑回归较差。使用性能最佳的LightGBM可对AKI风险患者进行连续预测,仅使用重要特征时仍有较好的性能。

与以往的AKI预测研究相比[8-12],本研究的主要优势为:(1)纳入较大样本量。总样本量、AKI患者数均大于上文提及的相关研究,样本平衡性更好,结果可靠性更高。(2)使用8大类临床信息构造特征,降低了遗漏关键因素的可能性,并对特征降维,使用重要特征进行预测,进一步验证了本文得到的重要特征的作用。(3)构建了24 h、48 h、72 h 3个时间点预测模型,并对AKI风险患者进行连续预测,不仅能持续监测患者病情,也为临床医生进行干预与治疗预留了更多时间。

LightGBM 24 h预测模型中,排列前10的主要特征包括已住院时长、体质量、白蛋白首测值、白细胞计数最大值、收缩压最小值、碳酸氢盐最大值、葡萄糖最小值、白细胞计数最小值、体温最大值、血尿素氮最小值,3个时间点预测模型中,位居前30的特征绝大部分相同。

ICU病房中,患者住院时间长,说明患者健康状况严峻、疾病更为复杂,从而导致AKI的潜在风险升高。体质量作为最常见且易得到的指标,本实验数据中,患者体质量每增加5 kg,AKI发病率升高3.74%。

体温过低会导致肾血流量下降、肾小管功能受损,可引起酸中毒和碱中毒[18-19]。在ICU内,超过40%的体温过低患者会出现AKI[18]。

白细胞在炎症反应、宿主防御和修复中具有重要作用,是大多数器官损伤过程中起关键作用的免疫学因素之一。白细胞计数与AKI风险之间呈现U型关系,白细胞计数降低导致的高AKI风险可能归因于淋巴细胞和单核细胞的减少,白细胞计数升高导致的高AKI风险可能归因于中性粒细胞的增多[20]。

血清中碳酸氢盐有助于增加向肾脏的氧输送,同时能够中和肾脏部分的酸中毒,而较低的碳酸氢盐水平会增加肾脏缺血性损伤的风险,特别是在危重症情况下[21]。

本研究尚存在以下不足:(1)样本来自单中心数据库,模型鲁棒性有待多中心数据的进一步验证;(2)仅预测 AKI与非AKI,没有对AKI按KIDGO诊断标准进行分级(I-III级)预测。

5 结论

本研究基于MIMIC-III数据库 ,提取30 020名患者的人口学信息、入院信息、生命体征、危重症评分、合并症、血液学指标、用药及干预措施等8类临床信息,分别使用逻辑回归、随机森林和LightGBM 3种机器学习算法,建立了24 h、48 h、72 h 3个时间点的AKI预测模型,比较不同模型的预测性能,获取重要特征。结果表明LightGBM的预测性能最优,且在连续预测AKI风险患者时具有高达80%的识别率,在仅使用重要特征进行预测时仍有较高的性能。研究结果可对ICU患者发生AKI风险提供连续、有效的预测,明确重要影响因素,并为医护人员进行及时合理的干预提供重要指导。

猜你喜欢

血液学肌酐预测
无可预测
选修2-2期中考试预测卷(A卷)
选修2-2期中考试预测卷(B卷)
选修2—2期中考试预测卷(A卷)
临床路径下的案例教学模式开展于血液学教学中的价值研究
基于血液学细胞形态学技能学习的轻游戏教学软件开发探索
肌酐升高就是慢性肾衰吗
血肌酐升高非小事,你的肾可能已“坏了一半”
尿蛋白正常了肌酐为何还是高
富硒女贞子对山羊生产性能、血液学和血清生化指标的影响