APP下载

决策树和logistic回归构建早产儿颅内出血预测模型的比较研究

2023-08-11冯安丽李亚玲唐帆罗玉红李蕾吴柔

护士进修杂志 2023年15期
关键词:脑膜炎胎龄决策树

冯安丽 李亚玲 唐帆 罗玉红 李蕾 吴柔

(1.贵州医科大学护理学院,贵州 贵阳 550001;2.贵州医科大学附属医院护理部,贵州 贵阳 550001)

颅内出血是新生儿的常见疾病,可致神经系统功能预后不良、致残或死亡,对其远期生存质量造成明显影响[1]。随着围产医学的进步,早产儿存活率升高,但颅内出血的发生率并未降低。据调查[1-3],中国早产儿颅内出血发病率为9.3%,重度患病率为2.1%,严重颅内出血的早产儿死亡率则高达27%~50%。目前,国内外研究多集中于探索颅内出血的影响因素,临床上缺乏判断早产儿是否为颅内出血高危人群的评定工具。因此,本研究拟筛选早产儿颅内出血的独立危险因素,运用logistic回归、决策树构建预测模型,从中挑选最优模型,以便于临床医护人员及早识别潜在的高危患儿,为后续制定预见性护理方案提供参考。

1 对象与方法

1.1研究对象 采用回顾性病例对照法,选取2019年1月-2022年2月于贵州医科大学附属医院新生儿科就诊且符合纳入排除标准的新生儿作为研究对象。纳入标准:出生胎龄<37周。排除标准:(1)病案数据资料不完整的患儿。(2)有遗传代谢性疾病、先天发育畸形、合并有多脏器功能衰竭的患儿。(3)入院前已明确诊断为颅内出血的患儿。参照《实用新生儿学》[2]中颅内出血的诊断标准,若影像学检查明确出血部位、范围、程度,判断为颅内出血。本研究在前期meta分析的基础上,通过临床专家论证筛选可能的影响因素,共纳入42个危险因素。根据样本量计算公式[4],每个危险因素需要5~10例的患儿,再考虑到10%~20%的样本流失率,经过本院小样本的预调查显示,早产儿颅内出血的发生率为16.95%(119/702)。本研究的样本量至少应为42×5×(1+0.2)÷16.95%≈1 487例,最终纳入2 100例,将其按7∶3比例分为训练集1 445例,测试集655例。

1.2方法

1.2.1危险因素调查表 根据meta分析、专家会议讨论的综合结果,制定统一的患儿资料调查表,包括以下4个方面。(1)一般资料:编号、性别、入院诊断及出院诊断。(2)孕母相关因素:是否存在妊娠高血压、妊娠糖尿病、胎盘异常、脐带异常、羊水异常、胎膜早破、宫内窘迫、异常分娩过程、产前使用皮质类固醇等情况。(3)患儿相关因素:胎龄、体质量、1 min Apgar评分、5 min Apgar评分,是否多胎妊娠、生后复苏史、产伤、ABO溶血、高胆红素血症、维生素K缺乏、维生素D缺乏、窒息、呼吸暂停、代谢性酸中毒、乳酸≥3 mmol/L、凝血功能异常、血小板减少、肺出血、低血糖、肺炎、贫血、败血症、低氧血症、新生儿呼吸窘迫综合征、脑膜炎、脓毒症、坏死性小肠结肠炎、低钙血症、动脉导管未闭、电解质紊乱。(4)治疗因素:有无输血、高浓度吸氧史及呼吸机使用时长。

1.2.2资料收集方法 从临床电子病历系统调取2019年1月-2022年2月入院的新生儿资料。经过统一培训,小组成员采用统一的调查表和判断标准进行收集。收集后对5%~10%的数据资料进行核查。

2 结果

2.1研究对象的一般资料 本研究共纳入2 100例有效病例信息,其中,男性患儿1 187例(56.52%),女性患儿913例(43.48%)。380例(18.1%)患儿发生颅内出血,平均胎龄(32.19±2.74)周,平均体重(1 860.48±597.62)g。1 720例(81.9%)患儿未发生颅内出血,平均胎龄(34.38±2.03)周,平均体重(2 297.93±576.62)g。

2.2早产儿颅内出血危险因素的单因素分析 对纳入的42项影响因素进行分析,其结果显示,2组宫内窘迫、呼吸暂停、代谢性酸中毒、孕母妊娠高血压、胎盘异常、脐带异常、低血糖、低钙血症、胎膜早破、维生素K缺乏、维生素D缺乏、电解质紊乱,差异无统计学意义(P>0.05),2组纳入的影响因素及比较,见表1(扫后文二维码获取)。

2.3logistic回归模型与决策树模型的构建及对比分析

2.3.1输入变量的选择 将单因素分析中存在统计学意义的30个变量分别纳入2种模型中作为自变量,将是否发生颅内出血作为因变量。所有数据按7∶3的比例建立训练集与测试集(训练集1 445例,测试集655例)。

2.3.2早产儿颅内出血的logistic回归分析 logistic回归模型以是否发生颅内出血为因变量Y(否=0,是=1),将单因素分析中有统计学意义的自变量纳入多因素logistic回归分析,赋值情况,见表2(扫后文二维码获取)。结果显示:呼吸机使用时长、胎龄、体质量、窒息、产伤、多胎妊娠、贫血、凝血功能异常、血小板减少、脑膜炎为早产儿发生颅内出血的独立危险因素,见表3。

表3 早产儿颅内出血的logistic回归分析

2.3.3早产儿颅内出血的决策树模型 决策树共有6层,共16个节点,10个终节点,筛选出的影响因素主要有呼吸机使用时长、体重、脑膜炎、贫血、凝血功能障碍、胎龄。其中呼吸机使用时长为根节点,若呼吸机使用时长≤42 h,患儿发生颅内出血的占比为10.57%,若呼吸机使用时长>42 h,决策树继续向下分类至脑膜炎节点。若患儿存在脑膜炎情况,其发生颅内出血的占比为87.5%,不存在脑膜炎情况则继续向下分类至体重节点。若体重为1 000~1 499 g,决策树继续向下分类至凝血功能障碍节点,若患儿存在凝血功能障碍情况,则发生颅内出血的占比为64.06%。若体重为1 500~2 499 g,决策树继续向下分类至胎龄节点,若胎龄在28~31+6周范围内,决策树继续向下分类至贫血节点。若患儿存在贫血情况,决策树继续向下分类至呼吸机使用时长节点,若呼吸机使用时长>256 h,患儿发生颅内出血的占比为81.25%,决策树结束分类。见图1(扫后文二维码获取)。

2.3.4决策树模型与logistic回归模型的比较 决策树和logistic回归模型在训练集与测试集的分类结果,见表4。对比训练集和测试集中的准确度、灵敏度、特异度、阳性预测值、阴性预测值、约登指数及ROC曲线下面积(AUC)发现,决策树模型均高于logistic回归模型,见表5。比较2种模型的AUC,差异有统计学意义(P<0.05),见表6。2种模型在训练集和测试集中的ROC曲线对比情况,见图2和图3,扫二维码获取表1、表2及图1~图3。

表4 决策树和logistic回归模型在训练集与测试集的分类结果

表5 2种模型在训练集和测试集的预测性能对比结果

表6 2种模型在训练集与测试集的AUC比较

3 讨论

3.1早产儿颅内出血危险因素分析

3.1.1早产儿颅内出血产时危险因素分析 本研究显示,胎龄、体重与颅内出血发生率呈负相关,表明胎龄越小、体重越低,其颅内出血发生率越高,与多项研究[5-6]结果一致。分析其原因可能与解剖特点有关,当胎龄<32周时,脑室周围血管发育不成熟,室管膜下存留的胚胎生发基质(germinal matrix,GM)最为明显;在32周以后,GM逐渐萎缩,足月时基本消失[7]。此处毛细血管丰富,是一个不成熟的毛细血管网,其血管壁仅有一层内皮细胞,缺乏胶原和弹力纤维支撑,使得毛细血管伸展性较差,血管壁易于破裂引发出血。因此,提升孕期保健水平,提高胎龄与体重显得尤为重要。此外,本研究显示,产伤是早产儿颅内出血的独立危险因素,与林杨等[8]研究结果一致。早产儿颅骨保护作用较弱,脑血流自主调控能力低下,GM对脑血流波动极为敏感,受高危因素影响导致颅内压升高和脑血流波动,形成压力被动型脑血流,尤其是“涨落”型脑血流在很大程度上对血管壁构成威胁,极易破裂出血[9-11]。若生产过程中使用产钳,易引发颅骨受压不均,发生静脉窦阻塞,导致脑部毛细血管破裂出血[12]。因此,临床上应根据孕妇及胎儿情况合理选择分娩方式,严格把握阴道助产适应症并进行正确操作,减少产伤的发生。

3.1.2颅内出血早产儿产后危险因素分析 本研究显示,窒息、血小板减少、呼吸机使用时长、凝血功能异常、贫血、脑膜炎为早产儿颅内出血的危险因素,与既往研究[6,13]结果相似。GM内皮细胞中含线粒体较多,耗氧量较大,若发生缺氧窒息,血管壁易破裂出血[14-15]。发生机制可能是体内阿片黑素促皮质激素原的β-内啡肽分泌增加,β-内啡肽会抑制呼吸功能,增加颅内出血的风险[16]。早产儿肝脏酶系统发育不成熟,若存在凝血功能异常则不能快速有效地凝固血液,加之乳酸堆积,毛细血管通透性增加致血液进入脉络膜,导致颅内出血的发生[17-19]。呼吸机的使用频率随早产儿人数的增多而增加,而机械通气增加了颅内出血的发生风险,呼吸机使用时间的延长会影响颅内出血的严重程度[20]。究其原因可能是,患儿在进行机械通气时脑血管血流速度加快,若呼吸机参数设置不当,患儿自主呼吸频率与呼吸机不同步,脑血管收缩不稳定,脑血流连续冲击血管壁而引发破裂出血[21-22]。临床上应严格掌握机械通气指征,正确设置呼吸机参数,缩短呼吸机使用时长,争取早日撤机。脑膜炎、呼吸机使用时间的延长均易增加感染风险,感染时激发的免疫反应和炎症瀑布反应致炎症因子增多,脑耗氧量增加,引起脑静脉压波动较大,血管壁易破裂出血[23]。针对早产儿颅内出血疾病,目前尚无特异性治疗手段,故及早识别潜在的高风险患儿,对其采取预见性护理措施具有重要的临床意义。

3.22种预测模型对早产儿颅内出血的预测结论不完全一致 2种预测模型均显示,呼吸机使用时长、胎龄、体重、贫血、凝血功能异常和脑膜炎为早产儿发生颅内出血的重要预测因子。但2种模型的预测并不完全一致,例如窒息、产伤、多胎妊娠、血小板减少等预测因子只在logistic回归模型中出现。从logistic回归模型可知,早产儿脑膜炎的OR值最大,为早产儿发生颅内出血最重要的预测因子;通过决策树模型可知,呼吸机使用时长是预测早产儿是否发生颅内出血的首要划分依据。

3.32种模型的预测性能分析 本研究结果显示,决策树在训练集与测试集的表现均优于logistic回归模型。究其原因,可能是决策树依据信息增益值逐层进行构建,呈现自上而下的树状图,根节点位于最上方,代表首要测试条件,继而根据其内部规则继续向下划分,得到不同的分支,每条分支代表着一种路径,最后到达叶节点结束分类[24]。树状图具有可视化的优点,其呈现方式较为简洁直观。便于医护人员及早识别潜在的高风险患儿,并对此类患儿采取预见性护理措施,以减轻疾病严重程度或降低疾病发生率。但决策树也存在一定缺陷,例如当纳入的自变量较多且较为复杂时,输出的决策树显得深大而繁琐,导致构建的模型泛化能力较差,不易解读预测结果。因此,本研究对决策树进行了修剪,以避免发生过拟合情况。logistic回归是一种非线性回归,主要反映数据类型为分类变量的因变量与自变量的依存关系[25],但本研究对2种模型比较时发现:在训练集和测试集中,决策数的准确率、灵敏度、特异度、约登指数等均优于logistic回归,且AUC大于logistic回归,差异有统计学意义(P<0.05),说明决策树的预测能力更优。

综上所述,在预测早产儿是否发生颅内出血方面,决策树的预测能力优于logistic回归模型,其可视化的结果呈现方式更适用于临床工作。但本研究只运用2个模型进行对比分析,后期应基于机器学习算法构建更多的预测模型,以寻找更为准确的早产儿颅内出血预测模型。其次,此研究的样本量仅来源于一家医院,其代表性不足,今后有待进一步开展多中心、大样本的研究。

猜你喜欢

脑膜炎胎龄决策树
不同胎龄、不同出生体重新生儿的首次肝功能指标的差异性
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
早期综合干预对小于胎龄儿生长发育、体格发育和智能发育等影响观察
一种针对不均衡数据集的SVM决策树算法
决策树和随机森林方法在管理决策中的应用
IL-33在隐球菌脑膜炎患者外周血单个核中的表达及临床意义
基于决策树的出租车乘客出行目的识别
不同胎龄胎鼠脊髓源性神经干细胞特性比较
基于肺癌CT的决策树模型在肺癌诊断中的应用
人感染猪链球菌脑膜炎误诊结核性脑膜炎一例报告