APP下载

基于随机森林模型的乳腺癌患者术后并发下肢深静脉血栓预测模型的初步研究

2023-09-16陈小鹏王会东

血管与腔内血管外科杂志 2023年8期
关键词:二聚体下肢血栓

陈小鹏,王会东

1 潍坊医学院临床医学院,山东 潍坊 261021

2 潍坊市人民医院乳腺甲状腺外科,山东 潍坊 261031

乳腺癌是一种发生于乳腺上皮组织的恶性肿瘤,发病人群以女性为主,男性乳腺癌少见,乳腺癌早期常表现为腋窝淋巴结肿大、乳房肿块及乳头溢液等,晚期则可发生远处转移,导致多器官病变,对患者的生命安全造成严重的影响[1-2]。目前尚未完全清楚乳腺癌的发病机制,临床多认为过度饮酒、高脂饮食、肥胖、遗传及营养过剩等均可能会增加乳腺癌的发生风险[3-4]。乳腺癌居于中国女性恶性肿瘤中发病率首位[5]。目前,临床治疗乳腺癌的手段较多,如手术治疗、放射治疗、中医治疗及药物治疗等,其中,手术治疗是临床较为常用的乳腺癌治疗手段[6-7],能够将病灶有效切除,稳定患者的病情,提高患者的5年生存率[8]。然而,乳腺癌患者术后较容易发生下肢深静脉血栓,一旦发生下肢深静脉血栓,将会严重影响治疗效果[9]。本研究探讨乳腺癌患者术后并发下肢深静脉血栓的危险因素,并构建预测乳腺癌患者术后并发下肢深静脉血栓的随机森林模型,以期为乳腺癌患者术后并发下肢深静脉血栓的防治提供理论依据,现报道如下。

1 对象与方法

1.1 研究对象

选取2018年2月至2021年7月于潍坊市人民医院进行手术治疗的430例乳腺癌患者。纳入标准:(1)符合乳腺癌的诊断标准[10];(2)年龄≥18岁;(3)符合手术治疗的指征;(4)术前无下肢深静脉血栓。排除标准:(1)合并自身免疫性疾病;(2)合并肾脏、肝脏等重要脏器功能障碍;(3)合并其他肿瘤疾病;(4)合并血液系统疾病或严重的凝血功能障碍;(5)合并精神疾病;(6)伴有肢体功能异常;(7)存在语言沟通障碍;(8)哺乳期或妊娠期女性;(9)中途退出治疗或转院。根据术后下肢深静脉血栓的发生情况将乳腺癌患者分为血栓组(n=61)和无血栓组(n=369)。

1.2 下肢深静脉血栓的判定标准

下肢深静脉血栓的判定标准[11]:静脉造影、超声或电子计算机断层扫描检查显示小腿深静脉、腘静脉、股深静脉等近端静脉出现腔内充盈缺损,呈圆柱状或不规则条带状,管腔狭窄。

1.3 数据收集及观察指标

收集所有患者的临床资料,包括年龄、居住地、肿瘤大小、肿瘤分期、病灶位置、诊断方式、婚姻状态、体重指数、腋窝淋巴结清扫范围、手术操作方式、手术时间、绝经状态、术后放疗情况、新辅助化疗情况、糖尿病情况、高血压情况、术前D-二聚体水平及术前甘油三酯(triglyceride,TG)水平等。

1.4 统计学方法

应用SPSS 24.0软件对数据进行统计学分析。计数资料以n(%)表示,组间比较采用χ2检验。采用多因素Logistic回归模型进行危险因素分析。运用R4.1.3软件构建预测乳腺癌患者术后并发下肢深静脉血栓的随机森林模型,并绘制受试者工作特征(receiver operating characteristic curve,ROC)曲线,计算曲线下面积(area under the curve,AUC)。P<0.05为差异有统计学意义。

2 结果

2.1 乳腺癌患者术后并发下肢深静脉血栓影响因素的单因素分析

乳腺癌手术患者术后下肢深静脉血栓的发生率为14.19%(61/430)。血栓组和无血栓组患者的居住地、肿瘤直径、病灶位置、诊断方式、婚姻状态、腋窝淋巴结清扫范围、手术操作方式、绝经状态、术后放疗情况及高血压情况比较,差异均无统计学意义(P>0.05),而年龄、肿瘤分期、体重指数、手术时间、新辅助化疗情况、糖尿病情况、术前D-二聚体水平及术前TG水平比较,差异均有统计学意义(P<0.05)。(表1)

表1 乳腺癌患者术后并发下肢深静脉血栓影响因素的单因素分析

2.2 乳腺癌患者术后并发下肢深静脉血栓影响因素的多因素因素

将单因素分析中差异有统计学意义的因素(年龄、肿瘤分期、体重指数、手术时间、新辅助化疗、糖尿病、术前D-二聚体水平及术前TG水平)作为自变量,将乳腺癌患者术后是否并发下肢深静脉血栓(未发生=0,发生=1)作为因变量,纳入Logistic回归模型进行多因素分析,结果显示,年龄≥60岁、肿瘤分期为Ⅲ~Ⅳ期、体重指数≥30 kg/m2、手术时间≥2 h、新辅助化疗、糖尿病、术前D-二聚体水平>5.0 mg/L及术前TG水平>1.70 mmol/L均是乳腺癌患者术后并发下肢深静脉血栓的独立危险因素(P<0.05)。(表2)

表2 乳腺癌患者术后并发下肢深静脉血栓影响因素的多因素分析

2.3 乳腺癌患者术后并发下肢深静脉血栓随机森林模型的因素重要性分析

将年龄、肿瘤分期、体重指数、手术时间、新辅助化疗、糖尿病、术前D-二聚体水平及术前TG水平作为自变量,将乳腺癌患者术后是否并发下肢深静脉血栓(未发生=0,发生=1)作为因变量,构建乳腺癌患者术后并发下肢深静脉血栓的随机森林模型,结果显示,当决策树的数目为46时,随机森林模型错误率最低(图1)。乳腺癌患者术后并发下肢深静脉血栓危险因素的重要性排序依次是肿瘤分期为Ⅲ~Ⅳ期、体重指数≥30 kg/m2、糖尿病、术前TG水平>1.70 mmol/L、年龄≥60岁、新辅助化疗、手术时间≥2 h及术前D-二聚体水平>5.0 mg/L。

图1 乳腺癌患者术后并发下肢深静脉血栓随机森林模型错误率评估

2.4 两种模型的ROC 曲线分析

随机森林模型预测乳腺癌患者术后并发下肢深静脉血栓的AUC为0.785(95%CI:0.706~0.855),多因素Logistic回归模型预测乳腺癌患者术后并发下肢深静脉血栓的AUC为0.773(95%CI:0.702~0.844),两种模型对乳腺癌患者术后并发下肢深静脉血栓的预测效能均较高,但随机森林模型对乳腺癌患者术后并发下肢深静脉血栓的预测效能稍高于多因素Logistic回归模型(图2)。

图2 随机森林模型与多因素Logistic回归模型预测乳腺癌患者术后并发下肢深静脉血栓的ROC曲线

3 讨论

下肢深静脉血栓是乳腺癌患者术后较为常见的并发症,它的发生会增加治疗的难度,给患者造成巨大的痛苦,降低患者的生活质量,同时增加死亡风险[12]。本研究中,乳腺癌患者术后下肢深静脉血栓的发生率为14.19%(61/430),提示乳腺癌手术患者是下肢深静脉血栓的易发人群,临床中应重点关注乳腺癌患者术后下肢深静脉血栓的发生情况,做好防治工作。

Logistic回归是可以研究分类观察结果和一些协变量之间关系的一种概率非线性预测模型,常用于经济预测、数据挖掘及疾病自动诊断等领域,临床上通常会运用其分析诱发疾病的高危因素[13-14]。本研究通过多因素Logistic回归模型分析发现,年龄≥60岁、肿瘤分期为Ⅲ~Ⅳ期、体重指数≥30 kg/m2、手术时间≥2 h、新辅助化疗、糖尿病、术前D-二聚体水平>5.0 mg/L及术前TG水平>1.70 mmol/L均是乳腺癌患者术后并发下肢深静脉血栓的独立危险因素(P<0.05)。齐菲等[15]的研究发现,年龄≥60岁、体重指数≥30 kg/m2、新辅助化疗均是乳腺癌患者术后并发下肢深静脉血栓的危险因素,与本研究结果相符。年龄≥60岁的乳腺癌患者术后发生下肢深静脉血栓的风险较高,可能是由于随着年龄的增长,机体血管壁内膜细胞质代谢容易发生异常,引起血管内膜损伤并脱落,从而造成下肢深静脉血栓。体重指数≥30 kg/m2的乳腺癌患者已经属于肥胖人群,肥胖人群的血流速度较慢、运动强度较低,机体的血流经常处于高凝状态,导致下肢深静脉血栓的发生风险增加。新辅助化疗使用的化疗药物容易使患者的血液处于高凝状态,造成下肢血液流速减慢,从而导致下肢深静脉血栓的风险增加。肿瘤分期为Ⅲ~Ⅳ期的乳腺癌患者术后发生下肢深静脉血栓的风险较高,这是由于肿瘤环境中所产生的次氯酸可以修饰抗凝血酶,造成抗凝血酶出现新的表位,肿瘤分期越高,抗凝血酶的活性越低[16],从而增加了下肢深静脉血栓的发生风险。于磊等[17]的研究发现,手术时间是乳腺癌患者术后并发下肢深静脉血栓的危险因素,手术时间越长,对患者造成的创伤越大,而机体发生创伤容易造成血液呈现高凝状态,增加了下肢深静脉血栓的发生风险。张美霞等[18]的研究发现,糖尿病患者更容易发生下肢深静脉血栓,糖尿病患者的机体处于高血糖状态,高血糖会使其血管内皮受损,引起动脉粥样硬化,并且发展较为迅速,从而导致下肢深静脉血栓的发生风险增加。Luo等[19]的研究发现,术前D-二聚体水平升高是踝关节骨折患者发生下肢深静脉血栓的危险因素,术前D-二聚体水平较高会使患者机体处于纤维蛋白溶解亢进和血液高凝状态,从而增加下肢深静脉血栓的发生风险。另外,本研究发现,术前TG水平>1.70 mmol/L的乳腺癌患者术后更容易发生下肢深静脉血栓,这是由于术前TG水平较高会使患者机体血液黏稠度升高,血液流动速度减慢,进而增加下肢深静脉血栓的发生风险。

随机森林模型是能够对大规模无规律且复杂的数据进行高效处理的一种数据分析方式,可以准确地对资料进行分类处理,已获得广泛认可[20]。随机森林模型是采用可解释性框架技术对各个因素构建的可解释性简化规则集,根据频率和误差对规则进行修剪排序,采用引导式正则化随机森林特征选择算法将无关、冗余的特征子集剔除,从而形成可解释性分类工具。随机森林算法的速度已经很快,但当遇到很多棵决策树时,训练所需要的时间和空间会很大,导致模型计算较慢,成本较高。本研究建立了预测乳腺癌患者术后并发下肢深静脉血栓的随机森林模型,对危险因素进行了重要性排序。与多因素Logistic回归模型相比,随机森林模型不仅具有操作方便、可读、可视的特点,还可以快速显示每个危险因素的重要性及排序[21],另外,该模型的分类能力较强,能更加全面地评估个体差异,医务人员能更加简便地利用随机森林模型进行危险因素分析。本研究中的随机森林模型显示,乳腺癌患者术后并发下肢深静脉血栓影响因素的重要性排序依次是肿瘤分期、体重指数、糖尿病、术前TG 水平、年龄、新辅助化疗、手术时间及术前D-二聚体水平,临床可结合这种排序对患者进行合理干预,从而降低乳腺癌患者术后并发下肢深静脉血栓的发生率。本研究亦发现,随机森林模型预测乳腺癌患者术后并发下肢深静脉血栓的AUC为0.785(95%CI:0.706~0.855),多因素Logistic 回归模型预测乳腺癌患者术后并发下肢深静脉血栓的AUC 为0.773(95%CI:0.702~0.844),提示随机森林模型与多因素Logistic 回归模型对乳腺癌患者术后并发下肢深静脉血栓均有较高的预测效能,而随机森林模型对乳腺癌患者术后并发下肢深静脉血栓的预测效能更高。

综上所述,肿瘤分期为Ⅲ~Ⅳ期、体重指数≥30 kg/m2、糖尿病、术前TG水平>1.70 mmol/L、年龄≥60岁、新辅助化疗、手术时间≥2 h及术前D-二聚体水平>5.0 mg/L均是乳腺癌患者术后并发下肢深静脉血栓的危险因素,随机森林模型对乳腺癌患者术后并发下肢深静脉血栓的预测价值较高,有助于筛选乳腺癌患者术后并发下肢深静脉血栓的高风险人群,从而制定相关防治措施。

猜你喜欢

二聚体下肢血栓
防栓八段操 让你远离深静脉血栓
中西医治疗下肢动脉硬化闭塞症的研究进展
血栓会自己消除么? 记住一个字,血栓不上身!
准妈妈要重视下肢静脉曲张的预防
血栓最容易“栓”住哪些人
D-二聚体和BNP与ACS近期不良心血管事件发生的关联性
微创旋切术治疗182例下肢静脉曲张的术后护理
联合检测D-二聚体和CA153在乳腺癌诊治中的临床意义
两种试剂D-二聚体检测值与纤维蛋白降解产物值的相关性研究
下肢动脉硬化闭塞症支架术后再狭窄的治疗