APP下载

使用生物信息学方法建立模型对肝癌免疫治疗效果进行预测

2021-01-14谭沪生任敏

中国药学药品知识仓库 2021年15期
关键词:免疫治疗生物信息学肝癌

谭沪生 任敏

摘要:目的:探讨治疗使用生信方法对肝癌免疫治疗进行指导。方法:在tcga数据库下载数据,使用R语言进行分析。结果:使用模型构建的低风险评分患者对抗PD-L1与抗CTLA4治疗敏感性较高。结论:模型可以对抗PD-L1以及抗CLT4治疗在肝癌患者中的应用效果起到预测作用。

关键词:生物信息学;肝癌;免疫治疗;预后分析

【中图分类号】R735.7             【文献标识码】A             【文章编号】2107-2306(2021)15--01

肝癌是人类常见的恶性肿瘤之一。没有疗效确切的辅助治疗手段。抗PD-1单克隆抗体,在多项癌症治疗中,都扮演了化腐朽为神奇的角色。但因为高额的负担,使肝癌患者在未有正面的预期情况下,难以下决心使用。本文使用TCGA数据库下载的数据建立模型,预测肝脏恶性肿瘤患者对于抗PD-1单克隆抗体的敏感性,探索抗PD-1单克隆抗体在于肝癌的应用。

1方法

1.1数据下载与分析

在tcga数据库下载数据。计算肿瘤组和正常组的基因表达量标准差,进行差异分析,得到在肿瘤样品和正常组织样品中表达有区别的差异基因(p<0.05),对数据进行校正后保存。通过immport数据库,找到免疫相关基因,对免疫基因与得到的差异基因进行取交集,得到差异的免疫基因。

1.2预后模型建立

对差异免疫基因的表达数据和临床数据中的生存时间数据进行合并,排除随访时间小于30天的样本。对差异的免疫基因进行生存分析,找到与预后相关的免疫基因。用这些与预后相关的免疫基因,构建预后模型。将所有的样本数据分组,得到train和test组(2:1),对分组的各项临床性状使用卡方检验。用train组的数据来构建模型,用test组的数据来验证模型的准确性。预测模型风险得分=每个样品中,所有与预后相关的免疫基因的表达量*风险系数后求总和。取train组风险打分的中位值,大于中位值为高风险组,小于中位值为低风险组。同样的在test组中,风险得分大于train组中位值为高风先祖,小于中位值为低风险组。

1.3风险系数(coef)的确定

对train进行单因素cox分析,如果P值小于0.05,则说明该基因是预后相关基因,保留,反之则剔除。对留下的单因素显著基因及其表达量进行lasso回归,构建lasso模型,剔除相关性过高的基因,防止模型的过度拟合,并找到交叉验证误差最小的点,得到各基因的风险系数。

1.4生存分析与ROC分析

对高低风险组进行生存分析,查看是否有高低风险的患者生存曲线是否有差异。查看ROC曲线下面积,推测模型准确率。

1.5独立预后分析

将风险得分与其他临床特征分别与生存时间和生存状态做关联,若P<0.05,则认为为独立预后相关。再做多因素独立预后分析,若P<0.05,则認为独立于其他临床因素,与患者的预后相关。

1.6免疫治疗分析

对于高低风险组的病人,哪一组更适合免疫治疗。在tcia数据库下载肝癌患者的免疫打分文件,与研究的全部患者取交集,按照高低风险分组,分别求得高低风险组的免疫打分,做差异分析,得到高低风险的免疫打分对比。

2结果

2.1样本与免疫基因数量

TCGA下载数据总共465份样本。其中正常样品数量:58;肿瘤样品数量:407。可以得到相对正常细胞在肿瘤细胞中高表达和低表达的差异基因。将肿瘤样品和正常样品中区别表达的这些差异基因与immport数据库下载的免疫基因取交集后,总共得到343个差异的免疫基因。

2.2模型构建

2.2.1模型构建

lasso回归数据见图,剔除过度拟合基因后,可以得到预测模型,用我们的模型对test组和总样本进行的生存分析结果为:1.train组的生存分析,可见高低风险组之间存在差异(p<0.05);2.用模型对test组进行验证,可见高低风险组之间的生存分析存在差异(p<0.05);3.train组的AUC面积为0.782;4.test组的AUC面积为0.782;高低风险组之间的生存数据存在明显差异,验证了我们的模型预测价值。Roc曲线下面积train组、test组、总样本均大于0.5,检测方法真实性良好。

Fig2:a.lasso回归模型;b.对lasso模型进行交叉验证,找到误差最小点,所对应的基因即为lasso回归显著基因,从而得到预测模型。

2.2.2患者预后相关基因的单因素COX分析与多因素cox分析结果

患者单因素与多因素cox结果得到,我们的风险打分能够独立的预测患者的预后(P小于0.01)。

2.3免疫治疗相关基因分析结果

高低风险组之间CD274(PDL1基因)表达量差异P小于0.05,存在统计学差异。与tcia下载的免疫打分文件合并后,得到高低风险组之间的免疫打分,进行统计学比较,结果如图,可以得到结果:我们的预测模型预测低风险组患者在接受抗CTL4、抗PDL1以及两者联合治疗时,效果明显优于高风险组P<0.05。

a.  b.

Fig2:a.高低风险组在抗PD-L1治疗时,低风险组敏感性大于高风险组,p<0.05;b.高低风险组在抗CTL4治疗时,低风险组敏感性大于高风险组,p<0.05。

3讨论

我们的模型能够通过对患者进行风险评分,对于低风险组患者,我们建议行抗PD-L1或(和)抗CTLA4免疫治疗,能获得更好的疗效。更重要的是,希望通过本文,给广大同行提供思路,使用大数据来对疾病的治疗进行指导。

参考文献:

[1]肖亮, 周乐杜. 肝癌外科治疗理念的革新与挑战[J]. 中国普通外科杂志, 2021, 30(7):8.

[2]陆林敏, 张卫平. PD-1/PDL-1及CTLA-4抑制剂治疗原发性肝癌的研究进展[J]. 浙江医学, 2018, 40(13):4.

[3]胡文龙, 梁惠芳, 李明. 基于代谢相关基因的生物信息学分析构建肺鳞癌预后模型[J]. 临床肺科杂志, 2020, 25(11):8.

猜你喜欢

免疫治疗生物信息学肝癌
舒适护理在肝癌介入护理中的应用
免疫治疗:无效必改,效不更方
中国迎来肿瘤免疫治疗时代
靶向吲哚胺2,3—双加氧酶IDO的肿瘤免疫治疗小分子抑制剂研发进展
重视家族史 预防肝癌
“PBL+E—learning”教学模式探索
移动教学在生物信息学课程改革中的应用
中医大数据下生物信息学的发展及教育模式浅析
TACE术联合手术治疗中晚期肝癌患者65例临床观察