APP下载

基于坏死性凋亡相关LncRNA 的结肠腺癌临床预测模型的构建和验证

2023-06-28陈松鹤潘丹阳张科峰陈亚栋

中国现代医生 2023年12期
关键词:数据库

陈松鹤 潘丹阳 张科峰 陈亚栋

[摘要] 目的 基于癌症基因组图谱数据库(The Cancer Genome Atlas,TCGA)构建结肠腺癌坏死性凋亡相关长链非编码RNA(long non-coding RNA,LncRNA)临床预测模型与验证。方法 从TCGA 下载结肠腺癌转录组和临床数据,从基因集富集分析(gene set enrichment analysis,GSEA)、京都基因与基因组百科全书(Kyoto Encyclopedia of Genes andGenomes,KEGG)数据库及检索文献得到坏死性凋亡相关基因。运用R 软件通过共表达筛选出差异坏死性凋亡相关LncRNA,采用单因素分析筛选出预后相关坏死性凋亡LncRNA,运用Lasso 回归分析和多因素分析构建预后风险模型。通过差异分析、Kaplan-Meier 生存分析、风险分析、受试者工作特征曲线(receiver operating characteristic,ROC)曲线下面积(area under curve,AUC)、临床分组模型验证以评价该模型的可行性和准确性。采用多因素进行模型的独立预后分析,同时绘制Nomogram 图预测患者1 年、3 年和5 年的生存率,凭借校准曲线评价其准确性和预测能力。结果 坏死性凋亡LncRNA 共1039 个,预后相关的坏死性凋亡LncRNA 共46 个。Lasso 回归分析以AP005264.1、ALMS1-IT1、AL354993.2、LINC00513、AC145423.2、AC008764.8 构建预后风险模型,模型评价显示可区分高低风险组的患者,高风险的患者较低风险预后较差(P<0.05);AUC 显示模型具有较高的准确性;多因素分析显示风险评分可作为结肠腺癌的独立预后因子;临床分组的模型验证显示模型同时适用于不同年龄、性别、Stage、N、T 等临床症状;Nomgarm 分析内部验证中显示校准曲线显示具有良好的拟合度,提示该列线图预测模型具有良好预测能力。GSEA 富集分析结果显示在高风险组中活跃的功能或通路有缺口信号通路、磷脂酰肌醇信号系统、癌症的途径、JAK STAT 信号通路等,在低风险组中活跃的功能或通路有阿尔茨海默病、柠檬酸循环、亨廷顿病、氧化磷酸化等。结论 本研究建立了6 个坏死性凋亡LncRNA的预后风险模型,并进行了初步的功能或通路的分析,对结肠腺癌患者预后的预测和分子机制的探讨提供了参考。

[关键词] TCGA 数据库;坏死性凋亡;长链非编码RNA;结肠腺癌;临床预测模型

[中图分类号] R589   [文献标识码] A   [DOI] 10.3969/j.issn.1673-9701.2023.12.004

结直肠癌(colorectal cancer,CRC)是消化道常见的恶性肿瘤之一,好发于中老年人,具有恶性程度高、预后差的特点,常见的病理类型是结肠腺癌(colon adenocarcinoma,COAD)[1-2]。COAD 患者初期不具备典型的临床症状,仅少部分患者出现易忽视的轻微癥状,因此COAD 患者被发现时多数已达晚期,甚至出现肝、肺等远端转移。对COAD 患者初期进行有效的特异性筛查,提高早期检出率,寻找和探讨可靠的生物标志物和精准的治疗靶点,对COAD 的预后具有至关重要意义。细胞凋亡是一种基因介导的自主有序的程序性死亡,坏死性凋亡作为一种不同于凋亡的新型程序性坏死细胞死亡形式,在癌症中发挥着关键的作用[3-4]。本研究通过癌症基因组图谱数据库(The Cancer Genome Atlas,TCGA)收录的COAD 的转录组和临床数据进行分析,构建临床预测模型并验证,为COAD 治疗靶点和生物标志物的筛选提供新的思路与参考。

1 资料与方法

1.1 数据资料

从TCGA(https://portal.gdc.cancer.gov/)下载COAD 的基因转录组数据和临床资料,得到473 例结肠腺癌组织标本和41 例正常结肠组织标本基因表达数据,临床数据包含452 例结肠腺癌患者生存时间、生存状态、年龄、性别、肿瘤分期等。从基因集富集分析(gene set enrichment analysis,GSEA)、京都基因与基因组百科全书(Kyoto Encyclopedia ofGenes and Genomes,KEGG)数据库及检索文献得到坏死性凋亡相关基因67 个[5]。

1.2 差异表达的坏死性凋亡LncRNA 的筛选

运用R 软件的“Limma 和igraph”包以“相关系数>0.6、P<0.001”为筛选条件进行共表达分析寻找坏死性凋亡LncRNA,得到共表达网络。运用R 软件筛选肿瘤组和正常组的差异LncRNA,以“|log2FC|>1 和错误发现率<0.05”为阈值,进行聚类得到热图和火山图。

1.3 预后风险模型的构建与评价

将坏死性凋亡LncRNA 与生存数据合并,为减少统计学误差,剔除生存时间低于30d 的患者。运用R 软件“survival”包进行单因素分析,计算95%CIP<0.05 为差异有统计学意义,得到预后相关坏死性凋亡LncRNA,绘制森林图。通过Lasso 回归进一步分析,以7∶3 为比例随机分为训练组(n=291)和验证组(n=123),建立多因素预后风险模型,计算风险评分。依据风险评分中位数将两组患者区分为高风险组和低风险组。通过“ggplot2、ggalluvial”包进行预后相关LncRNA与基因正负调控的关系分析,绘制桑基图。运用Kaplan-Meier 法进行生存分析,绘制生存曲线;通过“pheatmap”包进行风险分析,观察患者风险与风险得分、生存状态、基因的关系。

1.4 独立预后分析

运用风险得分和临床资料,通过R 软件进行单因素分析来判断影响COAD 生存期的危险因素,进一步采用多因素进行独立预后分析,观察模型风险评分是否可以独立于其他临床性状作为独立预后因子。运用风险得分与临床资料,通过R 软件__进行年龄、性别、分期等不同临床分组的模型验证,观察模型是否同时适用于不同临床分组。运用风险得分和临床资料,通过R 软件“rms”包进行Nomogram 分析,并预测患者1 年、3 年、5 年的生存率。通过校准曲线内部验证列线模型的区分度和准确性,评价其预测能力。运用风险得分与表达数据,通过GSEA4.2.3 软件进行富集分析,并分别选取高低风险组中活跃的前五的功能与通路,通过R 软件构建多GSEA 富集图。

1.5 统计学方法

本研究数据均来源于TCGA 数据库,采用R 语言(R version 4.2.0)进行数据分析与可视化。生存分析采用Kaplan-Meier 法绘制生存曲线,采用单因素分析计算HR 和95%CI 筛选代谢相关基因。采用Lasso 回归分析和多因素分析构建预后风险模型。采用多因素进行模型独立预后分析。通过R 软件进行临床分组模型验证和Nomogram 分析,P<0.05 为差异有统计学意义。

2 结果

2.1 差异表达的坏死性凋亡LncRNA 的筛选

共表达分析得到8237 个坏死性凋亡LncRNA,对473 例结肠腺癌组织标本和41 个正常组织标本进行坏死性凋亡LncRNA 差异表达分析,得到差异表达的坏死性凋亡LncRNA 共1039 个,对筛选出坏死性凋亡LncRNA 进行聚类分析,绘制热图和火山图。

2.2 预后风险模型的构建

对1039 个差异表达的坏死性凋亡LncRNA进行单因素分析,得到46 个参与COAD 预后显著相关的坏死性凋亡LncRNA(P<0.05)。利用46 个预后相关的坏死性凋亡LncRNA 纳入Lasso 回归进一步分析,建立多因素预后风险模型,计算风险评分。

2.3 预后风险模型评价

预后相关LncRNA 与基因正负调控的关系分析显示均为正相关A。生存分析显示随着生存时间的增加,高低风险组的生存率下降,训练组和验证组高低风险组之间的生存比较,差异有统计学意义(P<0.05),提示模型可区分高低风险组的患者。风险分析结果显示随着患者风险依次增大,风险得分增加,依据中位值分为高和低风险两组。风险模型的风险得分与生存状态关系结果显示:随着患者风险增加,训练组和验证组的死亡率也逐渐增加。风险模型的风险得分与坏死性凋亡LncRNA 表达关系显示:训练组和验证组随着风险增大,坏死性凋亡LncRNA 表达下降为均低风险,如LINC00513;坏死性凋亡LncRNA 的表达上升为高风险, 如AP005264.1、ALMS1-IT1、AL354993.2、AC145423.2、AC008764.8 表达量。患者1 年、2 年、3 年生存率的ROC 曲线下面积(area under curve,AUC)分别为0.717、0.746 和0.700,显示模型预测患者生存期具有较高准确性。通过构建的模型与年龄、性别、分期等临床性状联合ROC 曲线分析显示AUC 分别为0.717、0.566、0.487 和0.774,提示该模型具有较好的预测能力。

2.4 独立预后分析

通过R 软件进行单因素和多因素分析,进一步评价模型的预测价值,单因素分析显示该模型风险评分、年龄、Stage 分期、T、M 和N 期为影响COAD总生存期的危险因素。多因素分析显示该模型风险评分可作为COAD 独立预后因子。

2.5 临床分组的模型验證

不同临床分组的模型验证结果显示所构建的模型同时适用于不同年龄、性别、Stage、N、T 等临床性状,但在M 期上差异无统计学意义。

2.6 Nomogram 分析及验证

使用Nomgarm 时,单个患者的分值位于每个变量轴上,向上画一条线来确定每个变量值的接收点数,数字的总和位于总分数点的数轴上,并向下绘制一条向下到生存轴的线,从而预测患者1、3 和5年生存的可能性。在模型的内部验证中,校准曲线显示具有良好的拟合度,说明该模型具有较好的准确性和预测能力。

2.7 GSEA 富集分析

GSEA 富集分析显示在高风险组中活跃前五的功能或通路分别为缺口信号通路、磷脂酰肌醇信号系统、小细胞肺癌、癌症的途径、JAK STAT 信号通路;在低风险组中活跃前五的功能或通路分别为阿尔茨海默病、柠檬酸循环、亨廷顿病、氧化磷酸化、帕金森病等。

3 讨论

细胞死亡最初包含两种经典的模式,分别为凋亡和坏死,凋亡是具有自发性和调控性的一种特殊的细胞程序性死亡方式。长期以来,坏死被认为是一种被动的、非程序性的、不受调节的死亡方式[6-7]。然而,随着对细胞死亡认识的不断深入,人们逐渐认识到不是所有的坏死均是被动发生的,其中最具有代表性的是Degterev 等[8]在2005 年发现了一种可被Necrostain-1 抑制的细胞死亡方式,其是一种受细胞有序调节的坏死途径,称为坏死性凋亡。坏死性凋亡同时具有凋亡及坏死的特征,表现为细胞膜完整性的丧失、细胞器肿胀和细胞内成分的外溢释放[9]。坏死性凋亡的发生需要受体相互作用蛋白激酶1、受体相互作用蛋白激酶3 和混合谱系激酶域样蛋白的参与,其诱导方式主要有肿瘤坏死因子、肿瘤坏死因子相关凋亡诱导配体、Toll 样受体、干扰素受体等,调控机制主要涉及泛素样修饰、磷酸化修饰、混合谱系激酶域样蛋白调控等[10-14]。

LncRNA 是一種长度>200 个核苷酸、不编码蛋白的RNA 种类,LncRNA 作为一种主要的调节因子主要通过表观遗传调控、转录调控和转录后调控等方式调节基因的表达[15]。本研究以坏死性凋亡相关LncRNA 为切入点构建COAD 的临床预测模型,通过Lasso 回归进一步筛选后得到包括ALMS1-IT1、LINC00513、AC145423.2、AP005264.1、AL354993.2、AC008764.8 在内的6 个坏死性凋亡相关LncRNA 参与预后风险模型的构建。长链非编码RNA 在调节肿瘤的进展中发挥着至关重要的作用,研究表明LncRNAALMS1-IT1 可能通过AVL9 介导的细胞周期蛋白依赖性激酶通路的激活促进肺腺癌的恶性进展[16]。Xing等[17]研究报道了ALMS1-IT1 能够在头颈部鳞状细胞癌中高表达,且具有较多的靶向miRNA 和蛋白质,表明ALMS1-IT1 在头颈部鳞状细胞癌的预后中起重要作用。除此之外,ALMS1-IT1 还能通过激活缺血性脑损伤中的NF-Kappa B 信号传导促进神经炎症[18]。干扰素受体是坏死性凋亡的诱导方式之一,研究表明,LINC00513 能够通过调节关键转录因子STAT1 和STAT2 的磷酸化来促进干扰素通路,表明LINC00513是Ⅰ型干扰素通路的新型正调节因子[19]。Xuan 等[20]报道利用自噬相关LncRNA 预测了透明细胞肾细胞癌的风险特征,揭示了AC145423.2 的预测价值。AP005264.1、AL354993.2、AC008764.8 等3 个LncRNA在过往的报道中未被提及,本研究揭示了以上LncRNA 在结肠腺癌的预测价值,为将来COAD 的基础实验提供了研究方向和参考。

为了研究受6 种LncRNA 影响的生物学途径,进行了GSEA 分析以确定富含低风险和高风险组的途径。结果显示,高风险组的通路主要与缺口信号通路、磷脂酰肌醇信号系统、癌症的途径、JAK STAT信号通路有关,以上途径均与癌症密切相关。高危组与癌症相关的丰富通路使高危组患者预后更差,死亡率更高。对于低风险组,活跃靠前功能或通路主要与神经系统疾病和代谢相关通路有关,可能表明,与高风险组相比,良好调节的神经功能和代谢调节是有助于改善低风险组预后和提高存活率的关键因素。

综上所述,本研究中构建并验证了与COAD 患者预后相关的基于6 种LncRNA 构建的风险模型。结果显示所构建的风险模型可以预测 COAD患者的生存时间和生存率,并可作为临床环境中的预后标志物,这些结果可用作未来COAD 患者管理的提供潜在预后和治疗意义。

[参考文献]

[1] HUANG L, ZHANG Y, LI Z, et al. MiR-4319 suppressescolorectal cancer progression by targeting ABTB1[J].United European Gastroenterol J, 2019, 7(4): 517–528.

[2] BRAY F, FERLAY J, SOERJOMATARAM I, et al.Global cancer statistics 2018: GLOBOCAN estimates ofincidence and mortality worldwide for 36 cancers in 185countries[J]. CA Cancer J Clin, 2018, 68(6): 394–424.

[3] YAN J, WAN P X, SWATI C, et al. Necroptosis andtumorprogression[J]. Trends Cancer, 2021, 8(1): 21–27.

[4] HUANG Y, ZOU Y, XIONG Q, et al. Development of anovel necroptosis-associated miRNA risk signature toevaluate the prognosis of colon cancer patients[J]. AnnTransl Med, 2021, 9(24): 1800.

[5] ZHAO Z R, LIU H H, ZHOU X Y, et al. NecroptosisrelatedLncRNAs: Predicting prognosis and thedistinction between the cold and hot tumors in gastriccancer[J]. J Oncol, 2021, 2021: 6718443.

[6] GROOTJANS S, VANDEN BERGHE T, VANDENABEELE P.Initiation and execution mechanisms of necroptosis: Anoverview[J]. Cell Death Differ, 2017, 24(7): 1184–1195.

[7] VANDEN BERGHE T, LINKERMANN A, JOUANLANHOUETS, et al. Regulated necrosis: The expandingnetwork of non-apoptotic cell death pathways[J]. Nat RevMol Cell Biol, 2014, 15(2): 135–147.

[8] DEGTEREV A, HUANGg Z, BOYCE M, et al. Chemicalinhibitor of nonapoptotic cell death with therapeuticpotential for ischemic brain injury[J]. Nat Chem Biol,2005, 1(2): 112–119.

[9] CAI Z, LIU Z G. Detection of MLKL oligomerizationduring programmed necrosis[J]. Methods Mol Biol,2018, 1857: 85–92.

[10] 劉加玉. GSK-3β 在坏死性凋亡中的作用[D]. 温州:温州大学, 2021.

[11] STOLL G, MA Y, YANG H, et al. Pro-necroticmolecules impact local immunosurveillance in humanbreast cancer[J]. Oncoimmunology, 2017, 6(4): e1299302.

[12] WANG Z, GUO L M, ZHOU H K, et al. Using drugs totarget necroptosis: Dual roles in disease therapy[J].Histol Histopathol, 2018, 33(8): 773–789.

[13] SNYDER A G, HUBBARD N W, MESSMER M N, et al.Intratumoral activation of the necroptotic pathwaycomponents RIPK1 and RIPK3 potentiates antitumorimmunity[J]. Sci Immunol, 2019, 4(36): eaaw2004.

[14] WANG W, MARINIS J M, BEAL A M, et al. RIP1kinase drives macrophage-mediated adaptive immunetolerance in pancreatic cancer[J]. Cancer Cell, 2018,34(5): 757–774.

[15] LIU C Y, ZHANG Y H, LI R B, et al. LncRNA CAIFinhibits autophagy and attenuates myocardial infarctionby blocking p53-mediated myocardin transcription[J].Nat Commun, 2018, 9(1): 1–12.

[16] LUAN T, ZHANG T Y, LV Z H, et al. The LncRNAALMS1-IT1 may promote malignant progression oflung adenocarcinoma via AVL9-mediated activation ofthe cyclin-dependent kinase pathway[J]. FEBS OpenBio, 2021, 11(5): 1504–1515.

[17] XING L, ZHANG X, CHEN A. Prognostic 4-LncRNAbasedrisk model predicts survival time of patients withhead and neck squamous cell carcinoma[J]. Oncol Lett,2019, 18(3): 3304–3316.

[18] LU P, ZHANG Y, NIU H, et al. Upregulated long noncodingRNA alms1-it1 promotes neuroinflammation byactivating NF-κB signaling in ischemic cerebral injury[J].Curr Pharm Des, 2021, 27(41): 4270–4277.

[19] XUE Z, CUI C, LIAO Z, et al. Identification ofLncRNA Linc00513 containing lupus-associated geneticvariants as a novel regulator of interferon signalingpathway[J]. Front Immunol, 2018, 9: 2967.

[20] XUAN Y, CHEN W, LIU K, et al. A risk signature withautophagy-related long noncoding rnas for predicting theprognosis of clear cell renal cell carcinoma: Based onthe tcga database and bioinformatics[J]. Dis Markers,2021, 2021: 8849977.

(收稿日期:2022-08-29)

(修回日期:2023-01-15)

猜你喜欢

数据库
超星数据库录入证
本刊加入数据库的声明
数据库
数据库
数据库
两种新的非确定数据库上的Top-K查询
数据库
国外数据库高被引论文排行TOP10
数据库
数据库