APP下载

肺腺癌预后关键基因的筛选、验证及其调控通路分析

2020-08-26李昂谢俞宁仵红娇李佳莹张雪梅

山东医药 2020年23期
关键词:腺癌生存率关键

李昂,谢俞宁,仵红娇,李佳莹,张雪梅

华北理工大学,河北唐山063210

肺癌是全球最常见的恶性肿瘤之一,可分为小细胞肺癌和非小细胞肺癌(NSCLC),其中NSCLC约占肺癌的85%[1,2]。目前针对肺癌的治疗方法主要有手术切除、化疗和靶向治疗,但是NSCLC患者的5年生存率仅为17%[3]。肺腺癌是NSCLC中最常见的亚型,其发病率逐年上升且患者预后较差。因此,临床亟需深入研究肺腺癌的发生发展机制,并寻找潜在的关键预后标志物。近年来,利用高通量测序技术检测大量基因表达变化,并结合生物信息学方法系统分析肿瘤相关基因及其调控机制,已成为功能基因组学的一种重要研究手段,广泛应用在筛选肿瘤潜在生物标志物的研究中。2020年3~4月,本研究整合了癌症基因组图谱(TCGA)和GEO数据库中的肺腺癌预后相关mRNA数据,筛选出肺腺癌预后关键基因并进行验证,以期为肺腺癌的分子机制研究及预后判断提供依据。现报告如下。

1 方法

1.1 数据获取 通过TCGA数据库下载556例份肺腺癌组织和59例份正常肺组织样本的转录组数据及500例肺腺癌患者的临床资料。使用GEO数据库(http://www.ncbi.nlm.nih.gov/geo/)检索肺腺癌组织芯片数据,最终选用GSE10072、GSE43458、GSE32863三个与肺腺癌相关的mRNA芯片进行后续分析,见表1。

表1 肺腺癌相关GEO数据集的基本信息

1.2 共同差异表达基因筛选 使用R语言“edgeR”程序包对TCGA数据库中肺腺癌表达谱数据进行标准化及差异分析,同时运用“limma”包分别对GEO数据库中三个与肺腺癌相关的mRNA芯片进行差异表达基因筛选(|log2FC|>1,P<0.05),并绘制差异表达基因火山图。使用FunRich工具构建TCGA与GEO数据库中差异表达基因的Venn图,选择共同差异表达基因进行后续分析。

1.3 肺腺癌预后关键基因筛选 对TCGA和GEO数据库筛选出的共同差异基因进行单因素COX回归分析,筛选与肺腺癌患者预后相关的基因。采用LASSO回归分析,进一步缩小预后相关基因的范围,以保证结果稳定性。最后对LASSO回归分析筛选出的肺腺癌预后相关基因进行多因素COX回归分析,得到肺腺癌预后相关的独立预测因子,即预后关键基因。

1.4 肺腺癌预后关键基因的验证

1.4.1 风险评分验证 以1.1中TCGA数据库中的500例肺腺癌患者为研究对象,采用风险评分公式计算每个样本的风险评分,风险评分=(0.858 91×DCN)+(1.380 54×ECT2)+(1.429 83×RRAS)+(0.946 68×PCP4)。以风险评分的中位数作为临界值,将患者分为高风险组和低风险组。绘制生存曲线,比较两组5年生存率;绘制该风险评分预测肺腺癌患者5年生存率的ROC曲线,以验证其准确性。

1.4.2 癌组织预后关键基因表达与肺腺癌患者预后的关系 ①预后关键基因表达分析:采用GEPIA在线数据库(http://gepia.cancer-pku.cn/)分析预后关键基因表达,该数据库包括来自TCGA和GTEx数据库的肺腺癌组织9 736例份与正常肺组织8 587例份。②肺腺癌组织中预后关键基因表达水平与患者预后的关系分析:使用Kaplan Meier-plotter数据库(http://www.kmplot.com/)计算出各基因相对表达量的最佳截断值,根据此最佳截断值将患者分为高、低表达者,绘制生存曲线,比较其5年生存率。

1.5 预后关键基因的调控通路分析 在分子特征数据库(MSigDB,http://software.broadinstitute.org/gsea/msigdb/index.jsp),下载“c2.cp.kegg.v7.0.symbols.gmt”基因集作为参考基因集。根据预后关键基因的表达中值,将肺腺癌组织分为高表达组和低表达组。利用R包“GSVA”对TCGA数据库中肺腺癌差异基因的RNA测序数据进行基因集变异分析(GSVA),以P<0.01为标准,分析与预后关键基因表达相关的通路。

2 结果

2.1 肺腺癌组织差异表达基因筛选结果 在TCGA数据库中肺腺癌表达谱分析结果显示,共得到差异表达基因4 815个,其中上调基因2 879个、下调基因1 936个。在GEO数据库中对GSE10072、GSE43458、GSE32863三个有关肺腺癌的mRNA芯片表达数据分析结果显示,共得到差异表达基因178个,其中上调基因34个、下调基因144个。两个数据库的共同差异表达基因共166个。

2.2 肺腺癌预后关键基因筛选结果 单因素COX回归分析结果显示,共获得与肺腺癌患者预后相关基因75个(P均<0.05),按照P值由小到大排序,前10个与肺腺癌患者预后相关的基因见表2。LASSO回归分析结果显示,共筛选出19个与肺腺癌预后相关的关键基因,分别为SFTPC、TNNC1、FAM189A2、KLF4、CYP4B1、DPYSL2、IL33、DCN、CRTAC1、ECT2、SCGB1A1、IGF2BP3、SLC7A5、RRAS、WASF3、ARHGEF6、FBLN5、TIMP1、PCP4。多因素COX回归分析结果显示,DCN、RRAS、ECT2、PCP4是肺腺癌预后相关的独立预测因子(P均<0.05)。见表3。

表2 前10个与肺腺癌预后相关基因的单因素COX回归分析结果

2.3 风险评分验证结果 以风险评分的中位数0.948 374 4作为截断值,将患者分为高风险组和低风险组,每组250例。高、低风险组5年生存率分别为29.3%、48.4%,两组比较P<0.01。见图1。该风险评分预测肺腺癌患者5年生存率的ROC曲线下面积(AUC)为0.628,见图2。

表3 肺腺癌预后相关基因的多因素COX回归分析结果

图1 高风险组和低风险组的生存曲线

图2 该风险评分预测肺腺癌患者5年生存率的ROC曲线

2.4 肺腺癌组织中预后关键基因表达与患者预后的关系 GEPIA数据库分析结果显示,肺腺癌组织中DCN、RRAS mRNA表达均低于正常肺组织,ECT2、PCP4 mRNA表达均高于正常肺组织(P均<0.05)。见图3。DCN、RRAS、ECT2、PCP4高表达者的5年生存率分别为67.0%、51.0%、54.4%、57.7%,低表达者分别为52.5%、65.9%、65.1%、70.1%;RRAS(HR=1.65)、PCP4(HR=1.7)、ECT2(HR=1.38)高表达者5年生存率明显低于低表达者,DCN(HR=0.46)高表达者5年生存率明显高于低表达者(P均<0.01)。见图4。

2.5 肺腺癌预后关键基因的调控通路分析结果 GSVA结果显示,DCN高表达组相关调控通路富集在细胞黏附、JAK-STAT信号、补体和凝结级联、NK细胞介导的细胞毒性、Toll样受体等途径;RRAS高表达组相关调控通路富集在溶酶体、硫代谢、糖胺聚糖降解等非肿瘤相关途径;ECT2高表达组相关调控通路富集在同源重组、核苷酸切除修复、错配修复、DNA复制和细胞周期等途径;PCP4高表达组相关调控通路富集在趋化因子信号、细胞黏附等途径。

注:A为DCN,B为ECT2,C为RRAS,D为PCP4。

注:A为DCN,B为ECT2,C为RRAS,D为PCP4;-----为高表达者,——为低表达者。

3 讨论

本研究基于GEO和TCGA公共数据库,在全基因组水平上分析了肺腺癌组织的遗传学特征,以期发现在癌症预后中显著改变的基因及潜在标志物。本研究将LASSO引入到COX回归模型中[4],共筛选得到DCN、RRAS、PCP4、ECT2这4个与肺腺癌患者预后显著相关的关键基因,并通过Kaplan Meier和ROC曲线进行了验证。目前,DCN、RRAS、PCP4、ECT2在肺腺癌及其他恶性肿瘤中的报道比较少。DCN是一种富含亮氨酸的蛋白聚糖,其过表达可显著抑制肺腺癌进展[5]。DCN 5′-UTR的甲基化与其表达降低相关,可增强具有高转移潜能的NSCLC细胞中TGF-β/Smad信号传导[6]。一项乳腺癌相关的Meta分析结果表明,DCN高表达与乳腺癌患者预后良好相关[7]。RRAS是RAS超家族成员之一,在多种组织中均有表达,可调节细胞黏附、迁移和分化。研究发现,RRAS在乳腺癌组织中低表达,并且RRAS可抑制乳腺癌细胞增殖、迁移和细胞周期过程[8]。此外,RRAS还可通过激活PI3K/AKT/mTOR信号传导途径,促进宫颈上皮细胞增殖[9,10]。目前尚未有RRAS与癌症预后关系的相关报道。本研究生物信息结果分析发现RRAS在肺腺癌组织中低表达,且低表达患者预后良好。分析原因,可能是RRAS低表达仅参与了肺腺癌的发生,但不会促进肺腺癌进展,但仍需要进一步实验进行验证。既往相关研究表明,PCP4不仅可作为食管癌的预后标记基因[11],还可抑制上皮间充质转化和促进细胞凋亡,是乳腺癌治疗的潜在靶点[12]。ECT2是Rho家族中GTP酶的鸟嘌呤核苷酸交换因子[13],高表达的ECT2与许多肿瘤的发生、发展有关,是肺腺癌患者总体生存率低的独立危险因素[14],这与我们的研究结果相一致。Luo等[15]研究发现,结直肠癌组织中ECT2表达升高与TNM分期及患者总体存活率降低显著相关。Wang等[16]研究表明,ECT2在乳腺癌的发生、发展中具有重要作用,并具有独立的预后预测价值,或可成为乳腺癌治疗的新靶点。

为了进一步探讨DCN、RRAS、ECT2和PCP4在肺腺癌中的潜在机制,本研究基于TCGA表达谱数据进行了GSVA。结果显示,RRAS高表达组相关调控通路富集在溶酶体、硫代谢、糖胺聚糖降解等非肿瘤相关途径,或许这也是RRAS在肺腺癌中研究较少的原因;DCN高表达组相关调控通路富集在细胞黏附、JAK-STAT信号、补体和凝结级联、NK细胞介导的细胞毒性、Toll样受体等途径,进一步表明DCN可通过免疫途径抑制肺腺癌的发生发展,从而影响患者预后;ECT2高表达组相关调控通路富集在同源重组、核苷酸切除修复、错配修复、DNA复制和细胞周期等途径,上述途径与肺腺癌细胞增殖过程的激活有关;PCP4高表达组相关调控通路富集在趋化因子信号、细胞黏附等途径。以上发现为DCN、RRAS、ECT2和PCP4影响肺腺癌患者预后的相关机制提供了新的见解。

猜你喜欢

腺癌生存率关键
硝酸甘油,用对是关键
云南地区多结节肺腺癌EGFR突变及其临床意义
十二指肠腺癌88例临床特征及相关预后因素
肿瘤复发,为何5 年是一个坎
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
高考考好是关键
“五年生存率”不等于只能活五年
影响胃癌术后5 年生存率的因素分析
日本首次公布本国居民癌症三年生存率
术后抗幽门螺杆菌治疗对Ⅲ期贲门腺癌预后的研究