APP下载

共表达网络分析揭示新型生物标志物在胃腺癌患者生存预后中的应用价值

2019-06-21鄢传经胡清林徐成飞

胃肠病学和肝病学杂志 2019年6期
关键词:共表达差异基因腺癌

鄢传经, 胡清林, 严 海, 徐成飞, 王 昊

成都医学院第一附属医院胃肠外科,四川 成都 610500

胃腺癌是常见的消化系统恶性肿瘤之一,位居世界上癌性死亡相关疾病的第二位[1]。改善早期诊断技术和治疗方法是延长患者生存期的关键,但目前治疗进展期的胃腺癌疗效仍然很差[2]。进展期胃腺癌常以淋巴结途径和血行转移,以及腹膜播散的方式而复发,结果严重影响患者的预后生存时间[3]。尽管一些非手术治疗手段得到了应用,但是目前手术治疗和/或化疗仍是胃腺癌治疗的主要手段。因此,迫切需要改善早期诊断技术及开发新型的生物治疗手段,以提高治疗效率、减少手术创伤、延长患者预后生存。

基因芯片技术是近年来非常流行的一种检测组织或细胞基因表达的方法,由于其准确度高、操作方便及信息含量丰富而广泛应用于全基因组转录和翻译的检测[4]。并且这项技术也被大量用于胃腺癌组织和正常组织间基因差异的比较[5-6],从基因水平探索分子生物学变化在胃腺癌中的作用机制。因此,对大量信息的解读是了解疾病的重要步骤,也是用于发现新型生物标志物的重要过程。本研究即是对大量胃腺癌患者组织的基因芯片进行基因表达差异与共表达分析,探索用于诊断及患者预后生存时间分析的新型生物标志物。

1 材料与方法

1.1 基因芯片数据获取从国立癌症研究协会(National Cancer Institute,NCI)的基因组公共数据库(Genomic Data Commons,GDC)获取各个国家已经公开发布的胃腺癌患者的基因表达数据集,数据来源的病理组织类型限定为胃腺癌,芯片数据类型为RNA测序类型的芯片数据。排除甲基化、单核苷酸多态性及非编码RNA数据集等。

1.2 数据清理及标准化基因芯片数据获取后,可能因为芯片质量及操作原因引起部分探针检测的误差偏离所允许的范围[7]。因此,需要对数据集进行缺失值、离散值清理[7]。此外,因为原始数据集是以基因拷贝数记录的,因此,需要对数据集利用Log2转换成线性表达模型。

1.3 差异基因获取差异基因是癌组织和正常组织之间表达的基因存在显著差异,获取这些基因是缩小目标基因的范围,尽量避免造成假阳性基因的增多。本研究利用R软件的limma包对基因数据集进行差异分析,筛选标准为P<0.05,变化倍数(log2FoldChange,log2FC)>2,log2FC>0表示在癌组织中表达上调,反之则为下降。

1.4 共表达分析获取核心基因共表达分析是用于分析高维度性数据集的重要方法,也因此被用于基因组的分析以获取核心基因。本研究借用此方法探索差异基因间的基因簇及其之间的关系,根据Sij=|cor(xi,xj)|度量基因矩阵未签署的共表达相似性,并以aij=(sij)β作为基因间的关联强度,构建加权基因共表达网络。结果以关联强度大小筛选核心基因,用于对患者预后生存分析的探索。

1.5 核心基因表达水平检测收集胃腺癌患者的癌组织,并以正常胃组织作为对照,每组分别收集20例。然后将收集的标本集中保存在-20 ℃,等待收集足够的样本后,按照实时定量PCR(RT-PCR)所用试剂要求分别提取标本的总RNA,逆转录扩增核心基因,检测核心基因表达的相对值。最后通过标准化及取得平均值,并统计分析各组中核心基因的表达变化。

1.6 统计学分析对核心基因应用价值的统计学分析均在R软件里执行。获取的数据集包含患者的基本临床信息,其中包括各组样本数量、患者年龄、生存时间及是否应用抗幽门螺杆菌(H.pylori)治疗,以及根据美国癌症协会(American Joint Committee on Cancer,AJCC)对组织病理的癌症分级[8],包括肿瘤浸润(T)、淋巴结转移(N)和是否转移(M)的分级。根据这些基本信息判断核心基因是否对患者的预后生存存在影响,以及对胃腺癌诊断的应用价值(如特异性、敏感性、准确性等)。

2 结果

2.1 患者基本临床信息如表1所示,本研究共获取443个样本的基因芯片数据,对照组样本来源于正常组织或胃腺癌患者的非癌性组织。男性是胃腺癌患者的主要群体(65.2%),患者年龄普遍较高,死亡率高。白种人较亚洲人数较少,差异有统计学意义(P=0.000);联合应用抗H.pylori治疗的人数较少,组间差异有统计学意义(P=0.033),具有进一步的研究价值。在癌组织中,肿瘤分级明显高于对照组,差异有统计学意义(P=0.004)。

表1 肿瘤组和对照组的基本特征Tab 1 Characteristics of tumor and control tissue

注:*:其他指纳入文献结果中有对其他菌群感染的报道,但与H.pylori无关,故无法判断是否有无H.pylori感染。NA指纳入文献结果中未提及菌群感染的内容。同上,还有其他的分级指标等。

2.2 性别、种族、抗H.pylori治疗、肿瘤级别等对患者生存时间的影响通过以上初步获取的信息,本研究进一步分析了性别、种族、抗H.pylori治疗和肿瘤级别对患者生存时间的影响。如图1所示,基于Kaplan-Meier估算方法,发现性别(见图1A)和肿瘤级别(见图1D)对患者生存时间的影响差异无统计学意义(P>0.05),但是处于肿瘤Ⅳ级的患者,其生存时间显著短于其他肿瘤分级的患者;种族因素(见图1B)和是否经过抗H.pylori治疗(见图1C)对患者的生存时间存在显著影响(P<0.05),表明白种人或经过抗H.pylori治疗的患者生存时间延长。

2.3 差异基因及核心基因的获取本研究选择P<0.05,|log2FC|>2作为差异基因的筛选标准,结果共获取1 709个差异基因。对差异表达的基因构建了加权基因共表达网络(见图2),筛选标准为关联度阈值β=10,连接度degree=5,最终共获取23个核心基因(见表2)。

图1 性别、种族、抗H.pylori治疗和肿瘤级别对患者生存时间的影响 A:性别;B:种族;C:抗H.pylori治疗;D:肿瘤级别 Fig 1 Effects of sex, race, anti-H.pylori and tumor stage on patients with gastric adenocarcinoma A: sex;

核心基因基因名称log2FCP值FDRMALmal, T-cell differentiation protein-8.784.77×10-211.02×10-17ENDOUendonuclease, poly(U) specific-8.088.51×10-172.85×10-14CERS3ceramide synthase 3-8.621.21×10-152.26×10-13SPRR2Bsmall proline rich protein 2B-6.915.27×10-157.50×10-13MUC21mucin 21, cell surface associated-12.282.79×10-142.68×10-12GBP6guanylate binding protein family member 6-8.754.78×10-144.23×10-12MS4A10membrane spanning 4-domains A10-7.741.23×10-139.17×10-12CRNNcornulin-11.925.80×10-122.40×10-10EVA1Aeva-1 homolog A, regulator of programmed cell death3.647.73×10-123.02×10-10RHCGRh family C glycoprotein-9.711.50×10-115.23×10-10TMEM79transmembrane protein 79-3.052.37×10-117.61×10-10KRT13keratin 13-11.248.00×10-112.14×10-09RNASE2ribonuclease A family member 25.41.02×10-102.65×10-09

续表2

核心基因基因名称log2FCP值FDRPGLYRP3peptidoglycan recognition protein 3-6.341.16×10-102.97×10-09PAX9paired box 9-4.992.20×10-105.04×10-09SPRR3small proline rich protein 3-9.443.31×10-095.05×10-08IL1RNinterleukin 1 receptor antagonist-3.484.32×10-096.40×10-08NEGR1neuronal growth regulator 1-2.337.80×10-091.06×10-07APOA2apolipoprotein A2 4.842.59×10-082.96×10-07A2ML1alpha-2-macroglobulin like 1-7.632.66×10-083.03×10-07PGM5phosphoglucomutase 5-2.661.34×10-071.22×10-06CAP2cyclase associated actin cytoskeleton regulatory protein 2-2.055.16×10-073.89×10-06MYH11myosin heavy chain 11-2.845.35×10-062.90×10-05

注:FDR:false discovery rate。

图2 加权基因共表达网络 Fig 2 Weighted genes co-expression network

2.4 核心基因对患者生存时间的影响经过逐个基因分析后,共获取8个基因对患者生存时间存在显著影响(见图3),分别为APOA2(P=0.0005,见图3A)、MAL(P=0.026,见图3B)、MYH11(P=0.014,见图3C)、PGM5(P=0.0084,见图3D)、CAP2(P=0.028,见图3E)、EVA1A(P=0.004,见图3F)、GBP6(P=0.014,见图3G)和MS4A10(P=0.033,见图3H)。

2.5 核心基因表达检测结果如图4所示,本研究选择对患者生存时间有显著影响的8个核心基因作为研究对象,通过RT-PCR检测结果可知,这些核心基因在胃腺癌和正常组织中均表现出明显的差异性(P<0.05)。

图3 核心基因对胃腺癌患者生存时间的影响 Fig 3 Effects of the hub genes on survival time of patients with gastric adenocarcinoma

注:*P<0.05。

2.6 核心基因的生物学诊断特性对本研究获取的8个核心基因的诊断特性进行概括(见图5)。MAL的AUC值最大,其敏感性也最高,而特异性最高的是基因EVA1A,区分度最差的是基因MS4A10。

3 讨论

通过对胃腺癌患者基因表达芯片数据和临床资料的分析,本研究可以得出以下结论:(1)患有胃腺癌的亚洲人(黄种人)的生存时间明显短于白种人,且男性患者短于女性;(2)经过抗H.pylori治疗的患者,其生存时间明显长于未经此治疗的患者;(3)在获取的23个核心表达的差异基因中,只有8个基因对胃腺癌患者的生存预后存在显著影响,分别为MAL、GBP6、MS4A10、EVA1A、APOA2、PGM5、CAP2和MYH11;(4)在这8个显著相关的基因中,以MAL基因对胃腺癌的鉴别诊断价值最高,敏感性也最高,而特异性最高的是基因EVA1A。

图5 核心基因用于诊断胃腺癌的特性

Fig 5 Diagnostic characteristic of hub genes in gastric adenocarcinoma

MAL也称为T细胞分化蛋白或T淋巴细胞成熟相关的蛋白,是位于第2号染色体长臂上的髓磷脂和淋巴细胞相关蛋白基因,已经在胃癌[9]中报道能够抑制胃癌转移,与胃癌淋巴结转移和预后有关[10],且在有淋巴结转移的患者中处于低表达水平。此外,MAL基因在乳腺癌[11]患者中表达也显著降低,在口腔鳞状细胞癌中[12]的表达也明显低于正常上皮组织。EVA1A是细胞程序死亡调节蛋白,在胃腺癌中表达升高,提示可能与患者生存时间相关,但是目前仍未报道关于此基因对胃腺癌患者的影响。而在胰腺肿瘤中和胰腺α细胞中表达异常升高[13],提示可能与其发病机制有关。因此,这些在本研究中发现的与胃腺癌患者生存预后明显相关的基因,均在作为患者预后辅助诊断方面存在潜在的应用价值。

H.pylori是人胃中能够生长的微生物当中的优势菌种,定植后可以导致持续的炎症反应,由H.pylori诱导的胃炎是胃癌最强的单一危险因素[14]。尽管许多研究发现,H.pylori感染与胃癌发生风险之间存在关联,但在胃癌患者中,临床上实行根治性抗H.pylori治疗的比例仍然很低[15]。有研究调查表明,在胃癌患者群体中,因H.pylori感染导致的胃癌比例在某些地方为60%~90%[16],通过消除潜在的H.pylori感染因素,将有效降低胃癌患者的发病率和死亡率[17],尤其是在H.pylori感染率高和胃癌发病率高的人群中。但是,越来越多的研究显示,H.pylori菌种类型和宿主的遗传倾向对胃癌发展风险的影响差异很大[18-19],这对目前单一的抗H.pylori治疗提出了很大的挑战。但是,对于辅助治疗胃癌及其消化系统相关肿瘤,提倡根治性抗H.pylori治疗依然具有重要意义[15]。

总之,本研究通过对大量胃腺癌的基因表达芯片数据的分析,从基因水平对胃腺癌的特征获得了更好的了解,对进一步了解胃腺癌患者的预后生存提供了帮助,也为临床治疗胃腺癌及消化系统相关的肿瘤提出了抗H.pylori治疗的重要辅助作用。相信在不久的将来,对胃腺癌患者的预后生存及肿瘤进展的判断将会有更准确、更高效的检测方法和治疗措施被发现和使用。

猜你喜欢

共表达差异基因腺癌
SO2引起巨峰葡萄采后落粒的共表达网络和转录调控分析
云南地区多结节肺腺癌EGFR突变及其临床意义
十二指肠腺癌88例临床特征及相关预后因素
UdhA和博伊丁假丝酵母xylI基因共表达对木糖醇发酵的影响
以盆腔巨大包块就诊的宫颈微偏腺癌2例报告
高世代回交玉米矮秆种质的转录组分析
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
两种半纤维素酶在毕赤酵母中的共表达
紫檀芪处理对酿酒酵母基因组表达变化的影响
术后抗幽门螺杆菌治疗对Ⅲ期贲门腺癌预后的研究