APP下载

食管鳞癌差异表达基因鉴定及亚洲人食管鳞癌预后lncRNA功能分析

2019-05-20李雨濛马佳康任凯凯侯明宇蔺小艳刘宗文

胃肠病学和肝病学杂志 2019年5期
关键词:调控数据库蛋白

李雨濛, 马佳康, 任凯凯, 侯明宇, 蔺小艳, 刘宗文, 马 军, 袁 翎

1.郑州大学第二附属医院肿瘤科,河南 郑州 450014; 2.郑州大学消化疾病研究所; 3.郑州大学第二附属医院检验科; 4.河南省肿瘤医院放疗科

食管癌是世界上最常见的恶性肿瘤之一,具有高发病率、高死亡率的特点[1]。关于食管癌的具体发病机制目前并不清楚,既往研究表明长链非编码RNA(long non-coding RNA,lncRNA)可能参与ESCC的发生、发展、侵袭和转移[2-3]。lncRNA是长度>200 个核苷酸的非编码RNA[4],与人类众多疾病的发生、发展都有着密切的联系[5]。竞争性内源RNA(competitive endogenous RNA,ceRNA)是一种全新的基因表达调控模式。ceRNA调控机制认为:当lncRNA与mRNA存在相同的miRNA反应元件(MRE)时,它们之间可以竞争相同种类的miRNA,从而抑制miRNA导致的mRNA降解,从而在机体的病理生理过程中发挥重要的调控作用[6-7]。既往研究已证明ceRNA调控不同类型肿瘤包括ESCC的进展[8-10]。本研究用TCGA数据库构建了ESCC相关lncRNA-miRNA-mRNA的ceRNA调控网络,利用GEO中ESCC数据对差异lncRNA进行验证,预测这些lncRNA在ESCC中调控机制。

1 材料与方法

1.1 数据下载与分析TCGA数据下载与差异表达基因筛选方法参见文献[11]。GEO(https://www.ncbi.nlm.nih.gov/geo/)数据集GSE89102、GSE97051中,GSE89102包括5例肿瘤组织及5例正常组织;GSE97051包括7例肿瘤组织及7例正常组织,差异基因筛选用R语言的“limma”包,筛选条件为:logFold change>1,Padj<0.05;用“limma”包绘制韦恩图,用“Survival”软件包进行生存相关性进行分析;用“clusterProfiler”及“org.Hs.eg.db”包进行KEGG分析。Cytoscape软件制作ceRNA网络图,“ClueGO”、“CluePedia”APP进行GO分析。

1.2 蛋白互作网络利用在线软件STRING(https://string-db.org/)寻找蛋白质之间的相互作用关系。相关图表利用Cytoscape中的“stringAPP”完成。

2 结果

2.1 ESCC中差异表达lncRNA、miRNA、mRNA筛选TCGA数据库中ESCC mRNA测序数据包括81例肿瘤样本、11例正常组织样本;miRNA测序数据包括肿瘤组织样本95例、正常样本13例,差异基因分析结果见表1和图1。

表1 TCGA中ESCC差异表达基因Tab 1 Overview of differentially expressed RNAs in TCGA 比例/%

注:A、D:lncRNA;B、E:miRNA;C、F:mRNA。图1 ESCC及癌旁组织转录组表达谱聚类分析和火山图Fig 1 Transcriptome expression profiling in ESCC tissues and adjacent non-tumor esophageal tissues

2.2 ceRNA网络构建为了进一步揭示这些差异RNA之间的相互作用关系,我们构建了lncRNA-miRNA-mRNA相关的ceRNA调控网络。73个lncRNA、9个miRNA、13个mRNA参与构建了ceRNA网络(见图2)。通过这一调控网络我们注意到,miRNA204、miRNA205和所有13个mRNA有关联,我们推测这两个miRNA在ESCC转录调控中发挥重要作用。共有47个lncRNA和miRNA204、miRNA205相关联,其中FER1L6-AS1、MIR205HG、TM4SF19-AS1、ADAMTS9-AS2、SOX2-OT、HOTTIP、RMST这7个lncRNA可同时调控miRNA-204及miRNA-205。

2.3 差异表达lncRNA GEO数据验证我们将TCGA筛选出的差异lncRNA在GEO数据库中进行验证。GSE89102数据集中共筛选出3 403个差异lncRNA,与TCGA共有25个lncRNA(见图3A);GSE97051数据集中筛选出1 254个差异lncRNA,在TCGA中出现1个lncRNA(见图3B)。我们将挑选出的26个差异lncRNA进行下一步的研究。

注:红色表示表达水平增加;蓝色表示表达水平降低。三角形、圆形和八边形分别代表miRNA、mRNA及lncRNA。图2 ESCC相关ceRNA网络Fig 2 Competing endogenous RNA network in ESCC

图3 TCGA和GEO共表达lncRNA韦恩图Fig 3 Venn Diagram of co-expression lncRNA between TCGA and GEO

2.4 亚洲ESCC生存相关lncRNA筛选为了探讨与亚洲人群ESCC总生存率(OS)相关的lncRNA,对这26个lncRNA进行OS分析,结果显示3个lncRNA与亚洲ESCC患者生存显著相关:AC009264.1、PGM5-AS1和LINC00460(见表2、图4)。

2.5 lncRNA靶基因预测及GO、KEGG分析为了研究这3个预后lncRNA在ESCC发生过程中发挥的作用,我们进行了GO功能富集分析和KEGG通路分析。首先利用MEM在线软件对lncRNA进行靶基因预测,根据相关性选取前50个作为目标靶基因(见表3)。GO分析发现3个预后lncRNA靶基因主要参与肌动蛋白结合、黏着斑、细胞基质黏附、平滑肌收缩、肌肉收缩)等过程。KEGG分析发现3个预后靶基因主要参与黏着斑、血管平滑机收缩、癌症相关蛋白多糖、细胞骨架调节、钙信号通路等(见图5)。

表2 生存相关的lncRNA的基因坐标和表达信息(TCGA数据库)Tab 2 Genomic coordinates and expressed information for survival-associated lncRNAs(TCGA Database)

图4 总生存相关的3个lncRNA 的Kaplan-Meier生存曲线Fig 4 Kaplan-Meier survival curves for 3 lncRNAs associated with overall survival

表3 生存相关lncRNA MEM靶基因预测Tab 3 Survival-associated lncRNAs targets predicted by MEM

注:根据Score值排序,每个lncRNA展示排名前10位的预测靶基因。

2.6 预后lncRNA蛋白互作网络对于3个lncRNA的150个可能靶基因,通过STRING在线分析其相应编码蛋白质之间的相互作用关系,结果显示:有69个编码蛋白质之间存在相关作用关系,其中TP63只与S100A2之间存在相互作用;CACNA2D4与CATSPER1、GPR158存在相互作用,其余64个编码蛋白质形成包含108个互相作用关系的蛋白互作网络(见图6)。从图中我们可以看出:NTS、ITGA1、SERPINE1、MYLK、MET、CAV1、PLAUR位于网络的中心,与多种蛋白质之间存在相互作用。

3 讨论

ESCC是最常见的恶性肿瘤之一,其发生机制至今仍不清楚。由于缺乏良好的生物标志物,其诊断和治疗效果目前并不理想。

越来越多的证据表明ceRNA在基因表达调控中起重要作用,并参与肿瘤的生成与进展[12]。关于ESCC ceRNA的研究相对较少,己糖激酶2(HK2)作为癌基因已被先前的研究证实,并且HOTAIR可通过直接结合miR-125和miR-143促进HK2的表达进而促进ESCC的肿瘤发生[13]。miR-338抑制CST3蛋白的表达、促进凋亡蛋白caspase-8/3的表达,而lncRNA Snhg1可以结合miR-338减轻CST3的抑制。Snhg1/miR338/CST3 ceRNA网络可促进细胞增殖,抑制ESCC细胞凋亡[10]。本研究中,我们从TCGA数据库ESCC测序数据中筛选出差异RNA,并成功构建了lncRNA-miRNA-mRNA调控网络,这可能对研究ESCC生成、进展相关机制提供新的方法。lncRNA CASC9作为一种致癌基因通过招募EZH2负调控PDCD4的表达,进而改变H3K27me3的水平,从而调控ESCC的发展进程[3]。GHET1的表达在ESCC组织样本和细胞系中显著增加,高表达GHET1与分化差、肿瘤转移晚期和淋巴结转移显著相关;GHET1通过促进ESCC EMT而促进肿瘤的侵袭与转移[14]。

注:A:生物过程排;B:细胞组分;C:分子功能;D:KEGG。图5 GO、KEGG分析Fig 5 GO and KEGG analysis

图6 生存相关lncRNA靶基因PPI网络Fig 6 PPI network of all survival-associated lncRNAs targeted genes

本研究分析表明,lncRNA AC009264.1、PGM5-AS1和LINC00460与亚洲人ESCC患者的总体生存密切相关。其中lncRNA AC009264.1、PGM5-AS1与患者生存呈负相关,LINC00460与患者生存呈正相关。研究[15]发现,PGM5-AS1的高表达与结直肠癌患者总体生存率较差相关。我们的研究结果与其一致。LINC00460在鼻咽癌、宫颈鳞癌和肾癌中高表达与患者预后不良显著相关[16-17],但本研究结果显示LINC00460在ESCC中低表达。

对这3个生存相关lncRNA进行靶基因预测并对靶基因进行GO、KEGG分析表明,这3个lncRNA可能参与ESCC的形成与进展。我们还成功构建了这3个与亚洲人ESCC预后相关lncRNA靶基因的蛋白互作网络,这为我们从蛋白质角度研究亚洲人ESCC的分子机制、药物作用的新靶点提供了可能。

猜你喜欢

调控数据库蛋白
RNA结合蛋白与恶性肿瘤发生发展关系的研究进展
楼市调控是否放松
碘-125粒子调控微小RNA-193b-5p抑制胃癌的增殖和侵袭
人工驯养树鼩精子发生过程中MCM7蛋白的表达
如何调控困意
经济稳中有进 调控托而不举
数据库
数据库
数据库
数据库