APP下载

多个GEO芯片联合分析筛选鼻咽癌易感基因

2020-12-24王晓琼金巧智陈武兵蔡志毅

温州医科大学学报 2020年1期
关键词:基因簇基因芯片差异基因

王晓琼,金巧智,陈武兵,蔡志毅

(1.温州医科大学附属第二医院 耳鼻喉科,浙江 温州 325027;2.台州市立医院 耳鼻咽喉科, 浙江台州 318000)

鼻咽癌是头颈部最常见的恶性肿瘤之一,高发于中国两广及江浙一带[1]。鼻咽癌的临床特征是:恶性程度高、解剖位置隐蔽、症状不典型,容易被忽视和误诊,4年远处转移率为30%~40%,5年生存率仅为70%[2]。研究表明,鼻咽癌的发病与多种因素有关,包括遗传易感性、环境因素、饮食和EB病毒感染[3]。目前鼻咽癌的发病机制尚不十分清楚,临床上常采用调强放射治疗和同步放化疗,但鼻咽癌患者的总体生存率并没有明显提高。因此,探求其动态发展的分子机制,对降低复发和转移率具有重要意义。基因芯片技术和生物信息学方法系统分析肿瘤相关基因及其调控机制是当前功能基因组学的一种重要研究手段[4-5]。本研究利用生物信息学技术挖掘鼻咽癌相关基因芯片,分析其差异表达基因并构建蛋白相互作用网络,进而挖掘关键网络节点。

1 资料和方法

1.1 资料 基因表达谱芯片筛选及数据处理利用美国国立生物技术信息中心(NCBI)平台下的基因表达综合数据库(Gene Expression Omnibus,GEO)检索含有人源鼻咽癌样本的芯片,选取基因芯片GSE12452、GSE13597、GSE64634,见表1。利用R语言软件包Affy(version 1.50.0,http://bioconductor.org/help/search/index.html?q=affy/)对数据进行表达值背景矫正和表达谱数据的归一化预处理,包括原始数据格式的转换,缺失值补充,背景矫正,以及用分位数法进行数据标准化。

1.2 差异表达基因筛选 采用R语言Limma数据包对鼻咽癌与正常组织进行差异表达基因筛选,筛选标准为P<0.05,|FC(fold change)|≥1.5(|log2FC|≥0.585);并将探针名转化为标准基因名,分别绘制差异表达基因火山图。筛选出共同差异表达基因,根据log2FC值对基因进行排序,然后进行Rank分析(FDR<0.05,矫正方法为bonferroni矫正法),绘制共同差异基因log2FC热图。

表1 3套鼻咽癌基因芯片基本信息

1.3 基因功能富集和注释 基于前述所得差异表达基因,通过DAVID在线软件(https://david.ncifcrf.gov),依据基因本体(Gene Ontology,GO)数据库对差异表达基因进行生物学功能注释。同时利用京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes,KEGG)通路数据库进行差异基因信号通路的富集。

1.4 蛋白质相互作用网络构建 利用STRING10(http://www.string-db.org)构建差异基因编码蛋白的相互作用网络,统计互作网络邻接节点数目,筛选出关键节点基因。通过MCODE插件(MCODE分数>2)对蛋白质相互作用网络进行关联度分析,获得蛋白质相互作用网络中关键蛋白质簇并在Cytoscape中进行可视化显示,进一步通过基因功能富集得到关键基因蛋白质簇功能注释。

2 结果

2.1 差异表达基因筛选 筛选GSE12452 中获得1 994个差异基因(964个上调,1 030个下调);GSE13597中获得518个差异基因(293个上调,225个下调);GSE64634共获得617个差异表达基因(227个上调,390个下调),各个芯片差异表达基因表达情况,见图1-3。取在≥3个数据集中有交集的差异表达基因116个,其中上调基因69个,下调基因47个,见图4。对其进行生物信息学分析,根据差异基因的平均log2FC值对基因进行排序,通过Rank分析得到40个明显差异基因,绘制差异基因log2FC热图,见图5。

图1 GSE12452芯片中鼻咽癌组织与正常鼻咽组织差异基因火山图

图2 GSE13597芯片中鼻咽癌组织与正常鼻咽组织差异基因火山图

图3 GSE64634芯片中鼻咽癌组织与正常鼻咽组织差异基因火山图

图4 3套基因芯片差异基因汇总及交集

图5 3套鼻咽癌基因芯片共同显著差异表达基因

2.2 差异表达基因功能富集及通路分析 对差异基因进行GO富集分析,这些基因富集(FDR较正后aP <0.05)在细胞分裂(cell division)、蛋白结合(protein binding)、纺锤体(spindle)、细胞外外泌体(extracellular exosome)上,见表2和图6。对差异基因进行KEGG通路分析,主要涉及6个通路(FDR较正后bP<0.05):细胞周期、DNA修复、小细胞肺癌、错配修复、人T细胞白血病病毒1感染、ECM-受体相互作用通路,见表3和图7。

2.3 蛋白质相互作用网络的构建和关键基因的筛选 用STRING10分析差异基因所对应的蛋白之间的相互作用网络,见图8;得到35个与≥29个蛋白有相互作用的蛋白,见图9。再进一步分析网络中的关键节点和基因簇,结果显示蛋白质相互作用网络中存在3个比较重要的基因簇。第1个基因簇关键节点为增殖性细胞核抗原(proliferating cell nuclear antigen,PCNA)和微小染色体维持蛋白2(minichromosome maintenance 2,MCM2),该基因簇生物功能主要富集于细胞核、细胞核质、有丝分裂细胞周期的G1/S转换、基因复制等通路;第2个基因簇关键节点为核分裂周期蛋白80(nuclear division cycle 80,NDC80)、细胞周期素B1(cyclin B1,CCNB1)、细胞周期分裂蛋白20(cell division cycle 20,CDC20),该基因簇功能主要有凝聚核染色体外动粒、浓缩核染色体动粒、有丝分裂主轴装配检查点、有丝分裂纺锤体装配;第3个基因簇包括复制因子复合体4(replication factor C subunit 4,RFC4)、复制因子复合体5(replication factor C subunit 5,RFC5)、氧化应激反应因子(Obg like ATPase 1,OLA1),该基因簇主要与腺嘌呤核苷三磷酸结合以及DNA复制相关,见图10和表4。

表2 鼻咽癌组织与正常鼻咽组织差异表达基因GO富集注释结果

图6 鼻咽癌组织与正常鼻咽组织差异表达基因GO富集

表3 鼻咽癌组织与正常鼻咽组织差异表达基因KEGG通路注释结果

图7 鼻咽癌组织与正常鼻咽组织差异表达基因KEGG通路富集结果

3 讨论

图8 鼻咽癌组织与正常鼻咽组织差异表达基因的蛋白质相互作用网络

图9 蛋白质相互作用网络邻接节点数目

图10 蛋白质相互作用网络关键基因簇分析

随着基因芯片的迅速发展,利用基因芯片筛选差异表达基因,并分析其功能是当前研究癌症发生发展分子机制的一种新的有效方法。本研究选取GEO中3个鼻咽癌基因表达的芯片数据,利用生物信息学进行鼻咽癌相关基因筛选,共筛选到116个差异表达基因进行生物学功能的进一步分析,而其中根据log2FC值排序得到最显著上调、下调的20个基因。其中乳铁蛋白(lactotransferrin,LTF)在鼻咽癌组织中显著下调,这与文献报道LTF在鼻咽癌组织中低表达一致[9],LTF可能通过抑制AKT信号通路[9]、MAPK信号通路[10]等抑制鼻咽癌细胞增殖分裂。而前列腺素-内过氧化物合酶2(prostaglandin-endoperoxide synthase 2,PTGS2),也称为环加氧酶,在鼻咽癌组织则显著上调,目前文献报道认为PTGS2作为一种潜在的癌基因,在鼻咽癌中表达上调,主要与在细胞有丝分裂发生过程中合成的前列腺素类物质有关,被认为主要负责炎症反应,而且PTGS2的抑制剂塞来昔布药物也被证明能减少鼻咽癌中血管的生成[11]。但是包括SCGB1A1(secretoglobin family 1A1)在内的其他差异基因在鼻咽癌组织中的作用及其作用机制还需要进一步实验探究。

通过GO富集、KEGG分析结果显示以上差异基因的功能主要富集在细胞分裂的信号通路,调节蛋白结合活性,定位富集在纺锤体以及细胞外外泌体等生物学过程中,主要参与细胞周期、DNA修复、小细胞肺癌、错配修复、人T细胞白血病病毒1感染、ECM-受体交互等信号通路。值得注意的是其中37个差异基因富集定位在细胞体外泌体上。外泌体是携带着如核酸、蛋白质、脂类和糖类等的生物活性分子,它广泛存在于体液中,被认为可以通过传递信息影响靶细胞的功能,激活细胞信号通路,可以在肿瘤的发生发展过程中发挥作用[11]。目前观点认为患者的血清、尿液、精液、唾液等均检测出外泌体,而这些外泌体来自癌细胞[12]。本次研究中通过GO富集分析发现37个基因与细胞外泌体相关,其中以CCAT6(CCT-alpha6)基因为例,在外泌体数据库(ExoCarta)[13]中分析,CCAT6编码形成的蛋白TCP 1复合物(CCT)广泛存在于人体尿液、血液中,可以作为肝癌、乳腺癌、卵巢癌、前列腺癌等的潜在生物标志物。但是本研究所选用的是基因芯片取材于鼻咽癌组织和正常鼻腔黏膜组织,因此需要进一步实验确定以上在细胞外外泌体富集的基因是否可以作为潜在基因,成为非侵入性生物标志物,用于鼻咽癌患者的早期检测。

表4 蛋白质相互作用网络关键基因簇功能注释

用STRING10对差异基因进行蛋白相互作用网络分析,位于中心节点的基因有包括RFC4、拓扑异构酶(DNA topoisomerase II alpha,TOP2A)、PCNA、CCNB1、有丝分裂阻滞缺陷2样蛋白1(mitotic arrest deficient 2 like 1,MAD2L1)、NDC80 等35个基因。进一步进行基因簇及关键网络节点挖掘显示,差异基因蛋白相互作用网络存在3个关键基因簇,主要和有丝分裂细胞周期、基因复制、有丝分裂、腺嘌呤核苷三磷酸结合等相关。其中第一关键基因簇中,网络关键节点基因PCNA编码的PCNA蛋白是一种DNA聚合酶δ的辅助蛋白,在G1中期、S期时高表达,而从G2/M期至G1期时开始下降,涉及DNA的复制和修复的过程[14]。莫浩亢等[15]则发现PCNA在鼻咽癌中高表达,且与鼻咽癌放疗敏感性有关,而MCM2作为MCMs家族的一员,是一种与DNA复制有密切关系且可作为增殖细胞的特殊标志物。多篇文献中发现MCM2在鼻咽癌中高表达,与鼻咽癌细胞增殖相关,常提示预后不良[16-17]。第二个基因簇中CCNB1则可以和CDC20复合形成成熟促进因子(maturation promoting factor,MPF),MPF对细胞能否能进入M期起决定性作用。而CCNB1还可以通过纺锤体微管的作用来促进细胞分裂,且已经作为抗肿瘤靶点在多种肿瘤中进行研究[18]。本研究还发现RFC4基因与邻近45个基因蛋白有连结,RFC4基因编码复制因子复合体(RFC)的第四大亚基,RFC主要参与促进PCNA与ATP的结合,同样参与DNA的修复[19]。研究发现RFC4在结直肠癌中、肝癌中高表达,且与不良预后有关[20-21],而ARAI等[21]发现下调RFC4的表达可以增强多柔比星和喜树碱在肝细胞癌中的细胞毒性作用。

综上所述,本研究采用生物信息学方法分析已有的鼻咽癌芯片数据,筛选出潜在的鼻咽癌中表达上调下调显著的基因,还通过建立蛋白质相互作用网络,分析得到关键基因簇和关键基因节点,包括基因PCNA、MCM2、CCNB1、RFC4。但因本研究仅涉及生物信息学分析,以上潜在功能基因与鼻咽癌的相关性及相关机制研究仍需在临床样本中进行验证。

猜你喜欢

基因簇基因芯片差异基因
miR-101基因簇与食管癌发病风险的病例对照研究
真菌沉默基因簇激活策略研究进展
出生时即可预判发育潜力 基因芯片精准筛选肉牛良种
四氢嘧啶基因簇在假单胞菌基因组中的分布研究
基因芯片技术在生物研究中的应用进展
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
基因芯片快速检验细菌的临床应用
LAMP联合基因芯片技术在肺炎衣原体检测中的应用
SSH技术在丝状真菌功能基因筛选中的应用