APP下载

基于生物信息学对头颈鳞癌的关键基因进行分析

2020-10-24冯浩然粟小平穆婷王爽黄旋平李翠萍何雨亮

右江民族医学院学报 2020年5期
关键词:胞外基质关键通路

冯浩然,粟小平,穆婷,王爽,黄旋平,李翠萍,何雨亮

[广西医科大学附属口腔医院,广西口腔颌面修复与重建研究自治区级重点实验室,广西颅颌面畸形临床医学研究中心,颌面外科疾病诊治研究重点实验室(广西高校重点实验室),广西 南宁 530021]

头颈部鳞状细胞癌(head and neck squamous cell carcinoma,HNSCC)是世界第六大常见癌症[1]。其特点是死亡率高,复发率高,异质性高,5年生存率低及预后较差[2-4]。近些年来,虽然在HNSCC相关手术和化疗等方面有一定研究进展,但目前尚无有效的诊断和治疗方法及特效药物[5]。因此探究HNSCC发病相关的关键基因对于发现更有效的诊断和治疗方法具有重要意义。

近年来,生物信息学分析被广泛应用于各种癌症诊断和治疗的生物标志物预测中。在前列腺癌中,通过对GEO数据库的分析,发现HSPA8、PPP2R1A、CTNNB1、ADCY5、ANXA1、COL9A2为关键基因[6]。通过分析GEO及TCGA数据库,发现CASR、CXCL12、SST为与胃癌相关的关键基因[7]。许多与上述类似的研究也可见于多种与肿瘤发生相关的关键基因筛选中[8-11],生物信息学分析已成为寻找肿瘤潜在诊断和治疗靶点的有效手段。本研究通过对GEO及TCGA数据库的挖掘,筛选出与HNSCC相关的差异表达关键基因,这将有助于对进一步了解HNSCC的发生发展过程,并为探索其诊断与治疗靶点提供依据。

1 材料与方法

1.1 数据下载 从GEO数据库下载基因芯片数据GSE6631和GSE13398,其中GSE6631包括22例HNSCC肿瘤组织和22例正常组织,GSE13398包括8例HNSCC肿瘤组织和8例正常组织。RNA-seq数据从TCGA数据库下载,其中包括502例HNSCC肿瘤组织和44例正常组织。

1.2 差异表达基因(differentially expressed genes,DEGs)的筛选 利用在线工具GEO2R对GSE6631和GSE13398的DEGs进行分析,用R包edgR提取TCGA数据库的DEGs(以P<0.05,|log2FC|≥1作为截止标准)。利用在线工具Draw Venn diagram (http://bioinformatics.psb.ugent.be/webtools/Venn/)绘制韦恩图,对GSE6631、GSE13398和TCGA在HNSCC中的DEGs取交集。

1.3 功能富集分析 使用在线软件DAVID(S6.8版本,http://david.abcc.ncifcrf.gov/)和KOBAS(3.0版本,http://kobas.cbi.pku.edu.cn/)对重叠的DEGs分别进行GO功能注释分析(P<0.05设为阈值)和KEGG 通路富集分析(P<0.05设为阈值)[12-13]。使用R包ggplot2绘制柱状图。

1.4 PPI网络构建与分析 首先将重叠DEGs导入STRING在线数据库(http://string-db.org)进行分析。之后使用Cytoscape软件构建PPI网络并分析DEGs相互作用关系。最后利用Cytohubba 插件MCC算法构建模块,筛选出候选关键基因,最后对其进行功能富集分析。

1.5 总体生存分析 使用GEPIA(http://gepia.pku.cn/index.html)对筛选出的候选关键基因进行总体生存分析[14],截止标准设为P<0.05。

2 结果

2.1 差异表达基因 在芯片数据集GSE6631筛选出187个DEGs,在芯片数据集GSE13398筛选出4259个DEGs。从TCGA 数据库中筛选出19844个DEGs。在两个基因芯片数据集和TCGA数据中共发现70个DEGs存在重叠(见图1、表1)。

表1 重叠DEGs的上调和下调

2.2 DEGs的GO功能注释分析 对HNSCC中70个重叠DEGs进行GO分析。结果显示,DEGs主要富集于细胞外基质分解、细胞黏附和胶原分解代谢等生物学过程。细胞组成分析表明,DEGs在细胞外基质、细胞外外泌体中富集。分子功能分析表明,DEGs主要富集于细胞外基质结构成分,血小板来源的生长因子结合等(见图2A)。

2.3 DEGs的KEGG通路富集分析 KEGG信号通路富集分析结果显示,大多数DEGs富集于细胞外基质受体相互作用、黏着斑和PI3K-Akt信号通路(见图2B)。

图2 DEGs的GO功能注释和KEGG通路富集分析

2.4 DEGs的PPI网络分析 通过STRING数据库对DEGs进行分析,共筛选出互作评分>0.4的56个DEGs (33个上调,23个下调)进入PPI网络,该网络包括56个节点及265条边。利用Cytoscape软件构建可视化PPI网络(见图3A)。利用插件CytoHubba的MCC算法进一步分析PPI网络,筛选出前30个候选关键基因(见图3B)。对30个候选关键基因进行功能富集分析,结果显示候选关键基因主要与细胞外基质组织、胶原分解代谢过程、细胞外基质受体相互作用、黏着斑、PI3K-Akt信号通路等相关(见图4A、图4B)。

2.5 候选关键基因的生存分析 使用基于TCGA数据库的在线工具GEPIA对候选关键基因进行生存分析。分析结果表明,以下7个基因:PLAU (P=0.00049)、FAP (P= 0.0027)、LAMC2 (P=0.013)、SERPINH1 (HSP47) (P=0.022)、ITGA6(P=0.035)、SPP1 (P=0.045)和MMP1 (P=0.046)与HNSCC患者的总体生存期显著相关(见图5),这些基因的高表达与较差的总体生存期有关。

2.6 临床标本中关键基因的mRNA表达 应用QRT-PCR检测10对HNSCC组织及正常组织的关键基因mRNA表达水平。结果显示,肿瘤组织中以下7个基因PLAU (P=0.017)、FAP (P=0.025)、LAMC2 (P=0.019)、SERPINH1(HSP47) (P=0.041)、ITGA6 (P=0.011)、SPP1 (P=0.011)、MMP1 (P=0.044)的mRNA水平均明显高于正常组织(见图6)。

3 讨论

HNSCC是第六大常见肿瘤,目前尚无有效的诊断和治疗方法来改善其预后。因此了解与HNSCC发生发展相关的分子机制是必要的。在过去的几十年里,大多数研究都集中在与HNSCC相关的单个基因上。本研究综合分析了与HNSCC相关的两个GEO数据集和TCGA测序数据。利用R包edgeR,GEO2R及Draw Venn Diagram在线工具,共筛选出70个重叠DEGs,其中34个基因表达上调,36个基因表达下调。将DEGs导入STRING 数据库获取PPI网络数据,利用Cytoscape软件进行可视化,使用插件CytoHubba筛选出前30个候选关键基因。对候选关键基因KEGG通路富集分析结果显示,DEGs在细胞外基质受体相互作用、黏着斑、PI3K-Akt信号通路等方面显著富集。细胞外基质是由结构和功能大分子组成的复杂混合物,在组织和器官的形态形成以及细胞和组织结构功能的维持中起着重要的作用。同时细胞外基质也在各种肿瘤的发生发展中起着重要的作用。与胶原蛋白、层粘连蛋白和纤连蛋白相关的基因参与了细胞外基质受体的相互作用。许多研究表明,胶原蛋白家族在HNSCC中起重要作用。COLVI被认为是一种潜在的诊断和治疗HNSCC的生物标志物。COL1A1基因的下调抑制了OSCC细胞的增殖、侵袭和有丝分裂[15]。黏着斑是通过整合素将细胞骨架与细胞外基质连接起来的大型蛋白复合物。整合素是由α和β跨膜形成的异质二聚体,在细胞膜信号向细胞内部汇聚的过程中起主要作用。PI3K-Akt信号通路影响多个靶蛋白的翻译和转录,这些靶蛋白涉及多种细胞特性,如增殖、转移等。

使用GEPIA进行生存分析,我们最终确定了7个关键基因PLAU、FAP、LAMC2、SERPINH1、ITGA6、SPP1和MMP1作为HNSCC的诊断及治疗潜在靶点和生物标志物。Teichgräber V等[16]的研究结果表明,FAP在上皮性肿瘤中过表达并促进肿瘤生长,而FAP的特异性抑制可在体外阻止肿瘤的进展。研究表明,FAP可作为HNSCC潜在的CAR-T靶标[17]。LAMC2在口腔鳞状细胞癌(OSCC)组织中显著上调,且在黏膜白斑中LAMC2阳性比LAMC2阴性的恶变风险增加了约11倍[15]。MMP1在HNSCC组织中过表达,抑制MMP1可降低HNSCC的侵袭能力[18]。OSCC中SPP1的表达明显高于正常口腔黏膜,且SPP1可调节OSCC的增殖、迁移和侵袭[19]。PLAU基因编码尿激酶纤溶酶原激活物(uPA),其过表达增强HNSCC的增殖,迁移和侵袭能力[20]。ITGA6是整合素家族的一员,已知它能介导与细胞外基质的相互作用,并增强多种细胞运动和信号输出能力。研究表明,ITGA6的表达值与HNSCC患者的整体生存有关[21]。SERPINH1属于丝氨酸蛋白酶抑制剂超家族,其在多种癌症中高度表达,并可驱动癌细胞的恶性行为。研究表明SERPINH1的上调与HNSCC患者较差的总体生存率有关[22]。

综上所述,本研究通过对多个数据集进行综合生物信息学分析,最后筛选出与HNSCC发生发展相关的关键基因。这将有助于提高我们对HNSCC病因及潜在分子机制的认识。为研发肿瘤靶向药物,开展个体化治疗提供依据。

猜你喜欢

胞外基质关键通路
硝酸甘油,用对是关键
新形势下深化改革开放的关键一招
高考考好是关键
脱细胞外基质制备与应用的研究现状
关于经络是一种细胞外基质通道的假说
Kisspeptin/GPR54信号通路促使性早熟形成的作用观察
proBDNF-p75NTR通路抑制C6细胞增殖
HGF/c—Met信号转导通路在结直肠癌肝转移中的作用
通路快建林翰:对重模式应有再认识
水螅细胞外基质及其在发生和再生中的作用