APP下载

基于生物信息学方法筛选肝细胞癌核心生物标志物及预后关联性分析*

2022-02-19刘娇阳邓成敏李永文吴凯峰

国际检验医学杂志 2022年3期
关键词:肝癌通路数据库

刘娇阳,邓成敏,刘 铁,李永文,罗 娟,吴凯峰,△

遵义医科大学第三附属医院/贵州省遵义市第一人民医院:1.检验科;2.中心实验室,贵州遵义 563000

肝细胞癌(HCC)是常见的恶性肿瘤,由于其疾病进展快,恶性程度高,预后差,一直受到人们的广泛关注。据报道,全球每年有超过84万的肝癌确诊病例,主要发生在东亚和非洲部分地区[1-2]。事实上,肿瘤的发生发展和异常的基因表达密切相关。因此,近年来从分子层面研究肿瘤的发生发展是当前的热点。利用数据库中的大量数据分析基因表达与肿瘤的关系,对推进肿瘤的诊疗和揭示发病机制有着重要的意义,能极大地促进肿瘤相关研究的进展。

本研究拟从GEO数据库中筛选出基因数据集,从而获得差异表达基因(DEGs),并对这些DEGs进行功能注释和通路富集分析。通过蛋白质互作网络(PPI)的可视化,构建出关键模块,得到核心基因,并对核心基因进行生存分析,探索其与HCC分级、卫星病灶和血管浸润的相关性,旨在为其影响肝癌的发生和预后提供理论依据。

1 资料与方法

1.1一般资料 从NCBI中的GEO数据库中筛选到3个基因表达芯片集GSE101685、GSE84402和GSE46408,共包含44个肝癌组织和28个癌旁组织标本。

1.2DEGs的筛选 本研究利用GEO数据库中自带的数据分析插件GEO2R筛选HCC组织和癌旁组织的DEGs。对初步得到的DEGs进行筛选获得候选差异基因,条件为表达差异倍数值的绝对值|log Fc(fold change)|≥1.5且校正P值<0.05。利用在线分析工具Venny(https://bioinfogp.cnb.csic.es/tools/venny/)制作Venn图,获得3个基因数据集共有的DEGs。

1.3功能富集分析 利用在线数据库DAVID(https://david.ncifcrf.gov/)对筛选到的DEGs进行功能富集分析,包括GO注释和KEGG通路分析。筛选条件为错误发现率(FDR)<0.05。

1.4PPI分析 首先,利用STRING在线数据库(https://string-db.org/)构建DEGs的PPI网络,结合分数>0.4的交互作用可纳入本分析。然后用Cytoscape软件对PPI网络进行可视化,MCODE工具用于构建PPI中的关键模块,构建参数为degree cut-off=2,node score cut-off=0.2,k-core=2。利用Cytoscape的BiNgo插件对关键模块中DEGs的生物学过程进行了分析。

1.5关键基因的分析 根据各关键模块之间的差异程度,利用MCODE工具在众多DEGs中筛选中hub基因,即核心基因。用TCGA的cBioPortal数据库(http://www.cbioportal.org)分析核心基因与HCC患者生存的关系。利用ONCOMINE数据库(https://www.oncomine.org/resource/login.html)分析核心基因表达与HCC发展的相关性。

2 结 果

2.1DEGs的鉴定 3个数据集共包含2 850个基因(GSE101685基因830个,GSE84402基因857个,GSE46408基因1 163个)。取其交集后,有261个共有DEGs,其中包括124个上调基因和137个下调基因。见图1。

图1 3个基因数据集的Venn图

2.2GO富集分析和KEGG通路分析 利用DAVID对DEGs进行了生物过程、细胞成分和分子功能的基因功能注释。将这些结果按照FDR值<0.05进行了筛选,并显示了每组的3个主要过程。对于细胞成分,GO富集分析显示上调基因富集于细胞中间体、核质和细胞质,下调基因富集于胞外区域、细胞外泌体和细胞外间隙;生物过程分析显示上调DEGs主要参与DNA复制起始、微管运动和染色体分离,下调的DEGs参与氧化还原过程、细胞色素氧化酶P450代谢和外源物质的代谢过程;分子功能分析显示上调的DEGs主要能与ATP结合,下调的DEGs具有氧化还原酶活性,与血红素和铁离子结合等功能。KEGG分析表明,DEGs主要富集在细胞周期、DNA复制、视黄醇代谢、p53信号通路和细胞色素P450代谢等通路中。见表1。

表1 DEGs的GO富集和KEGG通路分析

2.3PPI网络分析 261个DEGs的PPI网络由221个节点(基因)和3 616条边(相互作用)组成。采用MCODE工具确定了互作网络中关键模块,并选取互作最复杂的模块进行生物过程分析。该模块中DEGs的生物学过程由BiNgo完成,主要富集于生物调控、细胞过程、细胞成分组织、代谢过程和信号调控等生物学过程。见图2。

注:A为261个DEGs的PPI网络互作图;B为MCODE工具构建的关键模块;C为BiNgo分析关键模块中DEGs的生物学过程。

2.4核心基因的分析 通过MCODE工具得到10个核心基因,分别是OIP5、HGFAC、CYP2C8、MT1M、GLS2、FCN3、APOF、ADH1C、FLVCR1和SLC27A。其中,OIP5和FLVCR1为上调基因,HGFAC、CYP2C8、MT1M、GLS2、FCN3、APOF、ADH1C和SLC27A为下调基因。另外,生存分析结果表明,FLVCR1的表达与肝癌患者的总体生存率和无病生存率有关,差异有统计学意义(P<0.05)。此外,10个核心基因中,OIP5和HGFAC在PPI网络中节点度较高,对其进一步的研究结果表明,OIP5和FLVCR1的上调表达及HGFAC的下调表达与HCC分级、有无卫星病灶、血管浸润程度有关系。见图3、4。

注:A为总体生存率;B为无病生存率。

注:A为OIP5的表达与肝癌分级的关系;B为OIP5的表达与卫星病灶的关系;C为OIP5的表达与血管浸润的关系;D为HGFAC的表达与肝癌分级的关系;E为HGFAC的表达与卫星病灶的关系;F为HGFAC的表达与血管浸润的关系;G为FLVCR1的表达与肝癌分级的关系;H为FLVCR1的表达与卫星病灶的关系;I为FLVCR1的表达与血管浸润的关系。

3 讨 论

本研究从GEO数据库获得了3个基因数据集(GSE101685、GSE84402、GSE46408)。共鉴定出261个基因,其中上调基因124个,下调基因137个。为了探究这些DEGs之间的相互作用,进行了GO富集和KEGG通路分析。结果表明,这些上调的基因主要富集于细胞周期、DNA复制、p53信号通路和卵母细胞减数分裂通路等。说明上调基因可能是通过影响细胞遗传物质的复制和调控细胞生长周期等过程,从而参与到HCC的发生发展过程。而下调基因主要富集于视黄醇代谢过程中。结合已有研究表明,肝癌患者的血清视黄醇水平与体检者相比明显下降[3],证实了本研究发现的下调的DEGs可能参与到HCC患者的视黄醇代谢过程。

另外,本研究共鉴定出了10个核心基因,上调基因有OIP5和FLVCR1,下调基因有HGFAC、CYP2C8、MT1M、GLS2、FCN3、APOF、ADH1C、SLC27A5,这些基因有望成为HCC诊断或预后的生物标志物。本研究通过生物信息学的方式证实了CYP2C8在HCC组织中的低表达,与先前的研究结果一致[4-5],表明CYP2C8在成为肝癌相关标志物的潜在价值,但其在肝癌发生发展中的作用机制尚不清楚。同样,MT1M在肝癌组织中低表达,其低表达可能与启动子的甲基化和与miR-545-3p相互作用有关[6]。据研究表明,GLS2和其他标志物组合可用于评估肝癌患者的预后情况[7],与肿瘤分期、血管浸润和肿瘤大小等有关,其作用机制可能是通过与Dicer蛋白相互作用,抑制Snail表达从而抑制癌细胞的迁移和侵袭有关[8]。FCN3和APOF在肝癌组织中表达均下调,推测其可能作为肿瘤抑制剂影响肝癌的发生发展[9-10]。另外,在多个数据库中肝癌患者的ADH1C上调往往意味着预后较好,但其具体的作用机制还不清楚[11-13]。SLC27A5通常参与到脂肪酸转运和胆汁酸代谢过程。最新研究表明,SLC27A5通过DNA甲基化使其在肝癌患者中表达下调,参与到KEAP1/NRF2代谢通路从而影响肝癌患者的进展和预后[14]。

本研究中,OIP5和HGFAC在PPI网络分析中具有较高的节点数,说明这2个基因在所有差异基因相互作用过程中可能起着核心的作用。OIP5是一种肿瘤启动基因,在多种癌症的发展过程中均有报道。本研究中OIP5在肝癌组织中是上调的,对其进一步分析表明,OIP5的表达与肝癌分级,卫星病灶和血管浸润有关(P<0.05),说明OIP5影响HCC的发生发展。通过动物模型将裸鼠体内OIP5敲低后发现,细胞增殖和集落形成能力受到抑制,并促进了细胞的凋亡[15]。因此推测OIP5可能通过调节细胞生长周期和增殖能力等过程促进HCC的进展。HGFAC作为肝细胞生长因子激活剂,能参与肝脏和胃的再生,抵抗多种类型的癌症。本研究中HGFAC在肝癌组织中的下调表达,与肝癌分级、卫星病灶和血管浸润有关。HGFAC表达下降可能受DNA甲基化的调控,并且HGFAC下调与肝癌患者不良的生存结果相关,因此HGFAC可作为肝癌患者预后的生物标志物,与本研究观点相一致[16]。FLVCR1作为铁代谢相关基因,其编码蛋白是一种血红素转运蛋白,在铁代谢过程中起着重要作用,能防止由过量铁引起的氧化损伤[17]。本研究FLVCR1是对10个核心基因进行生存分析后,唯一有统计学意义的差异基因,其表达水平升高预示着肝癌患者不良的预后。另外,在其他数据库中也证实了FLVCR1在肝癌组织中表达上调,并且其表达的变化与预后情况相关,但其影响肝癌预后的作用机制还有待进一步研究[18-19]。

综上所述,本研究通过生物信息学的方法筛选了肝癌相关的核心基因。其中,OIP5、HGFAC和FLVCR1与肝癌进展有关系,可能成为肝癌诊疗和预后的生物标志物。但其如何影响肝癌的进展和预后尚需进一步研究。

猜你喜欢

肝癌通路数据库
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
XB130在肝癌组织中的表达及其对细胞侵袭、迁移的影响
Wnt/β-catenin信号转导通路在瘢痕疙瘩形成中的作用机制研究
隐源性肝癌与病毒性肝癌临床特征比较
数据库
数据库
数据库
数据库
SphK/S1P信号通路与肾脏炎症研究进展
通路快建林翰:对重模式应有再认识