APP下载

基于miRNA-mRNA调控网络的鼻咽癌相关分子机制研究

2021-08-31郭伟茜郑先斌张洋洋陶振超

安徽医科大学学报 2021年8期

郭伟茜,高 劲,,花 蕾,郑先斌,张洋洋,孙 斌,陶振超

鼻咽癌(nasopharyngeal carcinoma, NPC)是一种常见的头颈部恶性肿瘤,起源于鼻咽黏膜,属于上皮恶性肿瘤,主要为鳞状细胞癌,我国南方地区高发。NPC是一种放射敏感性肿瘤,早期的NPC患者通过放射治疗可使5年生存率达90%以上,然而大部分患者在就诊时已是局部晚期阶段,极大地影响了患者治疗的疗效和预后,并且NPC发病的分子机制尚不明确,因此迫切需要从分子水平研究NPC的发病机制,寻找能早期诊断、治疗NPC的分子靶点。微小核糖核酸(microRNA, miRNA)是一类内源性非编码RNA,miRNA的表达失调与NPC的发生发展密切相关。生物信息学分析为研究肿瘤发病机制提供了线索,该研究通过生物信息学方法筛选出NPC中异常表达的miRNA与mRNA,并构建miRNA-mRNA调控网络,以寻找NPC潜在的分子靶标,为探索NPC发病机制提供新的思路。

1 材料与方法

1.1 芯片数据获取

从基因表达数据库(gene expression omnibus, GEO)中获取鼻咽癌miRNA芯片数据GSE70970和基因芯片数据GSE12452。GSE70970包括246例鼻咽癌组织和17例鼻咽正常组织,其芯片平台为GPL20699 nCounterHuman miRNA Assay (v1.0, Nanostring),GSE12452包括31例鼻咽癌组织和10例鼻咽正常组织,其芯片平台为GPL570 [HG-U133_Plus_2] Affymetrix Human Genome U133 Plus 2.0 Array。

1.2 数据处理

通过R软件3.6.1的limma程序包对原始芯片数据进行背景校正、标准化及差异表达分析,利用差异表达倍数(fold change, FC)来进行筛选。差异表达miRNA(differentially expressed miRNAs, DEMs)的筛选标准设置为|logFC|>2,矫正后

P

值<0.05。差异表达基因(differentially expressed genes, DEGs)的筛选标准设置为|logFC|>1,矫正后

P

值<0.05。利用R软件及其pheatmap程序包绘制火山图及热图。

1.3 功能富集分析

基因本体论(gene ontology, GO)从3个方面对基因的功能进行注释,包括生物学过程(biological process, BP)、细胞组分(cellular component, CC)、分子功能(molecular function, MF)。京都基因与基因组百科全书(kyoto encyclopedia of genes and genomes, KEGG)对基因可能参与的信号通路进行富集分析。利用FunRich 3.1.3软件对DEMs进行GO功能注释,通过R软件的clusterProfiler程序包对DEGs进行GO和KEGG富集分析。

P

<0.05为差异有统计学意义,将富集程度显著的前10个条目进行可视化。

1.4 DEMs转录因子及靶基因预测

通过FunRich软件对DEMs的转录因子及其靶基因进行预测。

P

<0.05为差异有统计学意义,并对前10个富集显著的转录因子进行可视化。

1.5 miRNA-mRNA调控网络构建

考虑到miRNA与靶基因之间的负向调控关系,通过在线工具(https://bioinfogp.cnb.csic.es/tools/venny/)将上调miRNA的靶基因与下调DEGs取交集,同时将下调miRNA的靶基因与上调DEGs取交集,将交集基因定义为核心基因,并且绘制韦恩图。把结果导入Cytoscape 3.6.1软件将网络图可视化。

1.6 生存分析

Kaplan-Meier plotter数据库(http://kmplot.com/analysis/)包含了多种肿瘤的芯片数据及高通量测序数据,该数据库通过在线生存分析为探索肿瘤的分子靶标提供了依据。利用Kaplan-Meier plotter数据库中的头颈部鳞状细胞癌数据对调控网络中的核心基因进行生存分析,进一步筛选可能影响鼻咽癌患者预后的核心基因。数据库采用log-rank检验,并且计算风险比(hazard ratio, HR),

P

<0.05为差异有统计学意义。本研究的基本工作流程见图1。

2 结果

2.1 差异表达miRNA和差异表达基因的筛选

从miRNA芯片数据GSE70970中一共筛选出47个DEMs,其中上调的miRNA有31个,下调的miRNA有16个。从基因芯片数据GSE12452中一共筛选出797个DEGs,其中上调基因有291个,下调基因有506个。利用R软件绘制热图及火山图,见图2、图3。

图1 基本工作流程

2.2 功能富集分析

通过FunRich软件对DEMs进行GO富集分析显示,DEMs主要参与信号转导、细胞通讯、核苷酸代谢调节等生物学过程,富集在细胞核、细胞质、溶酶体等细胞组分中,影响转录因子活性、转录调节活性、RNA结合等分子功能,见图4。通过R软件的clusterProfiler包对DEGs进行GO及KEGG富集分析表明,DEGs主要参与纤毛组装、微管运动、有丝分裂等生物学过程,富集在微管、纤毛、纺锤体等细胞组分中,影响酶抑制剂活性、微管蛋白结合、肽酶调节活性等分子功能,DEGs主要富集在细胞因子受体相互作用、阿米巴病、细胞周期、IL-17信号通路、小细胞肺癌等信号通路中。GO富集气泡图见图5A,点颜色越红代表富集越显著,点越大代表富集基因的数目越多,KEGG富集圈图见图5B。

图2 GSE70970数据的差异miRNA表达分析

2.3 DEMs转录因子预测

利用FunRich软件预测DEMs的转录因子,富集显著的前10个转录因子分别为EGR1、POU2F1、SP1、SP4、TCF3、E2F1、FOXA1、NKX2-1、RREB1、NKX6-1。见图6。

图3 GSE12452数据的差异基因表达分析

图4 DEMs的GO富集分析 A:生物学过程;B:细胞组分;C:分子功能

图5 DEGs的GO及KEGG富集分析A: GO富集气泡图;B: KEGG富集圈图;红色:上调基因;蓝色:下调基因

图6 DEMs转录因子预测蓝色:DEMs百分比;红色:P值

2.4 DEMs靶基因预测

利用FunRich软件对DEMs的靶基因进行预测,47个DEMs中有12个miRNA能预测出靶基因,预测出的靶基因数目为1 606个。

2.5 miRNA-mRNA调控网络构建

由于miRNA与靶基因之间是负向调控的关系,将上调miRNA靶基因与下调DEGs取交集得到9个下调核心基因,下调miRNA靶基因与上调DEGs取交集得到14个上调核心基因,韦恩图见图7。将结果导入Cytoscape软件构建miRNA-mRNA调控网络,网络中miRNA有6个。网络图见图8,相应的miRNA及核心基因在鼻咽癌中的表达情况见表1。

图7 靶基因与DEGs的韦恩图

表1 网络图中miRNA与核心基因在鼻咽癌中的表达情况

2.6 生存分析

利用Kaplan-Meier plotter数据库对23个核心基因进行生存分析发现4个基因对鼻咽癌患者的预后有影响(

P

<0.05),其中有2个上调基因,包括多聚磷酸肌醇磷酸酶1(multiple inositol-polyphosphate phosphatase 1, MINPP1)、锌指环指蛋白3(zinc and ring finger 3, ZNRF3),MINPP1和ZNRF3高表达时患者的总体生存率降低,HR均为1.44。有2个下调基因,包括纤毛顶结构蛋白(sentan,SNTN)、β微管蛋白2A(tubulin beta 2A, TUBB2A),SNTN和TUBB2A低表达时患者总体生存率降低,HR分别为0.74、0.65。生存曲线见图9。4个基因相对应的miRNA分别为hsa-miR-199b-5p、hsa-miR-520e、hsa-miR-107、has-miR-421。

3 讨论

NPC的预后与肿瘤分期密切相关,有研究发现早期NPC患者的5年生存率可达80%左右,但随着肿瘤分期的进展,NPC患者的5年生存率逐渐降低,然而由于NPC早期症状不明显导致患者就诊时的分期晚,再加上易发生转移等因素均显著影响了患者的预后,因此从分子水平探索NPC的发病机制,寻找能早期诊断、治疗及预测预后的分子靶点至关重要。

miRNA作为一种内源性非编码RNA,其通过构建沉默复合体靶向下游基因,从而阻断该基因的表达,因此miRNA与mRNA具有负向调控关系。本研究利用生物信息学方法对NPC的miRNA芯片数据和基因芯片数据进行综合分析,根据负向调控规律,将上调miRNA预测的靶基因与下调基因取交集,下调miRNA预测的靶基因与上调基因取交集,构建miRNA-mRNA调控网络,从而获得23个核心基因,结合生存分析显示其中4个核心基因对NPC患者预后有影响(

P

<0.05),包括2个上调基因MINPP1、ZNRF3,2个下调基因SNTN、TUBB2A。4个基因相对应的miRNA分别为在鼻咽癌组织中下调表达的hsa-miR-199b-5p、hsa-miR-520e,以及在鼻咽癌组织中上调表达的hsa-miR-107、hsa-miR-421。这4对miRNA与mRNA之间的调控关系虽然尚未被研究报道过,但本研究通过TargetScan、miRDB、miRTarBase数据库进行验证,显示仅has-miR-107与SNTN之间的关系未得到验证,而其他3对在不同数据库中分别预测到了具有相互作用的可能性,为下一步实验验证这些miRNA与mRNA的相互结合进一步提供了理论依据。

hsa-miR-199b-5p参与了多种肿瘤的调控过程,比如在乳腺癌中作为一种抑癌因子,通过抗血管生成作用成为一种潜在的治疗靶点,而hsa-miR-199b-5p在宫颈癌组织中表达上调,具有促进肿瘤生长、转移的作用,与宫颈癌的不良预后相关。在NPC中,有研究通过miRNA芯片技术检测不同阶段鼻咽癌miRNA的表达,显示hsa-miR-199b-5p在Ⅰ期NPC组织中的表达下调,但对其中具体的调控机制没有进一步的研究。hsa-miR-520e也是一种癌症相关的miRNA,其在结直肠癌中通过调控靶基因星形细胞上调基因-1(astrocyte elevated gene-1, AEG-1)影响Wnt信号通路进而抑制结直肠癌细胞的增殖和侵袭。hsa-miR-107抑制多种肿瘤的发生发展,在口腔鳞状细胞癌中hsa-miR-107通过靶向凋亡抑制因子减弱了肿瘤细胞的增殖及迁移能力。hsa-miR-107不仅仅作为一种抑癌因子,其在胃癌中通过活化PI3K-AKT信号通路促进了胃癌的发生。多个研究表明hsa-miR-421促进多种肿瘤进程,在NPC中也发挥着促癌作用,有研究显示hsa-miR-421可以促进NPC细胞增殖,抑制细胞凋亡,hsa-miR-421可能通过靶向调节相关转录因子促进NPC的发生发展。4种miRNA中仅hsa-miR-421有研究报道在NPC中发挥促癌作用,而hsa-miR-199b-5p、hsa-miR-520e、hsa-miR-107与NPC的关系尚未被研究过,需要进一步探索。

图8 miRNA-mRNA调控网络红色:高表达;黄色:低表达

图9 部分基因的生存分析

MINPP1即多聚磷酸肌醇磷酸酶1是一种组氨酸磷酸酶,可在体内外水解多种多聚磷酸肌醇,在细胞应激时MINPP1的表达增加,该基因可能参与了肿瘤细胞模仿人类成熟红细胞的葡萄糖代谢过程,与肿瘤细胞的无限增殖能力相关。ZNRF3是一种跨膜E3泛素连接酶,其通过抑制Wnt信号通路在多种肿瘤中发挥着抑癌作用,其中也包括NPC。ZNRF3的过表达阻碍了NPC的上皮-间质转化过程,抑制NPC细胞的生长、转移,但是本研究表明ZNRF3在NPC组织中表达上调且与患者的不良预后相关,与报道内容不一致,可能有更深的机制影响了ZNRF3对NPC的调控作用,需要进一步的研究。SNTN编码纤毛顶结构蛋白,该蛋白有助于远端纤毛清理呼吸道异物,有研究通过对卵巢癌芯片数据进行分析发现SNTN在卵巢癌组织中表达上调,可能参与了卵巢癌的发生发展。TUBB2A即β微管蛋白2A,在神经元中高度表达,该基因发生突变可导致复杂性皮质发育不良。TUBB2A在结直肠癌组织中过度表达且与患者的不良预后相关。基因MINPP1、SNTN、TUBB2A在NPC中的作用未被报道过,为进一步研究提供了新方向。