APP下载

基于多种数据库分析E2F3 基因在黑色素瘤中的变异、表达及临床意义

2023-11-14韩利民赵海龙

海南医学院学报 2023年20期
关键词:趋化因子黑色素瘤负相关

韩利民,叶 钢,邓 川,代 姣,赵海龙

(1.重庆市长寿区人民医院内分泌内科,重庆 401220;2.重庆市长寿区人民医院肝胆外科,重庆 401220;3.重庆市长寿区人民医院神经内科,重庆 401220;4.重庆市长寿区人民医院药学部,重庆 401220;5.遵义医科大学基础医学院病理生理学教研室,贵州 遵义 563000)

黑色素瘤是一种死亡率较高的恶性肿瘤,主要由皮肤或其他器官的黑色素细胞产生。据统计,2020 年全球新发黑色素瘤的人数为324 635 例,因黑色素瘤死亡的人数达57 043[1]。目前黑色素瘤的治疗主要包括以下4 种:传统手术切除、放射治疗、化学治疗及靶向治疗等。越来越多的证据表明,靶向药物或免疫药物的辅助治疗显著改善了黑色素瘤患者的总体生存率,是治疗黑色素瘤的新途径[2,3]。然而,多项临床试验的结果表明,部分黑色素瘤患者,甚至一些基因突变负荷较高或PD-1/PD-L1 表达较高的人群对以上药物并没有有效的反应[4]。研究显示,处于早期阶段的黑色素瘤患者5年生存率高达95%,但晚期转移性黑色素瘤患者5年生存率仅为5%~10%[5,6]。因此,探索更多有助于黑色素瘤诊断和治疗的潜在标志物和靶点具有十分重要意义。

E2F3 是E2F 家族中的转录因子之一,主要参与细胞周期调控。近年来,多项证据表明,E2F3 在肺癌、胃癌、乳腺癌、肝癌等多种肿瘤中的表达均明显升高,并能促进肿瘤的发生和发展[7-10]。然而,E2F3 在黑色素瘤中的变异、表达及临床意义目前并不完全清楚,因此,本文旨在通过多种数据库广泛分析E2F3 在黑色素瘤中的诊断价值及临床意义。

1 材料与方法

1.1 cBioportal 数据库

cBioportal 数据库是分析癌症基因组学及其可视化的常用数据库,可以分析单基因或多基因在不同肿瘤中的变异情况。选择7 项非转移性黑色素瘤的临床测序数据(总共1 905 样本),在Enter Genes栏中输入E2F3 后进行分析。通过Oncoprint、Cancer Types Summary、Mutations 菜单获得E2F3基因在黑色素瘤中的总变异率和变异亚型,通过Comparison/Survive 菜单获得E2F3 变异组和非变异组的总生存时间曲线图。

1.2 Oncomine 数据库

Oncomine 数据库可挖掘靶基因在不同肿瘤类型及其相应正常组织的表达差异分析数据。Cancer type 设定为malenoma,Gene 设定为E2F3,Analysis Type 设定为Cancer VS Normal Analysis,Data Type 设定为mRNA,设定Pvalue<0.05,Fold Change>2,Gene Rank=Top 10%,最后点击submit 获得E2F3基因在黑色素瘤和正常皮肤组织中的表达差异。

1.3 GEO 数据库

选取GSE3189、GSE114445、GSE100050 和GSE46517 4 个黑色素瘤相关数据集。分别通过在线GEO2R 分析工具(P<0.05, Log |FC|≥1)获得所有差异表达基因,并进一步比较E2F3基因在黑色素瘤和正常皮肤中的表达水平。

1.4 OSskcm 数据库

OSskcm 数据库是由中国学者开发专用于黑色素瘤的生存分析数据库,其数据包括TCGA 和部分GEO 数据集。Gene symbol 输入E2F3,Data Source选择TCGA,Split patients by 选择Upper 50%,Survival 分别选择OS 和 PFI,最后点击Kaplan-Meier获得KM 生存曲线图,比较E2F3高表达组和低表达组的总生存时间和无进展间隔期时间。

1.5 TISIDB 数据库

TISIDB 数据库是基于TCGA 数据分析肿瘤与免疫系统相互作用的综合数据库,可分析不同肿瘤中目的基因与免疫治疗、淋巴细胞、免疫调节剂、趋化因子、免疫细胞亚型等之间的关系。在Gene Symbol 中输入E2F3 进行,通过Lymphocyte、Chemokines 和Subtype 菜单获取黑色素瘤中E2F3基因的表达、甲基化和CNA 水平与各种肿瘤浸润性淋巴细胞和趋化因子的相关性,以及E2F3表达水平与黑色素瘤不同免疫亚型的相关性。

1.6 LinkedOmics 数据库

LinkedOmics 数据库是一个包含32 种癌症类型的多组学在线分析数据库,可进行单基因关联分析和功能富集分析。选择TCGA_SKCM 数据集中RNAseq 为数据,以E2F3为目的基因,采用Spearman 法进行分析,最后获得黑色素瘤中与E2F3基因共表达的相关差异基因及其富集的生物学功能。

1.7 CMap 数据库

CMap 数据库是一个筛选小分子化合物的化学基因组学数据库。点击Query 工具,Query parameters 选择Gene expression (L1000),以P<0.05,|cor|≥0.5 为切点,将与E2F3表达水平呈正相关基因(61 个)和负相关的基因(35 个)分别输入“UP-regulated genes”和“DOWN-regulated genes”框后进行分析,最终得出潜在的前五位小分子化合物。

2 结果

2.1 E2F3 基因在黑色素瘤中的变异分析

cBioportal 数据库分析结果显示E2F3基因在黑色素瘤中仍存在低度变异。在1 905 例黑色素瘤人群中,约4%患者E2F3基因存在CNA 变化或突变,其类型主要包括基因扩增(40 样本)和缺失(25样本),见图1。通过对突变位点分析发现,E2F3在黑色素瘤的突变位点共有21 个,包括E20K、G77S、P89S、R134Q、E140D 等位点,具体位置及编码蛋白见图2。

图1 E2F3 基因在黑色素瘤中变异分析Fig 1 Variation analysis of E2F3 gene in melanoma

图2 E2F3 基因在黑色素瘤中变异位点Fig 2 The gene mutation sites of E2F3 in melanoma

2.2 E2F3 基因在黑色素瘤及正常组织中的表达

Oncomine 数据库结果显示E2F3基因在多种肿瘤中表达均高于正常组织,其中有2 项研究显示E2F3在黑色素瘤中表达也明显升高,见图3。结果表明,与正常皮肤组织相比,黑色素瘤中E2F3基因表达水平明显升高(t=5.06 or 9.61,P<0.01),Fold change 值分别为3.146 和3.687,见图3。通过GSE3189、GSE114445、GSE100050 和GSE465174个黑色素瘤相关GEO 数据集进行进一步分析,结果显示E2F3基因在黑色素瘤中表达水平均明显高于正常皮肤组织(P<0.01),具体结果见表1。

表1 E2F3 基因在黑色素瘤和正常皮肤组织的表达(GEO 数据库)Tab 1 Expression of E2F3 gene in melanoma and normal skin tissues(based on GEO database)

图3 E2F3 基因在黑色素瘤和正常皮肤组织中的表达(Oncomine 数据库)Fig 3 Expression of E2F3 gene in melanoma and normal skin tissues (based on Oncomine database)

2.3 E2F3 基因的变异和表达与黑色素瘤的预后

cBioportal 数据库结果表明,与非变异组相比,E2F3变异组的黑色素瘤患者总生存期(Overall Survival, OS)明显缩短(P<0.01),见图4。OSskcm 数据库生存分析结果也显示,黑色素瘤中E2F3基因高表达组患者的OS 和无进展间隔期(Progression Free Interval, PFI)均显著低于E2F3基因低表达组(P<0.05),见图4。以上结果均提示E2F3基因变异或表达增高的黑色素瘤患者预后更差。

图4 E2F3 基因变异和表达水平与黑色素瘤的KM 曲线图Fig 4 KM curves of E2F3 gene mutation and expression level with melanoma

2.4 E2F3 基因的变异和表达与黑色素瘤免疫浸润细胞或趋化因子的相关性

TISIDB 数据库结果显示,E2F3的CNA、甲基化和表达均与黑色素瘤中多种免疫浸润细胞和趋化因子均显著相关(Sperman 法),见图5。E2F3的CNA 水平与pDC(rho:-0.374,P<0.01)、Neutrophil(rho:-0.361,P<0.01)、Th17(rho:-0.337,P<0.01)等淋巴细胞的表达水平呈负相关,与CXCL5(rho:-0.293,P<0.01)、CCL13(rho:-0.265,P<0.01)、CCR1(rho:-0.286,P<0.01)等趋化因子的表达水平呈负相关,见图5。E2F3的甲基化水平与Th1(rho: 0.302,P<0.01)、Neutrophil(rho:0.294,P<0.01)、Act DC(rho: 0.273,P<0.01)等淋巴细胞的表达水平呈正相关,与CXCL16(rho:- 0.248,P<0.01)、CXCL12(rho:- 0.21,P<0.01)、CCR1(rho:-0.24,P<0.01)等趋化因子的表达水平呈正相关,见图5。E2F3的表达水平与Th17(rho:- 0.375,P<0.01)、Tcm CD4(rho:-0.369,P<0.01)、Th1(rho:-0.36,P<0.01)、等淋巴细胞的表达水平呈负相关,与CXCL 16(rho:- 0.462,P<0.01)、CCL 22(rho:- 0.296,P<0.01)、CCL 2(rho:-0.288,P<0.01)等趋化因子的表达水平呈负相关,见图5。

图5 E2F3 基因突变和表达与黑色素瘤中免疫浸润细胞和趋化因子的相关性热图Fig 5 Correlation heat map of E2F3 gene mutation and expression with immune infiltrating cells and chemokines in melanoma

通过对黑色素瘤的免疫亚型和分子亚型进行进一步分析,结果显示E2F3表达水平在不同免疫亚型和分子亚型中也具有差异(P<0.05),见图6。E2F3分别在wound healing 组和RAS_Hotspot 突变组表达最高,而在TGF-b dominant 和BRAF_Hotspot 突变组表达最低,见图6。

图6 E2F3 基因在黑色素瘤不同亚型的表达Fig 6 Expression of E2F3 gene in different subtypes of melanoma

2.5 E2F3 相关基因和生物学功能分析

LinkedOmics 数据库结果显示,以FDR<0.05为条件,黑色素瘤中与E2F3表达相关的差异基因共5 369 个,其中2 856 个基因与E2F3呈正相关,2 513 个基因与E2F3呈负相关,这表明尽管相关基因表达的方向不一致,但这些基因和E2F3共同促进了黑色素瘤的发生和发展,其机制可能与细胞凋亡、细胞增值、细胞周期等生物进程改变有关。BLM、GLO1、HCG18等基因与E2F3基因表达呈显著正相关,而IFITM3、IGFBP6、KCTD11等基因与E2F3基因表达呈显著负相关,TOP50的相关基因热图见图7。

图7 黑色素瘤中与E2F3 基因表达相关前50 个基因的热图Fig 7 Heat map of the first 50 genes related to E2F3 gene expression in melanoma

采用GSEA 方法进行GO 和KEGG 生物学功能分析。结果显示BP 主要集中在核糖核蛋白复合物的生物生成(Ribonucleoprotein complex biogenesis)、DNA 重组(DNA recombination)、RNA 3'-端加工(RNA 3'-end processing)等生物学进程,CC 主要集中在染色体区(chromosomal region)、三级颗粒(tertiary granule)、PcG 蛋白复合物(PcG protein complex)等细胞组分,MF 主要集中在螺旋酶活性(helicase activity)、DNA 二级结构结合(DNA secondary structure binding)、组蛋白结合(histone binding)等分子功能,见表2,图8。KEGG 结果显示主要富集在RNA 转运、真核生物的核糖体生物生成、细胞周期等通路有关,见图9。

表2 E2F3 相关基因的GO 生物学分析结果Tab 2 GO biological analysis results of E2F3 related genes

图8 E2F3 相关差异基因的GO 分析结果Fig 8 GO analysis results of E2F3 related differential genes

图9 E2F3 相关差异基因的KEGG 分析结果Fig 9 KEGG analysis results of E2F3 related differential genes

2.6 基于E2F3 相关基因筛选hub 基因

以P<0.05,|cor|≥0.45 为条件筛选出与E2F3相关的770 个基因,采用STRING(https://cn.string-db.org/)进行在线PPI 网络绘图,结果见图10,并将结果导入Cytoscpae 3.8.0 中,使用MCODE 和cyto-Hubba 模块进行进一步分析。MCODE 分析结果总共得出9 个模块,其中评分最高的模块如下,score=8.667,见图11。cytoHubba(MCC 计算法)总共得到10 个hub 基因,分别为WDR12、WDR43、RBM28、UTP18、DKC1、PAK1IP1、DDX31、TEX10、TRUB1、TRMT61B,见图11。

图10 E2F3 相关基因的PPT 网络富集图Fig 10 PPT network enrichment map of E2F3 related genes

图11 E2F3 相关基因的MCODE (Top1)和hub 基因(Top10)分析结果Fig 11 MCODE ( Top1 ) and hub genes ( Top10 ) analysis results of E2F3 related genes

采用GEPIA 在线数据库(http://gepia.cancerpku.cn/detail.php)鉴定以上基因在黑色素瘤中的表达,结果发现WDR12、PAK1IP1在黑色素瘤中的表达水平明显高于正常组织(P<0.01),见图12。PAK1IP1与黑色素瘤的分期有关(F=2.58,P<0.05),见图13。以上结果表明WDR12、PAK1IP1在黑色素瘤中具有潜在的诊断价值。

图12 WDR12、PAK1IP1 在黑色素瘤与正常组织中的表达水平Fig 12 Expression levels of WDR12 and PAK1IP1 in melanoma and normal tissues

图13 PAK1IP1 与黑色素瘤临床分期Fig 13 PAK1IP1 and clinical stage of melanoma

2.7 基于E2F3 相关基因筛选治疗黑色素瘤的小分子化合物

通过CMap 数据库共筛选出2 837 种相关小分子化合物,分数最低的前5 种依次为YC-1(Score=-99.37)、辛伐他汀(simvastatin,Score=-99.19)、细胞松弛素-d(cytochalasin-d,Score=-99.01)、Deforolimus(Score=-98.94)和细胞松弛素-b(cytochalasin-b,Score=-98.34),见图14。

图14 治疗黑色素瘤的小分子化合物分数热图 (前5 种)Fig 14 Fractional heat maps of the small molecule compounds for melanoma treatment (Top 5)

3 讨论

E2F3是E2F 家族中一个关键的转录因子,已被证实其在多种肿瘤中表达均增高,并且与肿瘤预后息息相关。E2F3主要参与细胞周期进程、DNA复制、DNA 修复和细胞凋亡等生物学过程,能与组蛋白乙酰转移酶相互作用,促进细胞周期从G1期进入S 期。具体来说,E2F3分为E2F3a和E2F3b两种异构体,两者均有助于E2F3靶基因转录的激活。然而,E2F3a属于基因转录的激活剂,而E2F3b却属于基因转录的典型的阻遏子。因此,在不同研究中,E2F3可能在调节细胞增殖等生物学功能方面表现出不同的作用。目前,E2F3在黑色素瘤的变异、表达和临床意义并不完全清楚。

通过多种数据库分析,本研究发现E2F3基因在黑色素瘤中存在低度变异,其表达水平明显高于正常皮肤组(P<0.01)。具体来看,E2F3基因在黑色素瘤中的变异率为约4%,主要以CNA 变化或突变为主,其突变位点有21 个。E2F3基因在黑色素瘤中表达水平大约是正常皮肤组织的2~3 倍不等,这表明E2F3的表达水平能协助黑色素瘤的早期诊断。在E2F3与黑色素瘤的预后分析中,结果发现E2F3变异组黑色素瘤患者的OS 明显低于非E2F3变异组(P<0.01),E2F3表达水平升高与黑色素瘤患者的OS 和PFI 缩短有关(P<0.05)。上述结果提示E2F3基因的突变和表达水平可能是预测黑色素瘤患者预后的指标之一。但在多因素回归分析中,并未能得出E2F3是黑色素瘤的独立预测指标。

基于肿瘤微环境中免疫浸润细胞也是肿瘤发生和发展的另一个关键驱动因素,本研究进一步分析了E2F3的变异和表达与黑色素瘤中免疫浸润细胞或趋化因子的相关性。结果发现E2F3的CNA、甲基化和表达均与黑色素瘤中多种免疫浸润细胞和趋化因子有关(P<0.05)。E2F3的CNA 和表达水平与中性粒细胞、DC、T 细胞亚群和多种趋化因子的表达水平均呈负相关,这表明E2F3变异和表达水平升高能影响肿瘤微环境中免疫浸润细胞的亚群,进而促进肿瘤的发生,但具体机制尚不清楚。

在上述基础上,本研究还探究E2F2促进黑色素瘤发生和发展的潜在机制。通过相关数据库分析,发现黑色素瘤中与E2F3表达相关的差异基因共7 702 个(P<0.05),其中3 956 个基因与E2F3呈正相关,3 746 个基因与E2F3呈负相关。通过KEGG 富集分析,结果发现上述基因主要富集在RNA 转运、真核生物的核糖体生物生成(Ribosome biogenesis in eukaryotes)等通路有关,这表明E2F3可能通过以上通路参与黑色素瘤的发生和发展。通过对差异基因进行MCODE 和cytoHubba 分析,总共得到10 个hub 基因,其中WDR12、PAK1IP1在黑色素瘤中的表达水平明显高于正常组织(P<0.01),PAK1IP1与黑色素瘤的分期有关(P<0.05)。以上结果暗示WDR12、PAK1IP1在黑色素瘤中具有潜在的价值。通过GeneCards 网站查询发现WDR12和PAK1IP1都是核糖体蛋白,主要在细胞核内表达,参与细胞周期、信号转导等细胞进程。在既往研究中,WDR12已被证实在胶质母细胞瘤和肝细胞癌中表达明显升高,并且与患者预后呈负相关。体外实验结果表明敲除WDR12或干扰WDR12表达下能抑制肿瘤细胞的增殖和侵袭,机制与抑制细胞周期和Akt-mTOR-S6K1 信号通路有关[11,12]。而PAK1IP1在HEK293T、A549、H1299 等肿瘤细胞系中均表现出抑制作用,过表达PAK1IP1能诱导p53 途径阻滞细胞周期抑制细胞增殖[13]。但目前两者与黑色素瘤并没有相关研究,其与黑色素瘤关系尚不清楚。

最后本研究通过CMap 数据库对黑色素瘤治疗潜在药物进行探索,结果发现YC-1、辛伐他汀、细胞松弛素-d、Deforolimus 和细胞松弛素-b 可能是治疗黑色素瘤的前5 种的小分子化合物。其中,辛伐他汀、细胞松弛素-d 和细胞松弛素-b 已经在A375 黑色素瘤细胞系中得到验证,而YC-1 和Deforolimus 与黑色素瘤尚无相关研究。YC-1 是鸟苷酸环化酶激活剂,也是缺氧诱导因子抑制剂,其靶点主要为HIF1A、GUCY1A2 等蛋白,能有效抑制HIF1α 的表达[14]。体外研究发现YC-1 能抑制肝细胞癌和乳腺癌细胞的增殖[15-17]。Deforolimus(MK-8669)是一种选择性的mTOR 抑制剂,多项临床试验结果显示其单用或联合应用对肉瘤、恶性血液病以及其他实体肿瘤均良好的抗癌作用[18,19]。以上结果表明YC-1、辛伐他汀、细胞松弛素-d、deforolimus 和细胞松弛素-b 在黑色素瘤的治疗中具有潜在的应用前景。

综上所述,本研究通过多种数据库从多维度分析E2F3在黑色素瘤中的作用和价值,最终发现E2F3基因的突变和表达水平升高与黑色素瘤的不良预后相关,并通过影响不同肿瘤免疫浸润细胞亚型参与黑色素瘤的发生和发展,其可能是黑色素瘤的潜在诊断标志物和治疗靶点。

作者贡献度说明:

韩利民:负责文稿的设计和撰写;叶钢、邓川、代姣:负责文章相关数据库分析;赵海龙:负责文稿的修改和审校。

所有作者声明不存在利益冲突关系。

猜你喜欢

趋化因子黑色素瘤负相关
N-末端脑钠肽前体与糖尿病及糖尿病相关并发症呈负相关
更 正
原发性食管恶性黑色素瘤1例并文献复习
翻译心理与文本质量的相关性探析
技术应用型本科院校非英语专业本科生英语学习焦虑的调查与研究
颅内黑色素瘤的研究进展
趋化因子及其受体在肿瘤免疫中调节作用的新进展
左拇指巨大黑色素瘤1例
子宫内膜癌组织中趋化因子CXCL12及其受体CXCR4表达水平研究
肝细胞癌患者血清趋化因子CXCR12和SA的表达及临床意义