APP下载

大规模分析揭示胶质母细胞瘤致病关键基因及SYN1生存预后因子

2022-04-18耿艳敏李超谭军

当代医学 2022年11期
关键词:差异基因通路神经

耿艳敏,李超,谭军*

(1.新乡医学院第三临床学院,河南 新乡 453003;2.佛山市妇幼保健院,广东 佛山 528000)

脑胶质瘤是起源于脑神经胶质细胞的肿瘤,是最常见的原发性颅内肿瘤,而胶质母细胞瘤(glioblastoma,GBM)是其中一种最常见且最具侵袭性的脑胶质瘤,生长迅速,预后较差。全球来看,北美、澳洲GBM发病率最高,尤其是美国,发病率已达9.23/10万[1-2]。由于GBM致病分子机制尚不明确,疾病早中期缺乏特异性表征,也缺乏有效治疗手段,目前约70%患者在2年内死亡。因此,明确GBM发生、发展机制,实施有效治疗对改善预后具有重要意义。近年来,基于生物信息学的表达谱分析已鉴定出用于肿瘤诊断和预后的各种生物标志物[3-5]。本研究采用生物信息学手段从TCGA数据库筛选GBM患者的临床数据,挖掘其差异表达基因并行功能注释,鉴定预后因子,了解GBM潜在的分子机制,为GBM寻找新的诊疗靶标提供依据,现报道如下。

1 对象与方法

1.1 研究对象 从TCGA数据库下载最新的GBM基因表达谱数据和临床资料,数据类别选择转录组分析,数据类型选择基因表达定量,最终纳入174例临床样本,其中169例为GBM肿瘤样本,5例为正常脑组织对照样本。

1.2 数据处理

1.2.1 差异基因 采用R语言的“limma”包筛选差异表达基因[6]。对重复的基因取平均值,定义adj.P.Val<0.05且log2FC绝对值>2的基因为具有统计学意义的差异基因。利用R包“org.Hs.eg.db”转换基因名称为对应的基因ID,用于后续的基因功能注释富集分析[7]。

1.2.2 功能注释 采用R语言的“clusterProfiler”包进行差异基因的GO和KEGG富集功能注释[7]。GO注释通常分为分子生物学功能(molecular function,MF)、生物学过程(biological process,BP)和细胞学组分(cellular component,CC)3类。KEGG数据库被广泛用于基因通路的富集注释。设置筛选参数pvalueCutoff=0.05为具有统计学意义,P值矫正方法为Benjamini-Hochberg。

1.2.3 核心基因 String数据库主要用于研究基因编码蛋白间的相互作用网络,挖掘核心的调控关键基因。本研究设置参数score>0.4为差异具有统计学意义。Cytoscape软件用于将调控基因网络文本文件进行可视化分析。采用Cytoscape软件的Cyto-Hubba插件可鉴定候选关键基因,数据输入文件为String数据库获得的结果文件,得到排名前10的候选核心基因进行后续生存分析[8]。

1.2.4 生存分析 逐一提取TCGA数据库中GBM样本表达谱10个候选关键基因的表达矩阵和临床数据中记录的生存时间。采用R语言“survival”包绘制生存分析曲线[9]。所有分析均以各个基因在不同样本的中位表达值为界,分为高表达组和低表达组,评估候选核心基因对GBM患者生存时间的影响,设定P<0.05为具有统计学意义的生存曲线。

2 结果

2.1 差异基因及功能注释 根据设置的差异基因筛选条件,共鉴定出1 326个差异表达基因,其中868个基因表达下调,458个基因表达上调,见图1。差异基因的GO富集分析详见图2。BP变化的差异基因显著富集于突触信号传递的调控、神经元投射发育的调节;CC变化的差异基因主要富集于突触前、突触膜、轴突部分、神经细胞体和突触后专业化方面;MF变化的差异基因主要富集于转运蛋白和渠道活性功能。KEGG通路富集分析详见图3。差异基因主要富集在神经活性配体-受体相互作用、钙信号通路、cAMP信号通路和谷氨酸能突触通路上。

图1 差异表达基因的火山图分布情况Figure 1 Volcano plot of differentially expressed genes

图2 GO富集气泡图Figure 2 Bubble chart of GO enrichment

图3 KEGG通路图Figure 3 Bubble chart of KEGG pathways

2.2 核心基因 根据CytoHubba模块,筛选出10个处于分子互作网络内的候选核心基因(图4),分别为GRIN1、SNAP25、SYN1、KCNJ9、SLC32A1、DLG4、GRIA2、HTR5A、TP53和EGFR。其中前8个为低表达基因,后2个为高表达基因。

图4 关键共有差异基因鉴定网络Figure 4 Network identification of key common differential genes

2.3 生存分析 依次提取10个候选基因表达量,将其与样本生存时间合并,绘制生存曲线。生存分析发现仅SYN1具有统计学意义。SYN1在肿瘤低表达组预测有较高的生存率,高表达组相对预后不良;其表达分布及生存情况,见图5。

图5 SYN1表达分布及生存情况Figure 5 Expression distribution and survival of SYN1

3 讨论

近30年来,GBM患者的临床结果几乎无明显改善,综合诊断治疗,中位生存时间仅10~15个月。GBM是最激进且最常见的原发性中枢神经系统肿瘤,预后较差,5年总生存率是所有人类癌症中最低的肿瘤之一,需探寻能改善生存预测并帮助诊断治疗的新型分子标志物[10-11]。近年来,有研究通过高通量测序发现,MET基因相关的分子事件促进脑胶质瘤的恶性进展[12]。也有小样本量的初步报道CCND2基因的表达上调提示可能是GBM的有利预后因素[13]。

本研究通过TCGA全球数据库大规模样本结合生物信息学手段探索GBM发生的潜在致病关键基因及候选的预后因子。经功能富集分析发现,筛选的差异表达基因集中参与神经突触组织的构成,也集中显著富集于神经突触相关生物过程,参与神经活性配体-受体相互作用和神经信号的通路调控,揭示这些差异基因可能通过其表达量的变化改变原有的相关神经生物行为从而加速GBM的发生发展。分子互作网络筛选到的10个潜在核心基因经生存分析发现,SYN1为可能的预后因子,在TCGA肿瘤样本组为显著低表达。通过查询Oncomine数据库中的大型研究[14]也验证了GBM患者SYN1为显著下调基因,与本研究提取的TCGA样本表达情况相符。Kaplan-Meier法生存曲线分析发现,SYN1其相对的高表达通常预测更不良的生存结局。查询文献和数据库,SYN1基因是突触蛋白基因家族的成员,该家族成员具有共同的蛋白质结构域特征,与突触发生和神经递质释放的调节相关,提示在几种神经疾病中的潜在作用,基因表达变化可能与原发性神经元变性疾病有关[15-17]。考虑SYN1对患者生存时间的影响为首次提出,仅从统计学角度分析得出的结论,需进一步探讨其对生存预后的评估效能及药物开发的潜在靶标的价值,其具体的相关作用机制需更深入的体外研究实验阐明。

综上所述,表达谱芯片和测序技术的广泛应用,加快了对众多肿瘤致病机制的认知,全球数据库的建立和维护加速了肿瘤精准医学的进展。本研究综合运用生物信息学的技术手段初步筛选鉴定的GBM相关关键基因以期对GBM的诊疗研究起到一定的启示作用。

猜你喜欢

差异基因通路神经
神经松动术在周围神经损伤中的研究进展
氧化槐定碱体内体外通过AKT/mTOR通路调控自噬抑制HBV诱发肝纤维化
中西医结合治疗桡神经损伤研究进展
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
紫檀芪处理对酿酒酵母基因组表达变化的影响
“神经”病友
SphK/S1P信号通路与肾脏炎症研究进展
通路快建林翰:对重模式应有再认识
SSH技术在丝状真菌功能基因筛选中的应用