APP下载

基于生物学信息技术分析GAS2L3在胶质瘤中的表达及意义

2022-05-11石爽钟佳成刘备张彪杨彪牛文勇李柏成覃川钟东张正保

临床神经外科杂志 2022年2期
关键词:差异基因细胞周期胶质瘤

石爽,钟佳成,刘备,张彪,杨彪,牛文勇,李柏成,覃川,钟东,张正保

脑胶质瘤是中枢神经系统最常见的原发性颅内肿瘤,尽管目前胶质瘤的多模态治疗取得一定的进展,但胶质瘤患者的治疗仍不理想,对于胶质母细胞瘤患者,其中位生存期仍低于2年[1]。GAS2L3是最近发现的微管蛋白和肌动蛋白结合蛋白,可调节胞质分裂和脱落,在细胞的有丝分裂和胞质分裂中发挥关键作用[2]。但是GAS2L3在胶质瘤上的表达及功能,以及是否与胶质瘤的病理分级及患者预后相关尚未研究。本研究拟利用基因表达谱交互分析(Gene Expression Profiling Interactive Analysis,GEPIA)网站评估GAS2L3在正常脑组织和胶质瘤中的表达差异,通过R语言分析肿瘤基因图谱(The Cancer Genome Atlas,TCGA)数据库中GAS2L3与胶质瘤的等级与预后的相关性,通过差异分析寻找GAS2L3在胶质瘤中的潜在功能,以期为胶质瘤提供新的治疗靶点和研究思路。

1 资料与方法

1.1 数据获取与处理 从美国TCGA(https://portal.gdc.cancer.gov)数据库中下载胶质瘤组织转录组测序(RNA-seq)数据。按照项目为TCGA-Repository-Brain、疾病类型为低级别胶质瘤(low grade glioma,LGG)和多形性胶质母细胞瘤(glioblastoma multiforme,GBM)、实验策略为RNA-seq、工作流程的类型为HTseq-Counts进行筛选,共获得702例胶质瘤组织样本及其临床信息。利用R语言(版本号R version 4.0.4)将counts数据与人类基因组注释文件GTF进行合并处理,生成行为基因、列为样本的基因表达矩阵。根据样TCGA的编码去除6例重复的胶质瘤组织样本,最终得到696个GBM和LGG组织样本。

1.2 GAS2L3的表达情况及与胶质瘤等级和预后的关系 在GEPIA(http://gepia.cancer-pku.cn/detail.php gene)网页中,点击进入Expression DIY 界面,以GAS2L3为目的基因,分别选取GBM和LGG,以TCGA normal和GTEx data中的正常脑组织为配对,分别在GBM和LGG与Normal组织中对GAS2L3基因进行表达水平的验证。下载TCGA中胶质瘤RNA-seq和临床信息,合并后分析GAS2L3表达量与胶质瘤等级的相关性,以GAS2L3表达量的中位数为Cut-off值,绘制Kaplan-Meier生存曲线。

1.3 GAS2L3的风险比 患者信息均来自TCGA数据库,总共703例胶质瘤病例,去掉6例复发行二次测序后重复数据,696例符合分析标准;其中男351例,女253例(男女比例约为1.38∶1);IDH1突变者423例,野生型253例;1p/19q非联合缺失490例,联合缺失168例。患者的年龄,性别,等级,IDH1突变,1p/19q以及GAS2L3均进行了单因素或多因素的COX回归分析。

1.4 GAS2L3与胶质瘤增殖、侵袭、凋亡和血管形成的关系 TCGA中胶质瘤数据下载后,在R语言(版本号R version 4.0.4)环境下,使用limma包进行数据归一化和标准化,考虑到肿瘤基因的非正态分布,采用Spearman计算GAS2L3与人类增殖细胞核抗原(proliferating cell nuclear antigen,PCNA),MKI67,MMP-9,MMP-3,CASP3,CASP8,CD34和PECAM1的相关系数,并绘制散点图。

1.5 差异表达基因的筛选 在R语言(版本号R version 4.0.4)环境下,使用limma包进行数据归一化和标准化[3],排除基因长度、测序深度和文库不同的影响,并进行差异表达基因的筛选,筛选条件为基因表达差异倍数的绝对值(logFC>1且P<0.05)的标准,得到最终有统计学意义的差异基因,并通过热图聚类分析差异基因的分布情况,火山图展示差异基因的差异情况。

1.6 数据库分析 使用DAVID(https://david.ncifcrf.gov/)数据库进一步将差异基因分析得到的数据集(logFC>1且P<0.05)块进行基因本体(Gene Ontology,GO)功能富集,以明确该模块中的基因所涉及的生物学过程(biological process,BP)、分子功能(molecular function,MF)及细胞定位(cellular components,CC)。同时进行京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,以便于明确这些基因参与到哪些代谢途径及信号通路,基因集富集分析(Gene Set Enrichment Analysis,GSEA)分析GAS2L3对相关细胞信号通路抑制和激活。

1.7 统计学方法 统计学分析采用R统计学软件(版本号R version 4.0.4)。肿瘤组织和正常脑组织GAS2L3表达的比较采用one-way ANOVAG方法;Wilcoxon秩和检验验证GAS2L3与胶质瘤等级的相关性;log-rank检验GAS2L3与胶质瘤患者预后的关系;GAS2L3的风险比采用单因素或多因素的COX回归分析,相关性分析采用Spearman相关系数;GAS2L3高表达与低表达组织的差异分析基于负二项分布的统计方法。检验水准α=0.05(双尾)。

2 结 果

2.1 GAS2L3在不同组织的表达差异 GEPIA 数据库分析结果显示,与正常脑组织相比,GBM组织中GAS2L3 mRNA 表达水平明显升高(P<0.05),见图 1A,但是LGG组织中GAS2L3 mRNA 表达水平与正常脑组织有差异,但无明显统计学意义,见图1B。

图1 GAS2L3在不同组织的表达情况

2.2 GAS2L3与胶质瘤的等级及预后的相关性 在TCGA胶质瘤数据库中,通过Wilcoxon秩和检验发现GAS2L3 mRNA水平随着胶质瘤的等级表达增高而增高(P<0.05),见图2A;以GAS2L3表达量的中位数为Cut-off值,绘制Kaplan-Meier生存曲线,log-rank检验发现GAS2L3高表达与胶质瘤的预后不良明显相关,见图 2B。

2.3 GAS2L3是胶质瘤的不良预后因素 单因素和多因素的方差分析显示年龄、肿瘤等级、IDH1野生型、及GAS2L3均为患者的不良预后显著相关,其中1p/19q非联合缺失单因素分析其与患者的不良预后显著相关,多因素分析显示其为患者不良预后因子,但P值处于临界值。单因素分析显示中 GAS2L3的风险度为HR=2(95%CI=1.8-2.2),在多因素回归分析中,GAS2L3的风险比率(hazard ratio,HR)=1.2(95%CI=1.01~1.4),说明GAS2L3的表达量越高,患者的预后越差。这些结果表明GAS2L3的表达水平能够作为胶质瘤的不良预后因素。见表1。

表1 GAS2L3的表达水平与患者预后的单因素和多因素分析结果

2.4 GAS2L3与胶质瘤和血管形成的相关性 Spearman秩相关显示,GAS2L3在胶质瘤中与PCNA和MKI67明显相关,相关系数分别为0.78和0.74;与MMP-9的相关系数为0.68,但与MMP-3的相关系数为0.21;同时本研究还检测其与胶质瘤凋亡和血管形成的相关系数,与CASP3和CASP8的相关系数为0.68和0.57,与CD34和PECAM1的相关系数分别为0.3和0.53。见图 3。

图3 GAS2L3与不同因素相关性散点图

2.5 GAS2L3不同样本的差异基因分析 根据TCGA数据库获得的696个临床样本, 以GAS2L3的表达情况由低到高进行排序,将GAS2L3高表达的胶质瘤样本与GAS2L3低表达胶质瘤样本进行差异分析,筛选条件为基因表达差异倍数的绝对值(logFC>1且P<0.05)的标准,共获取2 887个差异表达基因,火山图显示全差异变化情况(图4A),聚类热图显示2 887个差异分布情况(图4B)。

A:火山图展示差异基因表达情况; B:聚类热图显示差异基因的分布情况(logFC>1且P<0.05)

2.6 富集分析 将获取的2 887个基因通过R4.0.0进行基因ID转换,通过clusterProfiler、org.Hs.eg.db、enrichplot数据包,对交集基因做GO与KEGG富集分析。GO富集分析显示GAS2L3在胶质瘤中与细胞膜的膜电位,离子通道和胞质转运有关(图5A);KEGG富集分析显示与细胞的黏附分子,钙信号内流和蛋白质的溶解和吸收相关(图5B)。此外GO与KEGG还显示GAS2L3与细胞周期相关,图5根据P值从低到高显示,细胞周期未显示;GSEA对细胞信号通路分析显示,GAS2L3激活细胞周期通路(图6、图7)。

图5 差异基因的GO富集和KEGG分析

图6 GAS2L3差异基因富集的信号通路GSEA分析

图7 GSEA分析显示GAS2L3对CELL CYCLE信号通路的激活

3 讨 论

本研究通过GEPIA网站分析TCGA和GTEx数据库中,GAS2L3正常脑组织和肿瘤组织中的表达情况,发现GAS2L3高表达于GBM中。在对TCGA数据库胶质瘤及其临床信息数据进行分析后发现,GAS2L3随着胶质瘤的等级增加表达增强,并且通过生存曲线发现GAS2L3高表达与胶质瘤的预后呈负相关。为了进一步明确GAS2L3在胶质瘤细胞中的生物学功能,本研究通过Spearman秩相关计算了GAS2L3与胶质瘤的增殖和侵袭的指标的相关性,发现GAS2L3与胶质瘤的增殖相关。同时本研究分析了GAS2L3高表达的胶质瘤组织和GAS2L3低表达的胶质瘤组织基因的差异性,选取差异倍数为1倍,具有统计学意义的2 887个基因,分析了这些差异基因在胶质瘤细胞中的潜在功能,发现GAS2L3可能通过对细胞周期蛋白信号通路的激活,促进胶质瘤细胞的增殖。

微管(microtubule,MT)和肌动蛋白细胞骨架是细胞完整性的基础,因为它们控制着许多细胞活动,包括细胞分裂、生长、极化和迁移,介导MT和肌动蛋白细胞骨架之间的相互作用的蛋白质是许多细胞过程的关键,并起着重要的生理作用[4]。GAS2蛋白家族就是连接MT和肌动蛋白骨架的一类蛋白,推测其至少由肌动蛋白结合[actin-binding(CH) domain]结构域和微管结合[microtubule-binding(GAR) domain]结构域组成。尽管GAS2被定义为生长停滞特异性蛋白家族,但迄今为止尚未系统地研究过不同GAS2家族成员在不同疾病中表达模式,相互作用以及生物学功能[5]。GAS2家族包含有GAS2,GAS2L1,GAS2L2和GAS2L3四个成员[5], GAS2蛋白在肝癌[6]、白血病[7]、复发性结肠癌[8]、前列腺癌[9]、乳腺癌[10]和肺腺癌[11]中得到了广泛得研究,但GAS2L1,GAS2L2和GAS2L3的研究较少,最近的研究显示GAS2L3是DREAM复合物的靶基因,而DREAM复合物是细胞周期调控的基因转录关键调节因子,可驱动有丝分裂和胞质分裂所需的许多基因产物的表达[12-13],因此GAS2L3可能参与细胞骨架重组,细胞周期,细胞凋亡和癌症发展。

为了进一步明确GAS2L3在胶质瘤中的表达模式和生物学功能,本研究基于生物学信息技术进行相关研究。本研究发现GAS2L3高表达于GBM中,但在低级别的胶质瘤细胞和正常的脑组织低表达,并且低级别的胶质瘤细胞和正常脑组织的表达水平无明显统计学差异,其可能与GBM的恶性生物学行为相关。Ki-67是一种存在于增殖细胞中的核抗原,其表达与细胞周期密切相关,其在细胞周期G0期无表达,但在G1、S、G2、M期均有表达,是反映细胞生长活跃程度的标志,即 Ki-67表达越高,肿瘤细胞生长越活跃,恶性程度越高,它是目前应用最广泛,也是检测肿瘤细胞增殖活性最可靠的指标之一。PCNA位于第20号染色体,它是DNA复制和DNA修复所必需的酸性非组胺核辅助蛋白,其分子量为36KD,仅在增殖细胞中合成与表达;目前研究显示,PCNA的表达水平直接与胶质瘤恶性度相关[14-15]。肿瘤的侵袭涉及多个步骤:(1)肿瘤细胞通过细胞膜表面受体粘附到细胞外基质(extracellular matrix,ECM)层粘蛋白上;(2)活化并释放的蛋白水解酶前体对ECM的水解;(3)肿瘤细胞通过基底膜迁移,其中ECM的降解是判断肿瘤具有侵袭性的重要标志之一。目前的研究显示,MMP-9和MMP-3与胶质瘤的侵袭和迁移密切相关[16-17];在凋亡过程中,caspase几乎是所有细胞凋亡晚期的最后共同途径。caspase是一类进化上保守的半胱氨酸蛋白酶家族,激活的 caspase能水解包括细胞生命活动各环节中的蛋白,使细胞皱缩、断裂、染色质聚集、DNA降解凋亡,其中 caspase-8和caspase-3是两种执行凋亡调控功能的核心蛋白酶,是细胞凋亡内源性和外源性途径的必须 caspase分子,目前研究表明caspase-8和caspase-3能够反映胶质瘤细胞的凋亡,能抑制胶质瘤的生长[18]。CD34和CD31 在新生血管及非新生血管,包括大血管的内皮细胞上,均呈阳性表达,可作为内皮细胞的特异标记物;有研究显示其表达明显高于正常脑组织,且随肿瘤级别增高呈增高趋势,可用于标记脑胶质瘤标本微血管密度(microvessel density,MVD)[19-20]。本研究分析显示,GAS2L3与Ki-67和PCNA明显正相关,与胶质瘤的侵袭、凋亡和肿瘤的微血管形成具有一定的相关性。此外,虽然GAS2L3在GBM特异性表达,但是目前的测序显示其表达丰度较低,虽然通过临床数据分析,其与胶质瘤的等级成正相关,与胶质瘤的预后呈负相关,但是其在胶质瘤的生物学功能有待进一步的实验证实。与此同时,在对GAS2L3高表达和低表达的胶质瘤组织的差异基因分析中,本研究通过GO和KEGG的富集分析发现,GAS2L3相关的基因主要参与胶质瘤细胞膜的膜电位,与离子通道和胞质转运有关,但仍影响胶质瘤的细胞增殖的细胞周期过程,GAS2L3表达增加激活细胞周期相关的信号通路,其具体的信号通路也需要实验的进一步证实。

综上所述, GAS2L3高表达于胶质母细胞瘤中,且其表达强度可能与胶质瘤的等级相关。 GAS2L3可能胶质瘤的增殖密切相关, 与胶质瘤的侵袭、凋亡和肿瘤的微血管形成具有一定的相关性,其可能参与瘤细胞细胞周期信号通路的激活,有望成为胶质瘤生物治疗的新靶点。本实验为寻找胶质瘤的特异靶点提供了基础,但缺乏进一步细胞内和动物体内的实验支持,下一步将进行深入的研究。

利益冲突:所有作者均声明不存在利益冲突。

猜你喜欢

差异基因细胞周期胶质瘤
长链非编码RNA在胶质瘤中的研究进展
成人高级别脑胶质瘤术后复发相关因素分析
植物细胞周期如何“刹车”?
复发胶质瘤组织中miRNA-200c的表达 及作用机制研究
IgG、Integrinβ6、P16在人脑胶质瘤中的表达及其临床意义
基于高通量测序的药用植物“凤丹”根皮的转录组分析
基于高通量测序的药用植物“凤丹”根皮的转录组分析
紫檀芪处理对酿酒酵母基因组表达变化的影响
高危型人乳头瘤病毒单一类型感染和多重感染对宫颈癌中细胞周期蛋白、抗凋亡蛋白表达量的影响
“细胞增殖(第二课时)”说课稿