APP下载

基于GEO和TCGA数据库分析着丝粒蛋白A在胰腺癌中的表达及其临床意义

2020-06-24向晓辉毛骏李海

中华胰腺病杂志 2020年3期
关键词:细胞周期胰腺癌染色体

向晓辉 毛骏 李海

1天津市西青医院消化内科,天津 300380;2武警后勤学院研究生队,天津 300309;3天津市肝脏胰腺纤维化与分子诊疗重点实验室,天津 300162

胰腺癌是一种恶性程度很高、诊断和治疗都很困难的消化腺恶性肿瘤,起病隐匿,早期症状不典型,出现症状时大多已属中晚期[4],预后差[1]。着丝粒蛋白(centromere protein,CENP)是一组形成、介导着丝粒功能的蛋白[6-7],最早被发现的是CENP-A,由CENP-A基因编码。CENP-A是一种组蛋白H3变体,对于着丝粒的组装形成、染色体的正确分离以及细胞分裂的正常进行起到了不可替代的作用[8-10]。CENP-A在正常细胞中的转录、翻译水平受严格调控,对确保有丝分裂过程中基因组的稳定性发挥重要作用[7, 11]。研究发现CENP-A基因在多种恶性肿瘤中过表达,导致染色体非整倍体形成,而染色体非整倍体形成往往是肿瘤形成的重要原因之一[12]。本研究通过检索高通量基因表达(Gene Expression Omnibus,GEO)数据库和癌症基因组图集(The Cancer Genome Atlas,TCGA)数据库,探讨CENP-A在胰腺癌组织中的表达及其临床意义。

资料与方法

一、数据来源

自GEO数据库(http:www.ncbi.nlm.nih.gov/geo)的1个微阵列数据集(GSE28735)下载45例具有完整临床随访信息的胰腺癌患者癌组织和癌旁组织mRNA表达谱数据;自TCGA数据库(https://cancergenome.nih.gov/)下载178例胰腺癌患者癌组织的mRNA Seq数据,其中177例患者具有匹配的mRNA表达谱、生存数据和完整的临床病理数据。

二、数据处理与患者分组

下载edge R软件包(http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)对mRNA表达谱进行过滤、归一化处理,并经log2转换后用于后续分析[13-14]。基于TCGA数据库中177例胰腺癌样本CENP-A mRNA表达谱和随访数据,对样本的表达量进行由高到低排序后,取中位数将其分为高表达、低表达2组。

三、CENP-A基因功能富集分析

使用基因集富集分析(gene set enrichment analysis,GSEA)软件分析CENP-A mRNA表达水平与京都基因和基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路基因集的相关性[15-17]。设置随机组合次数为1 000次,计算标准化的富集系数(normallized enrichment score,NES),以标准化P值<0.01,且错误发现率(false discovery rates,FDR)<0.05为显著性富集。

四、CENP-A相关蛋白的筛选及相关性分析

STRING(Search Tool for the Retrieval of Interacting genes/proteins)数据库(https://string-db.org/cgi/input.pl)是一个研究分析蛋白之间相互作用的在线检索生物数据库,可用于寻找与CENP-A蛋白作用密切相关的多个蛋白,构建蛋白质-蛋白质相互作用(protein-protein interaction,PPI)网络。将STRING数据库分析结果中的蛋白和本研究中的GSEA富集通路结果结合,筛选出与CENP-A相关的蛋白,分析两者表达的相关性。

五、统计学处理

癌组织与癌旁组织表达量比较采用配对样本t检验,临床病理指标参数采用独立样本t检验。生存分析采用Kaplan-Meier法及Log-rank检验。对CENP-A表达与相关蛋白表达进行Spearman相关性分析,并用GraphPad Prism 8.0软件对数据进行可视化处理。P<0.05为差异有统计学意义。

结 果

一、CENP-A在胰腺癌组织和癌旁组织中的差异表达

GEO数据库下载的45例胰腺癌组织和相匹配的癌旁组织中CENP-A mRNA表达量分别为4.492±0.361和3.431±0.405,胰腺癌组织CENP-A mRNA表达量显著高于癌旁组织,差异有统计学意义(t=14.531,P=0.001,图1)。

注:CENP-A为着丝粒蛋白A图1 胰腺癌组织与匹配癌旁组织的CENP-A表达量

二、胰腺癌组织CENP-A表达量与肿瘤临床病理参数的关系

TCGA数据库下载的177例胰腺癌组织CENP-A基因表达量与TNM分期、肿瘤分级密切相关,差异有统计学意义(P值分别为0.035、0.007),而与患者年龄、性别、饮酒史及肿瘤家族史均无明显相关性(表1)。

三、CENP-A表达与胰腺癌患者预后的相关性

CENP-A的表达水平与胰腺癌患者总体生存期显著相关(P=0.001),高表达患者与低表达患者的生存率分别为36.4%和59.6%,中位生存期分别为511 d和913 d,高表达患者总体生存时间显著短于低表达患者,提示CENP-A基因高表达是胰腺癌患者预后不良的因素(图2)。

四、CENP-A基因功能富集分析

CENP-A高表达组织样本富集到细胞周期(P<0.001,FDR=0.004)与DNA周期(P<0.001,FDR=0.043)两个相关基因集,提示CENP-A可能通过上述两条通路发挥促进肿瘤发生发展的作用(图3)。

临床指标例数CENP-A表达量t值P值年龄(岁)-0.9650.336 <65816.743±1.417 ≥65966.931±1.175性别0.4060.685 男976.888±1.202 女806.809±1.365肿瘤分级-2.7500.007 G1~G21256.663±1.349 G3~G4507.244±1.020 未知2TNM分期-2.2430.035 Ⅰ226.037±1.881 Ⅱ~Ⅳ1556.960±1.147饮酒史-0.6170.538 无706.771±1.019 有1076.893±1.443肿瘤家族史-0.6000.549 无896.787±1.444 有886.904±1.119

注:CENP-A为着丝粒蛋白A

注:CENP-A为着丝粒蛋白A图2 CENP-A表达水平与胰腺癌患者生存时间的关系

五、与CENP-A密切相关的蛋白分析

使用STRING数据库分析构建CENP-A蛋白的PPI网络,发现周期蛋白依赖性激酶1(cyclin-dependent protein kinase, CDK1)、纺锤体检测蛋白1(budding uninhibited by benzimidazoles 1, BUB1)、细胞周期调节激酶(aurora kinase A, AURKA)、AURKB等多个蛋白与CENP-A相互作用(图4),结合GSEA富集的细胞周期与DNA复制相关通路结果筛选出CDK1和BUB1两个关键蛋白。应用Spearman相关性分析显示胰腺癌组织CENP-A与CDK1、BUB1呈显著相关性(r值分别为0.861、0.825,P值均<0.001,图5)。

讨 论

着丝粒是真核生物细胞在进行有丝分裂和减数分裂时染色体分离的调控装置,由DNA和蛋白质组成。CENP-A作为着丝点的标志性蛋白因子,在染色体精确分离过程中发挥着关键作用[18]。CENP-A功能失常将导致细胞分裂过程中发生染色体分离异常。在DNA复制过程中,染色质可通过回收修饰旧的组蛋白和沉积新的组蛋白而重新组装[19-20]。Nye等[21]研究发现,在肿瘤细胞中CENP-A的异常定位可以募集着丝粒组件,并与G1期的有丝分裂缺陷和DNA损伤相关。Takada等[22]的研究结果揭示了通过CENP-A介导的着丝粒功能障碍,被激活的细胞周期蛋白E1/CDK2促进细胞染色体不稳定性和肿瘤的进展。

注:CENP-A为着丝粒蛋白A

图3 CENP-A基因高表达相关基因集的富集 3A:富集细胞周期基因集;3B:富集DNA复制基因集

注:CENP-A为着丝粒蛋白A;CDK1为周期蛋白依赖性激酶1;BUB1为纺锤体检测蛋白1

图4 CENP-A的PPI网络

注:CENP-A为着丝粒蛋白A;CDK1为周期蛋白依赖性激酶1;BUB1为纺锤体检测蛋白1

图5 CENP-A与CDK1(5A)及BUB1(5B)的相关性分析

近年来研究发现,CENP-A在多种恶性肿瘤中过表达,其过表达与肿瘤的发生、发展、侵袭、转移及预后等密切相关[12]。最近一项基于生物信息学的研究显示CENP-A在淋巴瘤、平滑肌肉瘤、胶质母细胞瘤、鳞状上皮细胞肺癌、小细胞肺癌、髓样乳腺癌、乳腺导管癌、胃肠型腺癌、食管鳞状细胞癌、肝细胞癌、胰腺癌、口咽癌、结肠癌、直肠癌、宫颈癌、卵巢浆液性囊腺癌、前列腺癌等20种不同类型的实体癌中表达升高[9]。越来越多的研究表明,CENP-A具有作为肿瘤诊断标志物和预后指标的潜在应用价值[23]。CENP-A是雌激素受体阳性乳腺癌复发的预后标志物[24],CENP-A表达增加可能导致乳腺癌患者的无病生存期缩短[25]。口腔鳞状细胞癌组织中CENP-A蛋白和mRNA的表达明显高于正常组织,其表达水平与肿瘤大小、淋巴结转移有关,可能成为口腔鳞状细胞癌发生、发展的生物标志物[26]。CENP-A在11种主要的人原发性结直肠癌组织中均过表达。CENP-A mRNA表达也上调,表明CENP-A的过表达发生在转录水平,可能在结直肠癌的非整倍体形成中起重要作用[27]。

本研究借助GEO数据库CENP-A基因表达谱证实胰腺癌组织CENP-A mRNA表达量较癌旁正常胰腺组织上调,表明CENP-A基因具备作为胰腺癌病理诊断标志物的潜在价值。本研究基于TCGA数据库177例胰腺癌患者的CENP-A mRNA表达谱和临床数据进一步分析CENP-A表达量与胰腺癌临床病理指标及预后的相关性,发现CENP-A表达水平与肿瘤分期和分级密切相关,与患者生存时间呈负相关,提示CENP-A基因有望成为胰腺癌患者预后判断的新型分子标志物,并将有助于胰腺癌患者术后复发监测策略的完善。借助基因集富集分析发现CENP-A高表达组显著富集于细胞周期和DNA复制两条KEGG通路,进一步结合与CENP-A相关蛋白的分析结果推测,CENP-A可能是通过与之相关的CDK1和BUB1协同在胰腺癌组织中发挥其生物学作用。

虽然本研究为深入探讨CENP-A在胰腺癌中的作用提供了线索和依据,但尚未明确CENP-A参与胰腺癌发生发展的具体作用机制和途径,由于肿瘤的发生发展过程中存在多基因协同的复杂调控作用,因此其在胰腺癌形成过程中发挥的功能还有待后续实验予以进一步阐明及丰富。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢

细胞周期胰腺癌染色体
CT联合CA199、CA50检测用于胰腺癌诊断的敏感性与特异性探讨
胰腺癌治疗为什么这么难
吸烟会让胰腺癌发病提前10年
lncRNA LINC01206调控银屑病角质形成细胞的功能研究
植物细胞周期如何“刹车”?
多一条X染色体,寿命会更长
为什么男性要有一条X染色体?
高危型人乳头瘤病毒单一类型感染和多重感染对宫颈癌中细胞周期蛋白、抗凋亡蛋白表达量的影响
真假三体的遗传题题型探析
能忍的人寿命长