APP下载

基于生物信息学的肝细胞癌组织miR-1180表达与临床意义分析

2018-08-04余斌丁佑铭廖晓锋

中国普通外科杂志 2018年7期
关键词:癌基因脂质通路

余斌 ,丁佑铭 ,廖晓锋

(1. 武汉大学人民医院 肝胆腔镜外科,湖北 武汉 430060;2. 消化系统疾病湖北省重点实验室,湖北 武汉 430060;3. 湖北省襄阳市中心医院 普通外科,湖北 襄阳 441021)

原发性肝细胞癌(hepatocellular carcinoma,HCC)是全球最常见的恶性肿瘤之一,其发病率居世界第6位,致死率居世界第2位[1]。现阶段,尽管HCC的诊疗技术较前已有一定的提高,但HCC早期诊断困难、易复发、易转移等特点仍使得HCC患者的整体预后欠佳[2]。因此,深入研究HCC潜在的发生、发展机制,对于提升HCC的诊治水平以及改善患者的预后有着重要意义。

微小RNA(microRNA,miRNA)是一类长度约为22个核苷酸的内源性非编码RNA分子,其可在转录后水平与mRNA特异性结合下调靶基因的表达。诸多研究[3-4]表明,miRNA的异常表达与肿瘤的发生、发展及预后密切相关,具有癌基因或抑癌基因的功能。已有研究发现,miR-1180在多种实体肿瘤中存在异常表达,且呈现出一定的组织或肿瘤特异性。例如,miR-1180在肺癌和胰腺癌中表达上调,能促进癌细胞的增殖、迁移和侵袭,并与肺癌患者TNM分期和不良预后密切相关;但miR-1180在膀胱癌中却呈现低水平表达,发挥着抑癌基因的作用[5-7]。目前,miR-1180与HCC的相关性研究鲜有报道,故本研究基于GEO(Gene Expression Omnibus)和TCGA(The Cancer Genome Atlas)数据库来探讨miR-1180在HCC组织中的表达情况及其临床意义,并对miR-621靶基因进行系统的生物信息学分析,以期为寻找新型HCC诊断标志物或治疗靶点提供依据。

1 资料与方法

1.1 数据来源

本研究自GEO数据库(https://www.ncbi.nlm.nih.gov/geo/)下载了数据集GSE36915 miRNA表达数据,包含68例HCC组织,21例癌旁组织。从TCGA数据库(https://cancergenome.nih.gov/)中下载了377例HCC组织样本和50例癌旁组织样本的miRNAseq、mRNAseq表达谱和临床数据(3级数据),其中371例患者具有匹配的miRNA表达谱和临床数据,365例患者具有匹配的miRNA表达谱、mRNA表达谱和临床数据。

1.2 方法

1.2.1 差异表达分析 利用R(The Project for Statistical Computing)edgeR 包[8](http://www.bioconductor.org/packages/release/bioc/html/edgeR.html)分别对miRNA和mRNA表达谱进行过滤、归一化处理,筛选HCC组织与癌旁组织之间差异表达mRNA和miRNA(筛选标准:|log2差异倍数 |>1,P<0.05)。标准化后的 miRNA 和mRNA表达值以每100万标记读本中外显子的读本数(counts of exon model per million mapped reads,CPM)表示,并经log2转化后用于后续分析。

1.2.2 患者分组 提取TCGA数据库371例HCC患者匹配的miR-1180表达谱和预后数据,使用X-tile3.6.1(Yale University School of Medicine,New Haven,CT,USA)软件[9]基于Kaplan-Meier法及Log-rank检验确立最佳截断值7.05,将患者分为miR-1180低表达组(n=250)和miR-1180高表达组(n=121)。

1.2.3 miR-1180靶基因预测及功能分析 使用 DIANA-microT(http:// diana.imis.athenainnovation.gr)、TargetScan v7.1(http://www.targetscan.org)、MiDRB(http://www.mirdb.org/)3个数据库联合(取交集)预测miR-1180靶基因;利用miRwalk(http://129.206.7.150/)、Tarbase(http://carolina.imis.athena-innovation.gr)、miRTraBase(http://mirtarbase.mbc.nctu.edu.tw)3个数据库检索(取并集)已被实验所证实的miR-1180靶基因。两者的合集与HCC组织中差异低表达基因集合的交集即为本研究所确立的miR-1180靶基因集合。进而,利用在线 工 具 DAVID(https://david.ncifcrf.gov/tools.jsp)对miR-1180靶基因进行基因本体论(Gene ontology,GO) 及 KEGG(Kyoto encyclopedia of genes and genomes)通路富集分析。GO富集分析包括生物过程(biological process,BP)、细胞成分(cellular component,CC)和分子功能(molecular function,MF)3个部分。

1.2.4 关键靶基因筛选 利用在线工具STRING[10](https://string-db.org)联合Cytoscape软件[11]构建miR-1180靶基因蛋白互作网络,并运用CytoHubba插件依据连接度(degree)筛选出前30位关键基因(hub gene)。提取365例HCC患者关键基因的表达谱及预后数据,采用X-tile 3.6.1软件筛选预后风险基因,确立最佳截断值并绘制Kaplan-Meier曲线。

1.3 统计学处理

采用SPSS 22.0软件进行统计分析。计量资料采用独立样本t检验。受试者工作特征曲线(ROC)用于评价指标诊断效能,计算曲线下面积(area under the curve,AUC)。生存分析采用Kaplan-Meier法及Log-rank检验,并运用Cox比例风险回归模型分析影响患者预后的危险因素,计算风险比(hazard ratio,HR)及其95%可信区间(confidence interval,CI)。结局指标采用患者总生存期(overall Survival,OS),即术后病理确诊之日起至患者因任何原因死亡的间隔时间。以P<0.05为差异具有统计学意义。

2 结 果

2.1 HCC组织与癌旁组织miR-1180差异表达分析

GSE36915数据集与TCGA数据集的分析结果一致显示miR-1180在HCC组织中较癌旁组织差异高表达(均P<0.0001),且对于HCC具有良好的诊断效能(GSE36915:AUC=0.8 704,P<0.0 001;TCGA:AUC=0.8 450,P<0.0 001)(图1)。

图1 miR-1180在HCC组织及癌旁组织中表达量及其诊断HCC的ROC曲线Figure 1 Expression levels of miR-1180 in HCC tissues and adjacent liver tissues, and ROC curves of miR-1180 for diagnosis of HCC

2.2 miR-1180表达与HCC患者临床特征的关系

回顾性分析371例HCC患者miR-1180表达量与临床特征关系,结果显示miR-1180的表达水平与患者年龄、肿瘤家族史、肿瘤分化程度、AFP等密切相关(均P<0.05),而与性别、TNM分期、纤维化评分、Child-Pugh分级、血管侵犯等指标无明显关系(均P>0.05)(表1)。

表1 HCC患者miR-1180表达量与临床病理参数之间的关系Table 1 Relations of miR-1180 expression with clinicopathologic factors of the HCC patients

2.3 HCC患者预后影响因素分析

Kaplan-Meier分析提示HCC组织中miR-1180高表达涉及HCC患者不良预后(P=0.0 012)(图2)。此外,单因素Cox回归分析表明miR-1180表达量、TNM分期、血清甲胎蛋白与HCC患者OS密切有关(均P<0.05);多因素Cox回归分析则进一步提示TNM分期(HR=1.734,95% CI=1.127~2.668,P=0.012)、miR-1180表达量(HR=1.692,95% CI=1.152~2.485,P=0.007)是影响HCC患者OS的独立危险因素(表2)。

图2 不同miR-1180表达量HCC患者的生存曲线Figure 2 Survival curves of HCC patients with different miR-1180 expression levels

表2 HCC患者总体生存率影响因素的Cox回归分析Table 2 Cox regression analysis of factors affecting overall survival in HCC patients

2.4 miR-1180靶基因预测及功能分析

miR-1180有两种成熟体形式:miR-1180-3p和miR-1180-5p,分别来源于miR-1180前体的3'端和5'端。本研究共筛选获得miR-1180靶基因169个,其中miR-1180-3p靶基因39个,miR-1180-5p靶基因137个。富集分析提示miR-1180-3p的靶基因主要富集于脂质运输、上皮细胞迁移调控等生物过程(BP),低密度脂蛋白颗粒结合等分子功能(MF),以及乙醛酸和二羧酸代谢通路(KEGG)。miR-1180-5p主要富集于细胞雌二醇刺激应答、细胞迁移调控等生物过程(BP),肝素结合、钙离子结合等分子功能(MF),以及缬氨酸、亮氨酸和异亮氨酸降解、补体级联、脂肪酸降解等通路(KEGG)(图3)。

2.5 miR-1180关键靶基因筛选

结合蛋白互作网络和预后分析结果,本研究共筛选出6个miR-1180关键靶基因:过氧化物酶增殖激活受体γ辅激活蛋白1α(peroxisome proliferator activated receptor γ coactivator 1 α,PPARGC1A)、乙醛脱氢酶2(aldehyde dehydrogenase 2 family,ALDH2)、肌氨酸脱氢酶(sarcosine dehydrogenase,SARDH)、3-羟基-3-甲基戊二酰辅酶A合成酶2(3-hydroxy-3-methylglutaryl-CoA synthase 2,HMGCS2)、雌激素受体1(estrogen receptor 1,ESR1)、E26转录因子2(ETS proto-oncogene 1 transcription factor,ETS2);其中,ETS2为miR-1180-3p的靶基因;PPARGC1A、ALDH2、SARDH、HMGCS2、ESR1为miR-1180-5p的靶基因。上述6个基因在HCC组织中均呈现表达下调,且相对低表达者与不良预后密切相关(均P<0.05);比对miR-1180-3p/5p及上述靶基因序列,证实了miR-1180-3p/5p可与相应靶基因3'端非编码区(3'-UTR)结合(图4-5)。

图3 miR-1180靶基因的功能及通路富集分析Figure 3 Functional and pathway enrichment analyses of the target genes of miR-1180

图4 miR-1180靶基因的蛋白互作网络图Figure 4 The protein-protein interaction networks of the target genes of miR-1180

图5 miR-1180关键靶基因相关的生存曲线及miR-1180与其靶基因在3'-UTR的结合位点Figure 5 Survival curves associated with the key target genes of miR-1180 and the binding sites of miR-1180 in the 3’-UTR of the target genes

3 讨 论

miRNA表达异常在肿瘤的发生、发展中发挥着重要作用,深入研究miRNA与肿瘤的相关性将有望为肿瘤的诊断及治疗提供新思路和新策略。已有研究发现,miR-1180在多种肿瘤组织或肿瘤细胞株中存在异常表达,且呈现出一定的组织或肿瘤特异性,发挥着癌基因(如肺癌、胰腺癌等)或抑癌基因(如膀胱癌等)的作用。例如,肺癌组织中高水平表达miR-1180与患者TNM分期及预后显著相关[5];胰腺癌细胞中过表达miR-1180能下调靶基因TNIP2的表达,激活NF-κB信号通路,促进癌细胞的增殖、迁移和侵袭能力[6];而膀胱癌细胞中miR-1180与抑癌基因P21均呈现低表达,若过表达miR-1180则能显著上调P21表达水平,抑制膀胱癌细胞的增殖[7]。因此,深入探讨miR-1180在不同肿瘤中的作用及其机制有着非常重要的意义。

目前,对于miR-1180在HCC组织中的表达水平及其作用尚不十分明确。Zhou 等[12-13]研究发现HCC组织(8例)及HepG2等HCC细胞株中miR-1180的表达水平较其癌旁组织及LO2正常肝细胞显著上调,且过表达miR-1180可显著下调其靶基因TNIP2、OTUD7B的表达,激活NF-κB信号通路,显著增强癌细胞增殖、迁移和侵袭能力。考虑到上述研究存在样本量较少等不足,本研究首先基于GEO及TCGA数据库的大样本优势分析了miR-1180在HCC组织中的表达情况,证实了miR-1180在HCC组织中的表达水平较癌旁组织显著上调;另外,ROC曲线结果显示miR-1180表达量能较好地区分HCC组织和癌旁组织,提示了miR-1180具有作为HCC病理诊断标志物的潜在价值。

此外,本研究进一步探讨了HCC组织中miR-1180表达量与HCC患者临床病理指标及预后间的相关性。本研究发现miR-1180在低或未分化HCC组织中表达相对较高,且miR-1180表达量与肿瘤家族史相关,这提示了miR-1180密切涉及HCC的发生与发展。值得注意的是,本研究还发现HCC组织中miR-1180表达量与HCC患者血清甲胎蛋白表达呈正相关。已有研究证实,多种miRNA分子在肿瘤患者癌组织及血清中可同时存在表达异常,且具备一定的稳定性和组织特异性,例如miR-215[14]、miR-329[15]等。目前,笔者暂未发现miR-1180在HCC患者血清中表达量的相关研究,对于miR-1180能否成为一种新型HCC血清分子诊断标志物,以及能否联合AFP用于HCC患者的早期诊断有待进一步的研究阐明。此外,Kaplan-Meier分析提示HCC组织中高表达miR-1180与HCC患者不良预后有关,且多因素Cox回归分析证实miR-1180表达量是影响HCC患者预后的独立危险因素。因此,结合miR-1180的表达水平及其与临床病理指标和预后的相关性,推测miR-1180在HCC的发生、发展过程中主要发挥癌基因的作用。

基于miRNA-mRNA互作原理以及系统的生物信息学方法,我们还首次对miR-1180的靶基因进行了较为全面的预测并功能分析。富集分析提示miR-1180的靶基因主要富集于脂质代谢、细胞迁移、转录调控、细胞信号转导等功能,以及脂肪酸降解及缬氨酸、亮氨酸和异亮氨酸降解等通路。诸多研究表明,脂质代谢紊乱是肿瘤代谢的重要特征之一,一方面脂质代谢为肿瘤细胞的异常增殖供给大量能量;另一方面多种脂质分子是细胞膜、脂质信号分子的重要组分,参与诸多肿瘤相关通路的信号转导,涉及肿瘤(包括HCC)的增殖、侵袭、转移、血管生成等生物学过程[16-17]。目前,笔者暂未发现miR-1180参与调控脂质代谢的相关研究,深入研究miR-1180、脂质代谢、HCC三者间的相关性无疑具有广阔前景。

为进一步揭示miR-1180在HCC中的作用机制,本研究结合靶基因蛋白互作网络及预后分析筛选出6个miR-1180潜在关键靶基因,分别为ETS2、PPARGC1A、ALDH2、SARDH、HMGCS2、ESR1;其中PPARGC1A、ALDH2、HMGCS2、ESR1为脂质代谢调控相关基因。现有研究表明,PPARGC1A、ALDH2、HMGCS2、ESR1等4个关键靶基因与HCC的发生、发生过程密切相关。与本研究结果一致,相关研究已发现PPARGC1A、ALDH2、HMGCS2、ESR1等基因在HCC中均呈现低表达,且与患者不良预后有关;此外,当上调HCC细胞株中上述基因的表达水平则可通过调控相关信号通路(如AMPK信号通路、转录因子SP1等)显著抑制HCC细胞的增殖、迁移或侵袭等生物学过程,提示了PPARGC1A、ALDH2、HMGCS2、ESR1在HCC的发生、发展中发挥抑癌基因的作用[18-22]。目前,ETS2、SARDH与HCC关系的研究鲜有报道。作为MAPK/ERK通路的重要底物之一,ETS2的异常表达与多种肿瘤关系密切,且所起作用具有一定的组织特异性,发挥着癌基因(如喉癌等)或抑癌基因(如肺癌等)的作用[23-24]。SARDH是调控肌氨酸代谢的关键酶之一,其异常表达同样涉及肿瘤的发生与发展。Lim等[25]发现SARDH在HCC组织中较正常肝组织低表达,提示SARDH与HCC的发生、发展紧密相关,但具体作用及机制尚不明确。Khan等[26]发现SARDH在前列腺癌中低表达,当过表达SARDH则可显著抑制癌细胞的增殖能力,发挥抑癌基因的作用。结合本次研究靶基因差异表达分析和预后分析结果,推测ETS2和SARDH在HCC中同样作为抑癌基因而存在。基于上述研究结果及文献复习,我们认为HCC中miR-1180高表达可诱导其关键靶基因(ETS2、PPARGC1A、ALDH2、SARDH、HMGCS2、ESR1等)表达水平的异常上调,并由此促进HCC的发生和发展。

综上所述,本研究基于GEO和TCGA数据库合并系统的生物信息学方法揭示了miR-1180可作为一种促癌基因参与HCC的发生、发展,并拥有作为HCC诊断标志物、预后指标及治疗靶点的潜在应用价值。总之,本次生物信息学分析将有望为日后HCC发病机制的研究以及诊治方法的改善提供新策略、开辟新路径,但miR-1180及其靶基因在HCC中作用及其机制还有待后续实验予以证实及丰富。

猜你喜欢

癌基因脂质通路
氧化槐定碱体内体外通过AKT/mTOR通路调控自噬抑制HBV诱发肝纤维化
脂质过氧化在慢性肾脏病、急性肾损伤、肾细胞癌中的作用
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
肽基脯氨酰同分异构酶(Pin1)对子宫颈癌细胞脂质代谢的作用
癌基因敲除可完全抑制肺癌发生
苦参碱抑制RPMI8226细胞增殖及对Notch通路的影响
水蜈蚣总黄酮固体脂质纳米粒处方的优化
马钱子碱固体脂质纳米粒在小鼠体内的组织分布
抑癌基因WWOX在口腔肿瘤的研究进展
通路快建林翰:对重模式应有再认识