APP下载

基于miRNA-mRNA调控关系对与Cox回归模型的宫颈鳞状细胞癌预后生物标志物综合分析

2021-10-31李元幸牛晓辰常晶晶雒海瑕王伟

国际妇产科学杂志 2021年5期
关键词:生存率标志物宫颈癌

李元幸,牛晓辰,常晶晶,雒海瑕,王伟

宫颈癌是第二大导致女性死亡的癌症[1],宫颈鳞状细胞癌(cervical squamous carcinoma,CESC)是最常见的临床病理类型。尽管近年来宫颈癌的预防和诊治都有了长足发展,但短期内预防措施覆盖面有限,诊治水平也受地域局限[2],宫颈癌的预后仍然不容乐观,其5 年总生存率反呈下降趋势[3]。因此,探索宫颈癌的分子机制,寻找与宫颈癌预后相关的潜在生物标志物和治疗靶标仍然是临床的重要工作目标。

高通量测序的快速发展使各类基因生物标志物应用于临床成为可能。微小RNA(microRNA,miRNA)是一种小的非编码RNA,可以调节多种信使RNA(messenger RNA,mRNA)的表达,从而影响各种细胞生物学行为,包括转录、修饰、染色体重塑和信号传导等。越来越多的证据表明,miRNA 和mRNA 的异常表达与多种癌症的发生、发展有关,并且可能成为癌症的预后生物标志物和治疗靶标[4-5]。然而,目前miRNA 与mRNA 在宫颈鳞癌中的研究还较为有限。随着生物信息学研究技术的发展,现可通过网络公开的癌症数据库信息来辅助筛选并验证各类调控分子在癌症中的遗传信息[6]。癌症和肿瘤基因图谱(The Cancer Genome Atlas,TCGA)计划是一种涵盖多中心肿瘤基因数据的大型在线数据库。本研究通过TCGA 数据库中CESC 的相关样本数据,探讨miRNA 与mRNA 的相互作用关系,即miRNAmRNA 关系对,为将来CESC 分子机制、预后标志物和治疗靶点的研究奠定基础。

1 资料与方法

1.1 数据获取与整理通过TCGA 数据库(https://portal.gdc.cancer.gov/)下载CESC 的3 级mRNA 与miRNA 测序信息和临床数据。利用perl 语言(perl 5.30.2,https://www.perl.org/)完成数据的提取与合并,整理为R 语言可识别的矩阵文件。

1.2 差异分析使用R project 3.6.3 的edgeR 包对mRNA 与miRNA 表达数据分别进行差异分析。利用pheatmap 包分别绘制表达上调或下调的前20 个基因的热图。

1.3 miRNA 预后模型构建与评价使用survival 包进行miRNA 表达和CESC 预后的单因素与多因素Cox回归分析,筛选有统计学差异的miRNA 并构建miRNA 预后风险评分模型,计算公式为:风险值(risk score)=风险基因表达量1×coef1+风险基因表达量2×coef2+……+风险基因表达量n×coefn(coef 为风险系数)。

用survminer 与survival ROC 包进行Kaplan-Meier 生存分析并绘制生存曲线,计算受试者工作特征(ROC)曲线下面积(AUC)进行模型评价。根据预后模型计算所有样本的风险值,由低到高排序后根据中位数将患者分为高、低风险2 组,输出2 组中模型的生存曲线,验证模型的准确性。利用survival 包对所有样本的生存时间、生存状态、年龄、世界卫生组织(WHO)分级、TNM 分期及本研究构建的预测模型风险评分进行单因素与多因素的独立预后分析,评估构建预测模型的风险值是否能作为患者的独立预后因子(评价标准为P.adj<0.01)。

1.4 miRNA-mRNA调控网络的构建利用3 种生物信息学算法(miRDB、miRTarBase 与TargetScan 数据库)对纳入模型的miRNA 进行靶基因预测,筛选同时被2 个及以上数据库收录的靶基因,并与1.2 中差异表达的mRNA 取交集,明确其靶关系以及上下调表达关系,并通过Cytoscape 3.7.2 将miRNA-mRNA调控网络可视化。

1.5 miRNA-mRNA 关系对的筛选用同样方法对mRNA数据进行生存分析,筛选与患者生存预后密切相关的mRNA。为了进一步筛选miRNA-mRNA调控关系对,根据miRNA 对mRNA 的功能发挥抑制作用这一生物学基础[7]制定筛选标准:“高表达、生存率低”的miRNA 对应的mRNA“低表达、生存率低”;“低表达、生存率低”的miRNA 对应的mRNA“高表达、生存率低”。

1.6 功能富集分析为了进一步明确miRNA-mRNA调控网络所参与的主要功能,对其中的mRNA 进行基因本体功能(gene ontology,GO)富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析。以P<0.05 且伪发现率<0.05 作为富集的判断标准。

2 结果

2.1 样本特征和RNA 差异分析从TCGA 数据库进行检索分析后,共纳入255 例CESC 患者的肿瘤组织测序信息和2 例正常宫颈组织测序信息。与正常宫颈组织相比,CESC 肿瘤组织共有3 167 个差异表达的mRNA(上调1 030 个、下调2 137 个),115 个差异表达的miRNA(上调39 个、下调76 个)。上调与下调最显著的前20 个mRNA 与miRNA 见图1。

图1 CESC 中差异表达的RNA 聚类热图

2.2 miRNA 预后模型的构建对网络中的miRNA分别进行单因素与多因素Cox回归分析,最终确定4 个miRNA 可纳入预后风险评分模型,分别是hsamiR-505-5p、hsa-miR-142-3p、hsa-miR-3613-5p和hsa-miR-532-5p。预后风险评分模型计算公式为:风险值(risk score)=hsa-miR-505-5p 表达量×(-0.031 21)+hsa-miR-142-3p 表达量×(-0.000 06)+hsa-miR-3613-5p 表达量×0.00424+hsa-miR-532-5p 表达量×(-0.000 28)。

2.3 miRNA 预后模型评价hsa-miR-505-5p、hsa-miR-142-3p 与hsa-miR-532-5p 的生存曲线显示,低表达组生存率低(见图2A、B、C);hsa-miR-3613-5p 生存曲线显示,高表达组生存率低(见图2D)。根据预后模型计算所有样本的风险值,根据中位数分为高风险组与低风险组,高风险组生存率低于低风险组,证实模型准确(见图2E)。进一步对所有样本的生存时间、生存状态、年龄、WHO 分级、TNM 分期及本研究构建的预测模型风险评分进行单因素与多因素预后分析并绘制ROC 曲线,风险值是患者生存预后的独立预测因子,且随着风险值增大,患者生存率逐渐降低,其AUC 为0.872(见图2F),进一步证明了此miRNA 预后模型的可靠性。

图2 纳入预后模型的miRNA 不同表达者的生存曲线及预后模型评价

2.4 miRNA-mRNA调控网络的构建利用miRDB、miRTarBase 与TargetScan 数据库对纳入模型的4 个miRNA 进行靶基因预测,共预测到23 469个靶基因,其中同时被2 个及以上数据库收录的靶基因有1 674 个,与2.1 中差异表达的mRNA 取交集,共得到111 个靶基因,并由此构建了miRNAmRNA调控网络,见图3。

图3 CESC 的miRNA-mRNA调控网络

2.5 miRNA-mRNA 关系对的筛选生存分析筛选出9 个与CESC 预后相关的差异表达mRNA,见图4。分别是Ⅰ型血小板结合蛋白基序的解聚蛋白样金属蛋白酶3(ADAMTS3)、载脂蛋白B mRNA 编辑酶催化多肽3B(APOBEC3B)、染色质结构域蛋白8(CBX8)、整合素ɑ8(ITGA8)、微管剪切蛋白60 亚基Ⅰ型类似物(KATNAL1)、痩素受体叠加转录蛋白(LEPROT)、蛋白酪氨酸磷酸酶受体B(PTPRB)、G蛋白信号传导调节因子5(RGS5)和SEC23 同源物A(SEC23A)。根据miRNA-mRNA 关系对筛选标准,最终有4 个关系对具有重要生物学意义,通过miRNA 的表达变化调控下游mRNA 水平的变化,进而影响患者的生存预后情况,见表1。

图4 与CESC 预后相关的9 个mRNA 不同表达者的生存曲线

表1 miRNA-mRNA调控关系对

2.6 功能富集对miRNA-mRNA调控网络中的111 个mRNA 所属基因进行GO 富集分析,共富集到415 个GO 功能词条,包括374 个生物学过程(biological process,BP)、23 个 细 胞 成 分(cellular component,CC)和 18 个 分 子 功 能(molecular function,MF),主要富集在BP 中,如蛋白定位调控细胞外周环境、原胚层形成、中胚层形态形成与分化。KEGG 通路富集分析显示,差异表达的mRNA 主要富集在磷脂酰肌醇3 激酶-蛋白激酶B(PI3KAkt)信号通路与人乳头瘤病毒(HPV)感染。按照P值由小到大分别筛选了各组前10 个GO 功能词条和通路并进行可视化。见图5。

图5 mRNA 功能富集气泡图

3 讨论

CESC 现有的预后评价指标主要依据肿瘤的大小、分期与淋巴结转移情况,医师的主观判断与诊治水平对其预后评估影响较大[8],缺乏可靠的特异性生物标志物。寻找客观的CESC 预后因子,对监测肿瘤复发、提高患者生存质量、CESC 的机制研究和靶向药物研发都有着重要意义。miRNA-mRNA调控关系对是非编码RNA 领域研究的经典线性调控模式,在癌症预后预测中表现出巨大潜力。因此,本研究基于TCGA 数据库,利用基因表达差异分析、生存分析和预后模型等方法,最终得到与CESC 预后紧密相关的4 个miRNA-mRNA调控关系对,以期为临床诊疗和研究提供依据。

上述miRNA-mRNA调控关系对还未在CESC中展开研究。miRNA 是重要的靶基因调控因子,通过切断或阻止翻译而下调mRNA 表达,其作用近乎贯穿肿瘤发生、发展全过程。但目前hsa-miR-505-5p 和hsa-miR-142-3p 与CESC 的相关研究较少。研究报道miR-505-5p 与CESC 转移相关的临床病理特征密切相关,还发现miR-505-5p 过表达可以抑制宫颈癌细胞的转移和上皮-间质转化过程,从而抑制宫颈癌的进展和转移[9]。另外,也有研究证实hsa-miR-142-3p 在鼻咽癌、食管鳞状细胞癌组织中差异表达,可作为潜在的预后标志物[10-11]。mRNA 在基因编码蛋白质的转录过程中至关重要,在肿瘤发生、发展中起主要作用。研究显示,CBX8可以作为肝癌、结肠癌的预后因子[12-13]。Zhang 等[14]通过全基因组测序发现,CDX8 在食管鳞状细胞癌组织中局灶性扩增现象,可以作为食管鳞状细胞癌早期诊断标志物和治疗靶标。ADAMTS3 在细胞外基质组装与降解中有重要作用,已经被证明广泛参与血管和淋巴管生成、细胞迁移等生物学过程[15-16],因其与肿瘤复发、转移密切相关,有作为肿瘤预后因子的潜力。有研究报道PTPRB 通过与受体酪氨酸激酶的结合和去磷酸化,从而抑制肿瘤细胞增殖,可作为大肠癌、非小细胞肺癌的预后因子[17-18]。SEC23A 是SEC23 亚家族的成员,可通过影响外壳蛋白复合物Ⅱ(COPⅡ)的装配来调节肿瘤微环境从而影响预后,是皮肤黑色素瘤的预后标志物[19]。由上可见,CBX8、ADAMTS3、PTPRB、SEC23A 均与癌症的发生、发展和预后密切相关,但这些mRNA 在CESC 中的研究尚属空白,有待进一步深入探讨。而且,将差异表达的mRNA 与miRNA 数据相结合,有利于提供更多信息,进一步提高对CESC预后的预测准确性。

综合生物学进程的富集分析显示,miRNAmRNA调控关系对主要参与以下生物学功能:蛋白定位调控细胞外周环境、原胚层形成、中胚层形态形成与分化。下游关键通路主要富集于PI3K-Akt 通路与HPV 感染。PI3K-Akt 通路是肿瘤领域经典的致癌信号通路。在信号传导复合物的作用下,PI3K 活化并发生级联反应,导致原癌基因Akt 的异常活化,从而促使癌症发生[20-21]。HPV 也已被证明是宫颈癌发生、发展的主要因素[22]。上述富集通路再次从功能层面佐证了本研究筛选出的与CESC 预后相关的miRNA-mRNA调控关系对的可靠性。后续研究也可借鉴本研究筛选出的富集通路,作为miRNA-mRNA调控关系对的下游调控通路进行深入探讨。

综上,本研究基于miRNA-mRNA 关系对和Cox回归模型,利用TCGA 数据库综合分析了与CESC预后紧密相关的生物标志物。然而上述生物标志物在CESC 中的研究还涉及较少,有待进一步验证其表达及功能。本研究初步筛选了CESC 的预后标志物,对CESC 的机制研究、靶向药物研发以及监测CESC 患者预后都有着重要意义。随着更多功能性RNA 的发现,宫颈癌预后相关的基因研究范围有待扩展,期待宫颈癌遗传基因图谱的进一步揭密。

猜你喜欢

生存率标志物宫颈癌
炎性及心肌纤维化相关标志物在心力衰竭中的研究进展
多项肿瘤标志物联合检测在健康体检中的应用价值
『5年生存率』啥意思
“五年生存率”不等于只能活五年
肿瘤标志物的认识误区
中国首个宫颈癌疫苗厦门诞生
如何选择不同效价的宫颈癌疫苗?
日本首次公布本国居民癌症三年生存率
日本癌症患者十年生存率达59%左右
肿瘤标志物正常不等于没有肿瘤