APP下载

基于TCGA数据库分析VEGFA在结肠癌中的表达及薏苡仁的干预研究

2022-11-01李周瑜杨欣张迎石昌菊金继华

中医药信息 2022年10期
关键词:结肠癌靶点数据库

李周瑜,杨欣,张迎,石昌菊,金继华

(贵州中医药大学基础医学院,贵州 贵阳 550025)

结肠癌是世界上第二大癌症,病死率高,存活率低,严重威胁人类健康,主要由大肠内层恶性赘生物引起[1]。目前,结肠癌发病率呈逐年上升状态,临床上主要采用传统的化疗、放疗和外科手术结合中药辅助治疗,但在化疗过程中使用的抗肿瘤药物不仅抑制、杀灭肿瘤细胞,对正常细胞也具有破坏作用[2]。由于现阶段缺乏有效的早期诊断手段,多数病人发现时已经为结肠癌晚期并发生转移,几乎无法手术根治,使结肠癌患者的预后变差。结肠癌的发展涉及多阶段、多因素,受原癌基因或肿瘤抑制基因的共同影响[3]。

随着多学科的相互交叉,肿瘤基础检测水平不断提高,内源性小分子中基因与蛋白表达的变化规律可以通过代谢组学、基因组学、蛋白质组学等现代科学技术进行监测,以帮助人们对癌症有更好的认知,从而提高对于癌症的预防、诊断和治疗能力[4]。TCGA 是目前最大的癌症基因信息数据库,相比GEO 数据库其优势是具有规范的临床数据,不只展现在多种癌型上,还包括基因表达数据、miRNA 表达数据、DNA 甲基化和SNP 等[5]。本研究首先采用网络药理学的方法筛选出结肠癌的关键靶点,基于TCGA 数据库分析关键靶点TP53、MYC、VEGFA、JUN、MMP9、TNF 和EGFR 基因在结肠癌患者中的表达状态;采用GEPIA 数据库对TP53、MYC、VEGFA、EGFR、MMP9、JUN 基因进行Kaplan-Meier 生存分析和Log-rankP检验;选择与结肠癌预后相关的基因VEGFA 和EGFR 探讨其与临床分期和多种临床病理特征的关系;采用COX 比例风险回归模型对与临床病理相关的基因VEGFA 进行单因素和多因素分析。揭示VEGFA 基因在结肠癌中的表达及临床意义,为进一步探讨VEGFA 在结肠癌发生、发展和预后中的作用提供理论依据。

1 资料及方法

1.1 数据库与软件

TCGA数据库(https://cancergenome.nih.gov/);STRING(https://stringhttpsdb.org/);Commparative Toxicogenomics Database(http://ctdbase.org/);Cytoscape 3.5.1软件(http://www.cytoscape.org);GEPIA(http://gepia.cancerhttpspku.cn/)。

1.2 结肠癌靶点筛选

通过CTD(Commparative Toxicogenomics Database)筛选结肠癌的潜在靶标基因,通过疾病名称(Colonic Neoplasms)或疾病ID(D003110)进行在线筛选,选择marker/mechanism(M)或者therapeutic(T)的靶标为研究对象。

1.3 GO(Gene Ontology)功能分析

结肠癌靶点GO 功能分析基于DAVID 6.8(DAVID 6.8,https://david.ncifcrf.gov/)在线分析,将174个靶点导入DAVID 数据库,限定物种为人源,设定阈值P<0.01,GO(Gene Ontology)注释分析包含生物过程(biological process,BP)、细胞组分(cellular component,CC)以及分子功能(molecular function,MF)。

1.4 结肠癌Hub靶点筛选

基于Cytoscape 3.5.1 软件中的CytoHubba 模块筛选结肠癌的Hub靶点。包括连接度(degree)、边缘渗出组件(edge percolated component,EPC)、最大邻居组件(maximum neighborhood component,MNC)、最大邻居组件的密度(density of maximum neighborhood component,DMNC)、最大团中心性(maximal clique centrality,MCC)、瓶颈值(bottleneck,BN)、偏心度(EcCentricity)、紧密度(closeness)、发散性(radiality)、中介性(betweenness)、应力(stress),本研究基于Degree、MNC、MCC和Stress四种算法输出Hub基因[6-7]。

1.5 收集TCGA数据库中表达数据

TCGA 数据库(Access TCGA Data)下载结肠癌患者基因表达谱数据(mRNA),基因表达谱数据已进行lg2(x+1)转化。基于perl 合并数据,删除数据缺失及差异较大的样本,确定473 例结肠癌样品和41 例正常样品,分析TP53、MYC、VEGFA、EGFR、MMP9、JUN 和TNF 基因在结肠癌患者中的表达状态,所有数据均使用R软件处理(V3.5.1)。

1.6 统计学方法

采用R 3.5.1 软件进行统计学分析,以mRNA 表达量的中位数为节点,将基因表达定义为高表达组和低表达组,用点图对TCGA-结肠癌(COAD)数据集患者的TP53、MYC、VEGFA、EGFR、MMP9、JUN 和TNF表达进行评价。采用GEPIA(http://gepia.cancer-pku.cn/)数据库用Kaplan-Meier 分 析TP53、MYC、VEGFA、EGFR、MMP9 和JUN 基因表达量与COAD 预后的相关性[8]。根据TCGA 数据库的临床数据,分析VEGFA 和EGFR 基因在不同等级COAD 组织中的mRNA 表达水平,探讨其与COAD 临床分期和多种临床病理特征的关系。单因素分析和多因素分析采用Cox比例风险回归模型,P<0.05代表差异具有统计学意义。

1.7 薏苡仁的干预研究

薏苡仁化合物基于TCMSP 下载化学结构,采用SYBYL 对小分子进行Minimize 能量最小化优化,获得合理构象。采用药物分子设计模拟SYBYL 2.1.1软件的Surflex-Dock 模块完成分子对接研究。从蛋白质晶体结构数据库RCSB(http://www.rcsb.org/pdb)获取VEGFA蛋白晶体结构(PDB ID:5T89)。

2 结果

2.1 结肠癌靶点GO注释分析

选择已经有实验验证的“M”或“T”为靶标,共筛选出174个结肠癌的靶标基因。GO(Gene Ontology)注释结果见图1,174 个靶点主要参与negative regulation of apoptotic process(凋亡过程的负调节)、positive regulation of gene expression(基因表达的正调控)、positive regulation of protein phosphorylation(蛋白磷酸化的正调控)和positive regulation of cell proliferation(细胞增殖的正调控)等生物过程;174 个靶点主要分布在extracellular space(细胞外间隙)、cytosol(胞质溶胶)、extracellular exosome、nucleoplasm(核质)和cytoplasm(细胞质)等;174 个靶点主要有enzyme binding(酶结合)、transcription factor binding(转录因子结合)、protein binding(蛋白质结合)、protein kinase binding(蛋白激酶结合)和chromatin binding(染色质结合)等分子功能。见图1。

2.2 结肠癌Hub靶点分析

174 个结肠癌靶点通过STRING 进行相互作用分析,基于Cytoscape 3.5.1 中的CytoHubba 中的Degree、MNC、MCC和Stress四种算法输出前10个Hub基因,见图2。采用FunRich 3.0 软件绘制结肠癌Hub 靶点的韦恩图,通过取交集的方法获取7 个Hub 靶点:肿瘤坏死因子(TNF)、p53 肿瘤蛋白(TP53)、原癌基因MYC 蛋白(MYC)、血管内皮生长因子A(VEGFA)、表皮生长因子受体(EGFR)、基质金属蛋白酶-9(MMP9)和转录因子AP-1(JUN)。

图2 关键靶标筛选

2.3 关键基因在结肠癌组织和正常组织中的表达

TCGA 数据中删除临床信息和预后信息不完整样本,保留473 例结肠癌样品和41 例癌旁组织样品,将TP53、MYC、VEGFA、JUN、MMP9、EGFR、TNF mRNA 表达值平均分为2份,数值从小到大依次为低表达和高表达。TNF mRNA 表达值在结肠癌组织和正常组织中差异无统计学意义(P>0.05);TP53、MYC、VEGFA、JUN、MMP9 mRNA 表达值在结肠癌组织中显著高于正常组织(P≤0.01);EGFR mRNA 表达值在结肠癌组织中显著低于正常组织(P<0.01)。见图3。

图3 关键基因mRNA表达

2.4 关键基因的表达与结肠癌预后的关系

TNF mRNA 表达值在结肠癌患者中无统计学意义(P>0.05),将不进行预后研究。为明确TP53、MYC、VEGFA、JUN、MMP9、EGFR 表达与结肠癌预后之间的关系。运用Kaplan-Meier 模型进行分析。TP53、MYC、VEGFA、JUN、MMP9、EGFR 表达水平在总生存率(overall survival,OS)中与结肠癌患者预后情况无关(Log-rankP>0.05);TP53、MYC、JUN、MMP9 表达水平在无病生存率(disease-free survival,DFS)中与结肠癌患者预后情况无关(Log-rankP>0.05);EGFR 表达水平在DFS 中与结肠癌患预后情况显著相关(Log-rankP= 0.036);VEGFA 表达水平在DFS 中与结肠癌患预后情况显著相关(Log-rankP=0.016)。见图4。

图4 不同基因的总生存率和无疾病进展生存率

2.5 EGFR、VEGFA表达量与临床病理参数相关性

EGFR、VEGFA 基因表达与预后有一定相关性(P <0.05),将进一步探讨EGFR、VEGFA 表达量与COAD临床分期(stage)和T、N、M分期的相关性。临床分期结果显示:EGFR基因表达量与COAD临床分期无显著相关性(P=0.064);VEGFA 基因表达量与COAD临床分期具有显著相关性(P=0.006)。见图5。T 分期、N 分期和M 分期结果显示:EGFR 基因的表达量与T 分期、N 分期和M 分期无显著相关性;VEGFA 基因的表达量与N 分期呈显著正相关,N1 和N2 期COAD 组织中VEGFA的基因表达量显著高于N0期(P <0.05)。见图6。

图5 EGFR、VEGFA基因表达量与COAD临床分期的相关性

图6 EGFR、VEGFA基因表达与COAD临床病理特征的相关性

2.6 影响结肠癌患者预后的单因素和多因素分析

EGFR 基因的表达量与临床病理参数相关性差异不显著(P>0.05),将不进行预后的单因素分析和多因素分析。故本研究只进行VEGFA 在结肠癌患者中表达的单因素和多因素分析。单因素回归分析发现,年龄、临床分期及T、N、M 分期能够影响患者的预后(P<0.05),VEGFA 表达状态和性别对预后没有明显影响。见表1。以上因素纳入COX 多因素回归分析,结果提示年龄、T 分期是影响结肠癌患者预后的独立因素(P<0.05)。

表1 VEGFA在结肠癌患者中表达的单因素分析和多因素分析

2.7 分子对接

通过TCGA 分析发现VEGFA 与结肠癌发生、发展和预后关系密切,基于TCMSP 下载薏苡仁化学成分38 个,其中16 个化学成分与VEGFA 有较好的结合(T_Score >5),薏苡仁内酯与VEGFA 的结合分数最高,为6.6。见表2。

表2 化学成分与VEGFA分子对接结果

3 讨论

本次研究分析了来自TCGA 数据库的结肠癌mRNA 数据,共纳入514 例样本。根据VEGFA mRNA的中位表达量,将研究对象分为VEGFA 高表达及低表达两组。主要分析结肠癌中VEGFA 表达与临床病理及预后的关系。VEGFA mRNA 在结肠癌组织中高表达,其表达量与N分期呈正相关,进一步揭示了结肠癌患者VEGFA 表达量与预后的关系,绘制Kaplan-Meier 生存函数曲线,结果提示VEGFA mRNA 高表达组与低表达组DFS 的差异均有统计学意义(P<0.05)。单因素分析发现,年龄、临床分期及T、N、M 分期能够影响结肠癌患者的预后(P<0.05),性别和VEGFA 表达状态与结肠癌患者预后无相关性(P>0.05);COX 多因素回归分析结果提示,年龄、T 分期是影响结肠癌患者预后的独立因素(P<0.05)。

结肠癌的发生、发展过程,包括肿瘤生长、侵袭和转移,与血管的生成密切相关,其过程中多种因子参与的信号通路起到一定作用[9]。VEGFA 表达水平在DFS中与结肠癌患预后情况显著相关。VEGFA 又称为血管通透因子,是血管生长因子VEGF 的一类重要亚型,为血管生成促进因子,影响器官的发育、创伤愈合、组织再生、内皮细胞生长和血管渗透等[10]。有研究表明在结肠癌患者中VEGFA 过表达与血管生成以及肿瘤的生长、转移密切相关[11],而且有研究发现,很多实体瘤中VEGFA/VEGFR2信号可以诱导肿瘤的血管生成,其中包括结直肠癌、肝癌、乳腺癌和胃癌等[12-13],也有一些抑制剂Vatalanib、Cabozantinib、Foretinib 能够通过抑制VEGF的表达,控制肿瘤血管生长的过程[14-16]。本研究揭示VEGFA 基因在结肠癌中的表达及临床意义,为进一步探讨VEGFA 在结肠癌发生、发展和预后中的作用提供理论依据。

目前,结肠癌患者死亡多数与复发和转移相关。但是临床上结肠癌的靶向治疗处于初级阶段,因此,掌握结肠癌的发生、发展的生物学特征及关键靶点,可更好地为开发抗结肠癌药物提供理论依据。本研究对TCGA 数据库进行数据挖掘,揭示VEGFA 基因在结肠癌中的表达及临床意义,为进一步探讨VEGFA在结肠癌发生、发展和预后提供理论依据。但是,本研究研究的样本量数量有限,仅mRNA 水平探讨VEGFA 基因在结肠癌患者中的表达及预后作用,后期将进一步采用蛋白印记或免疫组化在蛋白水平上进行深入研究。

猜你喜欢

结肠癌靶点数据库
鸢尾素(Irisin):运动诱导骨骼肌自噬的新靶点
基于系统药理学探讨莪术醇调控铁死亡和细胞自噬的作用机制
维生素D受体或是糖尿病治疗的新靶点
腹腔镜结肠癌根治术治疗结肠癌患者疗效及对免疫功能、应激反应及胃肠激素的影响研究
助“癌”为虐的细菌
数据库
数据库
数据库
数据库
腹腔镜治疗结肠癌27例临床观察