APP下载

糖尿病、冠状动脉疾病及两病并存患者基因表达差异分析

2020-06-05宫蕊热依拉牙合甫张国亮任珊陈曼丽陈孟晖李海滨赵成

河北医药 2020年10期
关键词:测序通路软件

宫蕊 热依拉·牙合甫 张国亮 任珊 陈曼丽 陈孟晖 李海滨 赵成

2型糖尿病(T2DM)和冠状动脉疾病(CAD)密切相关,影响公众健康,加重了经济负担。冠状动脉疾病是2型糖尿病的常见并发症,其中斑块形成致使冠状动脉变窄,严重程度影响患者冠状动脉疾病分级。T2DM和CAD常常与POMP、肥胖等疾病同时存在。T2DM与CAD具有诸多共同危险因素,如年龄,性别,体重,生活方式,心理社会压力和暴露于环境污染物等,两者均具有慢性炎症[1,2]和凝血系统紊乱特征[3]。2型糖尿病与心血管疾病发生以及死亡风险增加密切相关[4,5]。潜在机制与胰岛素抵抗、非自主调节脂质代谢、凝血异常、动脉壁生物反应效应易感基因之间复杂的相互作用等有关[6]。Wu等[7]发现2型糖尿病,肥胖和冠状动脉疾病在基因敏感区域(bin 9.3和6.5)均有表达共享。基因组信息(正常状态、疾病相关),尤其是在高通量技术对认识疾病的复杂生物过程具有重要价值[8]。本研究通过比较2型糖尿病和冠状动脉疾病基因表达谱,探讨两者之间的关联性。

1 资料与方法

1.1 一般资料 收集确诊患者及健康者(对照组)共计20例。其中T2DM患者2例,CAD患者2例,T2DM合并CAD者6例(T2DM+CAD),对照组10例。T2DM患者符合世界卫生组织诊断标准[9];PCI术后、CABG患者以及冠脉CTA血管限流>75%患者作为CAD患者入组标准[10]。T2DM与CAD并发患者满足上述2个入选标准。对照组为健康人群,年龄性别比例符合试验要求。本研究无药物干预同时不干预患者用药,通过伦理审批,向所有受试者提供书面知情同意书。

1.2 主要试剂与仪器 TRIZOL试剂;TruSeq RNA文库制备试剂盒 Ribo-Zero Magnetic kit;random primer;Superscript III;USER酶;三氯甲烷、异戊醇、无水乙醇(分析纯);DEPC water;低温高速离心机;ABI7500型快速实时荧光定量PCR仪;Nanodrop ND-2000超微量紫外分光光度计;Hiseq2500。

1.3 主要统计平台及软件TopHat v1.3.1 软件;Cufflinks v1.0.3软件;GENECODIS软件;Cytoscape软件;bwa软件;SeqPrep软件;GOrilla软件。

1.4 qRT-PCR检测 使用Trizol试剂从血液样品中提取总RNA。使用Nanodrop ND-2000分光光度计测量RNA的质量和数量。RNA完整性检测方法:Agilent 2100、琼脂糖凝胶电泳(琼脂糖凝胶浓度:1%琼脂糖胶;电压:5 V/cm;时间:20 min)。

1.5 建库测序 PCR扩增15个cycles,后应用HiSeq TM 2500平台第二代高通量测序技术对mRNA进行测序,进行测序。通过去接头、去低质量、去污染变性稀释后的文库加入到鞘流池(FlowCell)内,与FlowCell 上的接头杂交,完成数据的处理,得到最终数据。

1.6 分析数据 实验对mRNA数据分别进行了标准分析及mRNA共表达分析。样本数≥6时,使用Pearson相关系数法分析样本间mRNA与蛋白编码基因的相关性。该分析中,采用Pearson相关系数法分析样本间mRNA与蛋白编码基因的相关性,阈值使用0.9。

1.6.1 差异表达基因分析:应用TopHat v1.3.1软件[11]将原始测序所得与UCSC(University of California Santa Cruz)人类参考基因组(Build hg19)进行比对。利用Cufflinks v1.0.3软件对原始比对文档进行处理,衡量转录样本丰度[12];鉴别差异表达基因:应用配对t检验用于鉴别差异表达基因。P<0.05作为基因表达显著差异的标准。用pheatmap热图代码R函数/Bioconductor包对差异表达基因执行层次集群聚类计算;差异表达基因功能富集分析:应用在线软件GENECODIS对差异表达基因,采用基因本体论数据(GO)富集分析和京都基因基因组百科全书(KEGG)通路分析方法,进行生物学功能注释[13]。GOrilla软件验证GO分析结果。

1.6.2 蛋白-蛋白相互作用网络构建:基于在线数据库生物相互作用通用数据集(BioGRID,http://thebiog rid.org/),建立蛋白相互作用网络(PPIs)[14,15],应用Cytoscape软件对所选基因在PPI网络中的分布特征进行可视化处理。PPI网络中的节点表示蛋白质,而链接点之间的边表示2个蛋白质之间的相互作用联系。

1.7 通过GSE23561基因表达验证 依据以往的研究和数据库注释选择GSE23561数据集(GEO,http:// www.ncbi.nlm.nih.gov/geo)[16]。证实筛选的主要差异表达基因。从而证明本研究高通量数据分析的准确性,以期弥补样本量小可能带来的差异表达基因测序的单芯片假阳性或假阴性可能。

2 结果

2.1 转录组测序分析 CAD、T2DM、T2DM+CAD以及对照组,测定生成3.28 ×107,2.88×107,3.30×107和2.28×107条测序读数。与选择的UCSC数据库提供的人类参考基因组Build hg19进行对比,各组具有独特相对总读数分别为2.17×107,1.90×107,2.18×107和1.51×107。

2.2 组间基因差异表达

2.2.1 T2DM与对照组差异表达分析发现,T2DM有474个基因显著差异表达,其中上调表达基因126个,下调表达基因348个。其中92个GO注释的基因显著差异表达。帕金森氏病的通路在T2DM组中高度富集表达(P=0.001),提示T2DM可能促进帕金森病的发生发展。见表1。

2.2.2 CAD与对照组差异表达分析:CAD有488个基因显著差异表达,其中有400个基因是上调的另外88个下调表达。趋化因子信号通路是其中最显著的富集途径之一(P=6.14E-11)。见表2。

表1 T2DM中差异表达基因前15条显著富集通路

表2 CAD中差异表达基因前15条显著富集通路

2.2.3 T2DM+CAD与对照组差异表达分析:T2DM+CAD组总共分析发现439个差异表达基因,370个为上调表达基因,69个为下调表达基因。其中最显著的富集通路为信号转导(GO:0007165,P=2.94E-07) 以及抗细胞凋亡(GO:0006916,P=2.86E-06)。见表3。

2.3 CAD、T2DM、T2DM+CAD相关性 发现191个基因有较强的重叠表达。计算两两之间Spearman相关系数评价相关性。统计结果表明,CAD,T2DM,和T2DM + CAD者之间存在显著的相关性(P<0.0001),其中T2DM与T2DM+CAD的相关性在外周血基因表达谱中最为显著(Spearman’s rho=0.6757,P<0.0001)。CAD、T2DM和T2DM + CAD共同差异表达基因主要通过核糖体(P=2.77E-06),黏着斑(P=0.03),细胞凋亡(P=0.03),小细胞肺癌(P=0.03),RIG-I样受体信号通路(P=0.03),矿物质吸收(P=0.04),白细胞跨内皮迁移(P=0.04)等通路参与差异表达。见表4。

2.4 疾病特异性PPI网络图 经过统计处理:最终得到47个基因涉及在T2DM特定PPI网络关系图。其中包括1 216个蛋白节点和1 579条相互联系的边。其中包括重要的枢纽蛋白TCF4 (Degree=169),SKP1 (Degree=164) 以及UBE2W (Degree=75),说明了它们在T2DM发生发展中起到了重要的作用;最终得到54个基因,与CAD特定PPI网络关系图。其中包括943蛋白节点和1 085条相互联系的边。54个基因中包括重要的枢纽蛋白有HIF1A (Degree=124),SMAD1 (Degree=112)以及SKIL (Degree=94),说明这3个基因在CAD的发生发展过程中起到了关键的作用。见图1、2。

表3 T2DM + CAD组差异表达基因高表达通路

表4 T2D、CAD、T2D + CAD共同差异表达基因显著富集通路

2.5 GSE23561基因数据库基因表达验证 选择在CAD组中HIF1A,SMAD1和 SKIL显著差异表达进行验证,HIF1A,SMAD1和 SKIL为CAD特定PPI网络图中枢纽蛋白。在所选GSE23561基因数据库提供的表达数据中,HIF1A,SMAD1以及SKIL基因在CAD组中全部为上调表达基因,T2DM与正常对照组相比SMAD1以及SKIL基因表达无统计学变化。HIF1A在CAD和T2D中表达不同。

3 讨论

本研究应用RNA-seq识别T2DM、CAD以及两病共存情况下外周血独特的基因表达特征。比较了T2DM、CAD以及两病共存条件下的基因表达谱,分析相关性,探索共存病理生理机制。

T2DM和CAD基因表达谱均表现为凝血系统功能紊乱,局部炎性反应与脂质代谢失调。T2DM和CAD的共同病理生理特征可能与类似共同遗传变有关,如CDKN2A/2B,ADIPOR1[17]和TCF7L2基因的变异[18]。其中T2DM与T2DM + CAD的相关性最为显著。重叠表达基因主要富集于GO注释的病毒感染周期、抗细胞凋亡,内分泌腺胰腺的发育,先天免疫应答,凝血功能等通路。这些重叠基因主要参与核糖体相关的通路(RPS3A,UBA52,RSL24D1,RPL7,RPL39,RPL21,RPS24,RPS12)。

T2DM或CAD发展过程中起特殊作用的基因数据集发现,在T2DM特异性PPI网络中,显著的枢纽蛋白为TCF4 (Degree=169),SKP1 (Degree=164) 以及UBE2W (Degree=75)。其中TCF4,又名转录因子7-like 2 (TCF7L2),是编码参与Wnt信号通路的转录因子。TCF4刺激胰腺β-cells的增殖,调节胰腺在胚胎发育时期的质量。并诱导肠内分泌细胞分泌胰岛素促生长激素胰高血糖素样肽-1 (GLP-1)[19],在血糖的稳态中起着至关重要的作用。且多研究表明TCF7L2基因型与T2DM之间存在相关性[20-24]。Meta分析发现TCF7L2 rs7903146基因的多态性与中国人群T2DM患病风险增加有关。CAD特异性PPI网络研究发现, SMAD1和SKIL在CAD中特异性上调表达,在T2DM中无显著变化; HIF-1α为HIF1A基因编码转录因子,具有维持氧稳态功能。

HIF1A可能通过激活多种基因参与CAD的发生和发展与正常对照组相比,CAD患者的淋巴细胞和单核细胞中VEGF,HO-1,ET-1,HIF1A信使RNA表达显著上调;HIF1A的表达水平与动脉粥样硬化的严重程度和动脉硬化程度的间接评分具有高度相关性。一项研究表明,HIF1A多态性(rs11549465和rs11549467)与冠状动脉疾病的临床类型和冠状动脉侧枝的形成有关[20]。并且有相关研究证实HIF1A的rs2057482 SNP的多态性表达与早期CAD易感性的增加有关,可作为早期冠状动脉疾病易感性标志物应用于临床诊断[21]。

图1 T2DM中64个失调基因PPI网络图;红色节点表示上调基因,蓝色节点表示下调基因;粉红色的节点表示与差异表达基因相互作用的基因,较大的图标表示枢纽蛋白

有证据表明HIF1A多态性(g.C45035TSNP、rs11549465)与T1DM和T2DM均存在相关性[22]。并且HIF1A可以过绑定ARNT启动子造成小鼠β细胞特定HIF1A破坏,影响β细胞功能[23]。HIF1A在缺血性心肌细胞高血糖状态时抑制HIF-1αm RNA表达,抑制HIF-1α缺血应答[24,25],表明心肌梗死事件发生时以及随后的死亡率与高血糖状态正相关。

图2 CAD中69个失调表达基因PPI网络图;红色节点表示上调基因,蓝色节点表示下调基因;粉红色的节点表示与差异表达基因相互作用的基因,较大的图标表示枢纽蛋白

SMAD1和SKIL均参与SMAD通路,它们在冠状动脉疾病中均显著上调表达,在2型糖尿病中表达无变化。Tseng 等研究发现,SMAD1多态性与冠状动脉疾病患者心脏骤停有关[26]。在心脏特异性过表达SMAD1的转基因小鼠模型中,发现转基因小鼠缺血再灌注损伤(I/R)后心肌梗死明显减少,心肌细胞凋亡数量明显减少,提示SMAD1具有在缺血再灌注损伤后心脏保护中的作用[27,28]。SKIL是SMAD通路组成部分,被证明参与了心脏细胞纤维化的过程[29,30]。

TCF4、SKP1与UBE2W为2型糖尿病的关键调控基因;HIF1A、SMAD1与SKIL为冠状动脉疾病的关键调控基因。CAD枢纽蛋白为HIF1A,SMAD1与SKIL三个基因在CAD的发生发展过程中起到了关键作用。HIF1A在CAD患者中呈现上调表达趋势;SMAD1和SKIL基因在冠状动脉疾病中显著上调表达,具有缺血再灌注保护作用。冠状动脉疾病、2型糖尿病、2型糖尿病+冠状动脉疾病,之间存在共有的调控基因,可能具有相似的病理分子机制。

猜你喜欢

测序通路软件
氧化槐定碱体内体外通过AKT/mTOR通路调控自噬抑制HBV诱发肝纤维化
禅宗软件
小檗碱治疗非酒精性脂肪肝病相关通路的研究进展
外显子组测序助力产前诊断胎儿骨骼发育不良
中草药DNA条形码高通量基因测序一体机验收会在京召开
基因测序技术研究进展
软件对对碰
外显子组测序助力产前诊断胎儿骨骼发育不良
即时通讯软件WhatsApp
SphK/S1P信号通路与肾脏炎症研究进展