APP下载

基于GEO数据库的2型糖尿病骨骼肌差异表达基因生物信息学分析

2022-03-23刘静鲁明李春惠刘志红

河北医药 2022年6期
关键词:胞外基质差异基因骨骼肌

刘静 鲁明 李春惠 刘志红

2型糖尿病(type 2 diabetes,T2DM)以慢性高血糖为特征,目前已发展成为一种主要的健康问题,导致全世界超过3亿人早期发病和死亡[1]。骨骼肌是胰岛素发挥葡萄糖摄取的重要部位,骨骼肌对胰岛素的反应减弱,是T2DM的重要特征[2]。因此,鉴别T2DM患者和健康对照者骨骼肌组织中表达差异的基因可以为T2DM的发病机制提供必要信息[3]。近年来,越来越多的基因表达谱数据可以从公共数据库里得到[4,5]。本研究通过应用生物信息学手段,从基因表达数据库 (gene expression omnibus,GEO)中寻找到关于2型糖尿病骨骼肌的基因芯片数据集,分析与T2DM相关的差异表达基因(differentially expressed genes,DEGs)及其通路,探索疾病新的治疗靶点。

1 材料与方法

1.1 数据来源 通过检索词“type 2 diabetes”和“skeletal muscle”在 GEO 数据库(https://www.ncbi.nlm.nih.gov/geo/) 中下载数据集 GSE29221,该芯片数据由Jain等[6]于 2011年5月提交,以GPL6947 Illumina HumanHT-12 V3.0 expression beadchip为研究平台,分析12例2型糖尿病(GSM722680-GSM722691)及12例正常(GSM722668-GSM722679) 骨骼肌组织的基因表达矩阵。

1.2 差异基因筛选与可视化 利用 GEO2R在线分析工具对 GSE29221数据集样本进行分组并筛选出DEGs ,以校正P值<0.01以及logFC绝对值>1为筛选条件。使用ggplot2进行差异基因的可视化[7]。

1.3 功能富集分析 将DEGs提交至 DAVID 数据库(https://david.ncifcrf.gov/,version 6.8),进行基因本体论(Gene Ontology,GO) 分析和京都基因与基因组数据库(Kyoto Encyclopedia of Genes and Genomes,KEGG ) 分析,同时以P<0.05为筛选条件。

1.4 蛋白互相作用网络分析 将DEGs列表提交到 STRING在线数据库(https://string-db.org/),设置最小交互评分为0.4构建蛋白质互相作用(proteinprotein interaction,PPI) 网络图。使用 Cytoscape 3.8.0软件里的插件 cytoHubba筛选PPI网络里得分最高的前 10个基因作为关键基因,选用MCC算法。

2 结果

2.1 2组差异基因 根据筛选条件,2型糖尿病组和健康组之间共得到 116个DEGs,其中上调DEGs 19个,下调DEGs 97个。根据 logFC 数值大小列出排名最靠前的 10 个上调及下调 的DEGs。见表1、2。

表1 上调的前10个 DEGs

2.2 差异基因的GO及KEGG分析 (1)生物过程(biological processes,BP):DEGs 主要富集于细胞外基质的组织、细胞外结构组织、细胞基质黏附、一氧化氮

表2 下调的前10个 DEGs

介导的信号转导、细胞-底物黏附的调节、黏多糖代谢过程等;(2)细胞组成(cellular components,CC):DEGs 主要富集于细胞外基质、细胞外基质成分、内质网等;(3)分子功能(molecular functions,MF):DEGs 主要富集于细胞外基质结构成分、纤连蛋白结合、整合素结合等)。KEGG 通路富集分析中,DEGs 富集于PI3K-Akt信号通路、糖尿病并发症中的AGE-RAGE信号通路、AMPK信号通路等。见表3、4。

表3 GO分析

表4 KEGG 分析

2.3 PPI 网络和关键基因 将116个DEGs提交到 STRING数据库,除去与其他基因无联系孤立节点,分析后得到113个蛋白和 124条边,下载PPI 网络图。使用Cytoscape 软件选取cytoHubb的MCC 算法得到10 个关键基因:COL1A1、THBS2、TIMP2、 CD44、 BGN、 FBLN1、FMOD、SPARC、THBS1、VEGFA。见图1、2。

图1 PPI 网络图

图2 关键基因;节点颜色越深代表 MCC 分值越高

3 讨论

T2DM是一种体内血糖代谢失衡,特征是肌肉和脂肪对葡萄糖摄取能力下降,以及降低血糖的胰岛素分泌发生改变,同时肝糖异生增加,导致血糖水平升高,目前全球约有4.1亿T2DM患者,预计20年后将超过6.4亿[8,9]。T2DM的发生是多因素相互作用的结果,内在基因水平的改变发挥重要作用。生物信息学分析的应用为研究糖尿病中差异基因表达提供了更多技术手段。

在本研究中,我们从 GEO 数据库选取 GPL6947平台的 GSE29221 基因数据集,分为以2型糖尿病患者骨骼肌组织样本的实验组和健康人群骨骼肌组织样本的对照组,利用 GEO2R 在线分析筛选与2型糖尿病相关上调、下调DEGs。结果发现,2型糖尿病患者拥有 19个上调DEGs和97个下调DEGs。

GO分析发现,2型糖尿病的 DEGs 与一氧化氮介导的信号转导、细胞-底物粘附的调节、黏多糖代谢过程等有关。研究发现,生物利用度的改变可导致内皮功能障碍,增加糖尿病及其慢性并发症的易感性[10]。在T2DM中,高血糖诱导晚期糖基化终末产物(AGEs)产生增多,进而增强多元醇、蛋白激酶C 和氨基己糖通路,导致氧化应激加重,然后,过量的活性氧与一氧化氮自由基快速结合,形成过氧亚硝酸盐阴离子,导致组织损伤[11]。

KEGG分析中PI3K-Akt信号通路是胰岛素发挥作用的关键途径,在调控血糖代谢方面起重要作用,参与糖异生、糖酵解等血糖代谢过程,该通路上任何分子异常表达都可能导致胰岛素传导障碍,加重T2DM的发生发展[12,13]。AGE-RAGE信号通路参与T2DM多种并发症的发生,慢性高血糖会刺激AGEs合成增加,加重其与AGE受体(RAGE)的结合进一步激活刺激大量促纤维化生长因子分泌,导致胶原沉积增加引起组织纤维化,以及RAGE表达增加[14]。同时该信号通路的激活可促进ECM蛋白表达升高。此外,激活p38、核因子-kappab (NF-κB)、c-Junn末端激酶(JNK)等来刺激生长因子的表达和ECM蛋白的累积[15]。AGE-RAGE参与T2DM相关的动脉损伤、肾病和视网膜病变的发生[16]。

本研究应用PPI网络发现了COL1A1、 THBS2、 TIMP2、 CD44、 BGN、 FBLN1、FMOD、SPARC、THBS1、VEGFA这10个关键基因。Ⅰ型胶原α1链(COL1A1)是细胞外基质受体相互作用途径中最重要的基因,参与ECM受体相互作用,它负责编码Ⅰ型胶原蛋白[17]。近来Lin等[18]发现COL1A1表达水平在T2DM大鼠空肠组织中降低,它的异常表达可能与T2DM的发病相关,COL1A1有可能在未来成为T2DM潜在的新的生物标志物和诊治靶点。基质金属蛋白酶(MMP-2)是一类不断扩大的内肽酶家族,具有对细胞外基质组分的蛋白水解的活性[19]。基质金属蛋白酶组织抑制因子2(TIMP2)通过结合相应的 MMP-2而影响组织基质的活性。MMP-2/TIMP-2 比值的紊乱参与糖尿病患者组织纤维化的过程[20]。Ⅰ型跨膜糖蛋白CD44(CD44)分子广泛分布于白细胞、软骨细胞、上皮细胞等,具有诱导多种炎性细胞因子活性,参与调节炎性反应[21]。CD44可能参与啮齿动物及人类的脂肪组织炎症和胰岛素抵抗的发展[22]。纤调蛋白(fibromodulin,FMOD)是一种富含亮氨酸的小蛋白多糖,是一种有效的 TGF-β 调节剂,FMOD 治疗显著减轻糖尿病大鼠尿中蛋白[23]。

富含半胱氨酸的酸性分泌蛋白(SPARC)是一种广泛表达的纤维化蛋白,源自脂肪组织的SPARC与胰岛素抵抗相关,并且胰岛素和瘦素可促进脂肪组织分泌SPARC[24]。SPARC在糖尿病大鼠的肝脏中肝脏显着上调而在胰腺中下调。糖尿病肝脏和胰腺中SPARC的相反表达可能与炎症和免疫细胞浸润,凋亡和纤维化程度,细胞保护机制以及细胞胰岛素水平有关[25]。同时有研究表明SPARC介入了增生性糖尿病视网膜病变的发生[26]。血管内皮生长因子A (VEGFA)可表达于肿瘤和正常组织,其表达增加促进糖尿病视网膜病变发生[27]。

猜你喜欢

胞外基质差异基因骨骼肌
黄芪对细胞毒素相关蛋白A 诱导的大鼠系膜细胞外基质分泌的影响
鸢尾素(Irisin):运动诱导骨骼肌自噬的新靶点
基于“土爰稼穑”探讨健脾方药修复干细胞“土壤”细胞外基质紊乱防治胃癌变的科学内涵
巨噬细胞在骨骼肌损伤再生中的研究进展
脱细胞外基质制备与应用的研究现状
基于RNA 测序研究人参二醇对大鼠心血管内皮细胞基因表达的影响 (正文见第26 页)
运动与骨骼肌的重构研究
剔除巨噬细胞可通过抑制肌再生因子和Akt/mTOR信号通路损害骨骼肌再生
运动对衰老的骨骼肌中MMPs及TIMPs的影响
紫檀芪处理对酿酒酵母基因组表达变化的影响