APP下载

基于生物信息学分析ANCA相关性血管炎肾损害关键基因

2021-02-05蔡昕添张德莲毕云伟杨顺帆李南方

医学研究杂志 2021年1期
关键词:肾脏受体编码

蔡昕添 张德莲 毕云伟 洪 静 吴 婷 杨顺帆 李南方

抗中性粒细胞胞质抗体(antineutrophil cytoplasmic antibodies, ANCA)相关性血管炎(ANCA-associated vasculitis,AAV)是一组自身免疫性疾病,其特征为全身小血管的炎症与坏死以及全身循环中自身抗体ANCA的高度表达[1]。AAV临床表现虽复杂多变,但50%~80%的患者以急性肾衰竭为首发表现[2]。此外,早期诊断监测难度大、病情进展迅速、病死率高、预后极差均为AAV所致急性肾衰竭的重要特征[1,2]。越来越多的研究发现,肾脏虽是AAV最易受累的脏器之一,但遗传易感性在其发病中扮演了极其重要的角色[3]。因此,探究AAV肾损害发生、发展相关遗传分子机制,对其早期诊断、监测和发掘新的特异性治疗靶点,从而改善患者预后具有重要意义。

本研究通过挖掘GEO数据库中AAV合并肾损害相关的基因芯片集,并通过R软件筛选差异基因,利用一系列生物信息学技术筛选、验证核心基因,最终实现在遗传基因组层面深入探究AAV合并肾损害的发生、发展机制、挖掘潜在生物学标志物和新的治疗靶点。

材料与方法

1.基因芯片数据的获取:在本研究中所探究的基因微阵列数据集检索自NCBI-GEO数据库,以如下检索式进行检索(“antibodies, antineutrophil cytoplasmic”[MeSH Terms] OR ANCA[All Fields]) AND “Homo sapiens”[porgn] AND (“gse”[Filter] AND “attribute name tissue”[Filter]),最终获得由Grayson等[4]所提交的基于GPL19983平台(Affymetrix Human Gene 2.1 ST Array [HuGene21st_Hs_ENTREZG_19.0.0])的GSE108109和GSE108113芯片数据。GSE108109与GSE108113芯片均采用肾脏活检组织作为研究样本,其中GSE108109芯片作为发现组,共纳入21例研究者,包括健康对照组6例和AAV合并肾损害患者15例。而GSE108113芯片作为验证组,共纳入62例研究者,包括健康对照组5例和AAV合并肾损害患者57例。

2.数据处理与差异基因的筛选:基于R语言环境下使用Limma包对芯片数据补全缺失值,进行背景校正和归一化处理。最后构建比对模型并筛选差异基因(differentially expressed genes,DEGs),其筛选标准需同时满足以下两点:①|logFC|≥2;②矫正后P<0.05。使用Ggplot2包绘制DEGs火山图。

3.蛋白-蛋白相互作用网络的构建与核心基因的选择:通过构建蛋白-蛋白相互作用网络(PPI)进一步挖掘核心基因。将之前筛选出来的DEGs导入STRING数据库,相互作用可信度≥0.7者则认为其PPI之间关系作用显著。利用Cytoscape软件(3.7.1版)将从STRING数据库检索获得的相互作用关系绘制成图。利用分子复合检测算法插件(MCODE)对基于已知PPI网络中的核心基因进行评估,选择得分最高的MCODE模块[5]。

4.核心基因的验证:利用GSE108113芯片中的数据对筛选出的核心基因在AAV肾损害患者肾脏组织和健康成年人肾脏组织中的表达情况进行验证。使用t检验(对于正态分布的数据)或非参数检验(对于非正态分布的数据)评估各组之间定量参数的差异。对表达存在显著差异的基因绘制ROC曲线,并分别计算曲线下面积(AUC)。使用GraphPad Prism 6.1软件与R软件中的pROC包构建图表。

结 果

1.数据处理与差异基因的筛选结果:使用R软件对GSE108109芯片原始数据进行背景校正和归一化处理。并利用比对模型初步筛选,发现GSE108109芯片共有187个表达改变显著的DEGs,含35个上调基因,152个下调基因,并使用R语言软件(3.5.3版)绘制了关于GSE108109芯片DEGs表达的火山图(图1)。

图1 差异表达基因的火山图 红色.显著上调基因;蓝色.显著下调基因;黑色.无显著意义基因

2.蛋白-蛋白相互作用网络的构建与核心基因的选择:为进一步明确与AAV肾损害致病相关最核心的关键基因,笔者选择了蛋白间相互作用可信度评分≥0.7的蛋白-蛋白节点。使用Cytoscape软件将互不相连的节点去除,绘制出最终的蛋白-蛋白相互作用网络图(图2A)。使用MCODE插件对蛋白相互作用网络进行了模块化分析,根据MCODE聚类条件筛选出得分最高的MCODE模块(图2B)。MCODE模块化分析后共获得9个关键基因,即CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G、CTSS和C3AR1。该模块中所包含的基因在整个蛋白-蛋白相互作用网络中相较于其他基因而言存在着更强的相互作用关系,因此相对于其他基因而言它们在AAV肾损害的发生、发展过程中可能发挥着更加决定性的作用。

图2 蛋白-蛋白相互作用网络图 A.所有差异基因的网络图(红色菱形模块代表表达上调蛋白; 绿色六边形模块代表表达下调蛋白);B. 通过MCODE聚类 条件获得的9个关键基因

3.核心基因的验证:利用GSE108113芯片中的数据对筛选出的核心基因在AAV肾损害患者肾脏组织和健康成年人肾脏组织中的表达情况进行验证,并将验证结果用散点图的形式展示,详见图3。在GSE108113芯片中有57例AAV合并肾损害患者样本和5例健康成年人肾脏活组织样本。与健康成年人肾脏活组织样本比较,CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G、CTSS在AAV合并肾损害患者样本中表达显著上调,这与GSE108109芯片分析的结果一致,但GSE108113芯片中C3AR1基因在AAV合并肾损害患者样本与健康成年人肾脏活组织样本间的表达并无显著差异。以存在AAV合并肾损害作为结果变量,以CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G和CTSS基因检测表达量为诊断AAV合并肾损害的检验变量。CD53基因的AUC值为0.837,C1QC基因的AUC值为0.919,TYROBP基因的AUC值为0.856,CSF1R基因的AUC值为0.783,CYBB基因的AUC值为0.784,LAPTM5基因的AUC值为0.922,FCER1G基因的AUC值为0.735,CTSS基因的AUC值为0.905,详见图4。

图3 验证核心基因表达水平 *P<0.05,**P<0.01,***P=0.000

图4 各基因诊断AAV合并肾损害的ROC曲线

讨 论

AAV是由自身免疫性抗体ANCA所诱导的全身小血管坏死性炎症,常同时累及全身多个器官系统[6]。其中肾脏是AAV患者最常累及的器官,肾脏受累患者病情多进展迅速,当出现明显的临床症状时往往已进展为不可逆的终末期肾病[7]。因此,提高AAV合并肾损害的早期筛查、诊断率,及时监测病情活动度并积极进行针对性的靶向治疗对提高AAV合并肾损害患者人肾存活率、改善长期预后具有极为重要的意义。

本研究通过分析GSE108109芯片数据集,筛选得到187个差异表达基因,其中35个基因表达显著上调,152个基因表达显著下调。通过蛋白-蛋白相互作用网络分析并筛选得到以下核心基因:CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G、CTSS和C3AR1。验证上述核心基因在AAV肾损害患者肾脏组织的表达水平发现CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G、CTSS表达显著增高。

CD53是一种蛋白质编码基因,该基因所编码的蛋白质属于四跨膜蛋白家族[8]。有研究发现该基因编码的蛋白质能与整联蛋白复合为细胞表面糖蛋白且可参与介导信号转导事件,在T细胞和自然杀伤细胞中转导CD2产生的信号[9]。C1QC基因编码血清补体亚成分C1q的C链多肽,其所编码蛋白C1qC是C1q的一个亚基,C1q主要是由体内组织中的巨噬细胞和树突状细胞分泌,在血液和组织中表达[10]。C1q的胶原蛋白样区域与钙离子所依赖的C1r与C1s酶复合物相互作用活化C1,这是血清补体系统经典途径激活的起始步骤[11]。然后进一步激活C3、C4等经典途径的下游成分,诱导免疫复合物所介导的细菌杀伤和提高吞噬作用。目前已有研究证实,C1q的异常激活与系统性红斑狼疮和膜增生性肾小球肾炎的发病密切相关[12]。

TYROBP曾用名DAP12和KARAP,该基因主要负责编码跨膜信号转导多肽(酪氨酸激酶结合蛋白)。TYROBP可与NK细胞受体如KIR2DS2、KLRD1/KLRC2异源二聚体共同介导NK细胞的活化,还能促进NK细胞受体KIR2DS1、KIR2DS2和KIR2DS4的转运和表面表达,并确保其在细胞表面的稳定性,增强并维持NK细胞的细胞毒性作用[13]。TYROBP可与SIRPB-1、TREM-1结合,介导中性粒细胞、单核细胞和树突状细胞等髓系细胞的激活和介导趋化因子受体CCR7的上调,促进中性粒细胞脱颗粒进程[14]。集落刺激因子1受体(CSF1R),又称巨噬细胞集落刺激因子受体和CD115,是由CSF1R基因编码的一种细胞表面蛋白。CSF1R是调节巨噬细胞和小胶质细胞功能的重要受体,通过CSF1R发出的细胞信号(CSF-1或IL-34)对于巨噬细胞的发育、存活、迁移和增殖至关重要[15]。

多项研究表明,CSF-1在血清和尿液中都是AAV合并肾损害疾病活动的可靠生物学标志物[16]。CYBB基因主要编码细胞色素B-245重链,已有报道指出细胞色素B-245重链是吞噬细胞氧化酶系统的主要成分。CYBB基因的异常表达可导致吞噬细胞NADPH氧化酶的活性降低,活性降低后吞噬细胞仍然能够吞噬细菌,但不能在吞噬囊泡中杀死细菌。目前已知与CYBB基因异常表达相关的疾病主要有慢性肉芽肿性疾病[17]。LAPTM5是一种在免疫细胞中获得优先表达的基因,它与泛素连接酶的Nedd4家族相互作用。最近在T细胞和B细胞中的研究确定LAPTM5是质膜上T细胞和B细胞受体水平的负调节剂。而在巨噬细胞中,其作用与在T细胞和B细胞活化中的负向调节作用刚好相反,LAPTM5充当巨噬细胞炎症信号通路的正调节剂,并促进巨噬细胞分泌细胞因子[18]。

FCER1G基因主要编码IgE受体Ig的Fc片段,该蛋白是一种衔接蛋白,其包含基于免疫受体酪氨酸的激活基序,可转导来自各种免疫受体的激活信号。与FCER1G基因相关的疾病包括出血性疾病、血小板型出血性紫癜和哮喘[19]。CTSS基因可编码组织蛋白酶S,该蛋白质是肽酶C1家族的成员,是一种溶酶体半胱氨酸蛋白酶,可参与抗原蛋白降解为肽的过程,从而呈递给MHCⅡ类分子。组织蛋白酶S主要在巨噬细胞和(或)血管平滑肌细胞中表达,通过发挥其细胞外酶和(或)自身蛋白质的功能,它可以激活几乎所有类型的血管细胞,如巨噬细胞、血管平滑肌细胞和T淋巴细胞。因此,组织蛋白酶S对于巨噬细胞的浸润、分化和周转等过程发挥着必不可少的作用[20]。

综上所述,本研究通过生物信息学的方法揭示了可能参与ANCA相关性血管炎肾损害发生、发展的关键基因。在ANCA相关性血管炎肾损害中,可能参与的关键基因有CD53、C1QC、TYROBP、CSF1R、CYBB、LAPTM5、FCER1G和CTSS,并且通过不同基因芯片数据对上述关键基因进行验证。这些结果有助于阐明ANCA相关性血管炎肾损害发生、发展的分子机制,并为ANCA相关性血管炎肾损害的诊断提供了潜在的生物学标志物。

猜你喜欢

肾脏受体编码
保护肾脏从体检开始
人人享有肾脏健康
α7-烟碱乙酰胆碱受体在肺癌发生、发展及治疗中的作用
P2X3受体在心血管疾病中的研究进展
生活中的编码
维生素D受体或是糖尿病治疗的新靶点
长链非编码RNA APTR、HEIH、FAS-ASA1、FAM83H-AS1、DICER1-AS1、PR-lncRNA在肺癌中的表达
Genome and healthcare
樱桃可强化肾脏排毒吗?
论纪录片影像中的组合编码运用