APP下载

阿尔茨海默病的基因组学研究进展①

2015-11-22王美琴杨铠冰冀燃庞清华张大保张敏

中国康复理论与实践 2015年12期
关键词:阿尔茨海默基因组位点

王美琴,杨铠冰,冀燃,庞清华,张大保,2,张敏,2

阿尔茨海默病的基因组学研究进展①

王美琴1,杨铠冰1,冀燃1,庞清华1,张大保1,2,张敏1,2

本文主要介绍遗传因素参与阿尔茨海默病(AD)发病机制的研究进展,阐述近年来国内外研究较多的与AD发病机制相关的易感基因,通过对易感位点的进一步研究,尤其是通过旁路分析可以更好地认识迟发性阿尔茨海默病(LOAD)的发生、进展,从而发现重要的枢纽基因,为临床预防、诊断和治疗提供靶点。由于遗传变异信息的分散性,需要借助详细的文献、网上搜索和一些生物信息学分析方法,归纳LOAD的致病基因和信号转导通路。本文以3个常用数据库为来源,采用多手段、多途径的分析和挖掘数据方法,充分利用已有AD数据资源,为AD基因学的进一步研究和临床治疗方面的应用提供理论依据。

阿尔茨海默病;单核苷酸多肽性;通路;数据库;综述

[本文著录格式]王美琴,杨铠冰,冀燃,等.阿尔茨海默病的基因组学研究进展[J].中国康复理论与实践,2015,21(12): 1365-1369.

CITED AS:Wang MQ,Yang KB,JiR,etal.Research progress of genetics of Alzheimer's disease(review)[J].Zhongguo Kangfu Lilun Yu Shijian,2015,21(12):1365-1369.

阿尔茨海默病(A lzheimer's disease,AD)是以进行性认知功能障碍和记忆损害为特征的原发性中枢神经系统退行性疾病[1]。临床上以迟发性阿尔茨海默病(late onset-AD,LOAD)为主[2]。目前关于AD的发病机制尚不清楚,其可能的发病机制包括自由基学说、淀粉样蛋白斑块假说、神经原纤维缠结假说、炎性机制、胆碱能机制等,但都不能很好地解释该病的全部病变。越来越多的证据表明基因变异参与AD的发病过程,AD相关基因的陆续发现为其基因治疗带来希望。由于AD相关基因在发病机理及诊治上的重要性,阐明已知基因的作用与发现新的相关基因将是国际学术界的长期目标[3]。对于LOAD遗传相关性的研究方式有两种:候选基因模式[4]和高通量全基因组相关性研究[5]。近期高通量全基因组相关性研究已取代传统的候选基因模式[6],该方法可同时检测百万以上的单核苷酸多肽性(single nucleotide polymorphism,SNP),使研究者可以全面、无偏倚地进行全基因组相关性分析。从实验操作来看,通过SNP发现疾病相关基因突变要比通过家系来得容易;有些SNP并不直接导致疾病基因的表达,但由于它与某些疾病基因相邻,而成为重要的标记[7];SNP在基础研究中也发挥巨大的作用。因此,本文以3个常用数据库为来源,采用多手段、多途径的分析和挖掘数据方法,探寻LOAD与相关基因的关联性,以期为AD基因学的进一步研究及临床和治疗方面的应用提供依据。

1 SNP数据库

美国国立生物技术信息中心(NationalCenter for Biotechnology Information,NCBI)与人类基因组研究所(National Human Genome Research Institute,NHGRI)合作建立的SNP数据库[8](Single-Nucleotide Polymorphism database,dbSNP,http://www. ncbi.nlm.nih.gov/projects/SNP/)是一个包含来自任何生物体的核苷酸序列数据库。它是一个提交的核苷酸变异的开放数据库,并且是NCBI搜索和检索系统Entrez的一部分[9]。有两种基本检索方案:基于文本的和基于序列的搜索。结果展示格式为GeneView,可获得特定基因所有提交的SNPs的信息。

由于现有遗传变异信息也不是来自单一的数据库,它需要的信息需要从多个数据库中收集,甚至所有数据库中仍无法获得,这样就需借助详细的文献、网上搜索或一些生物信息学分析方法。本研究通过dbSNP数据库以及文献信息数据挖掘技术,获取到354个与AD相关的SNPs,见表1。所得数据与传统的技术相比,由于其经过实验的多次论证,更具说服力。

2 AD相关基因数据库

高通量全基因组相关性研究应用于AD易感基因的发现,这些AD相关基因统一整理在一个公共信息数据库即AlzGene数据库[10](http://www.alzgene.org)。A lzGene数据库收集、概括和Meta分析了所有关于AD遗传学的相关研究,包括全基因组相关性研究,可以检索到以英文发表于同类综述类杂志可引用的文献和研究[11];并从原文中提取关键词,如家系、AD诊断类型、样本量、发病年龄和基因型分类等;进行易感基因的随机效应模型Meta分析[12]。这种方法综合了来自不同人群或实验室对同一位点多态性的研究,从而提供了一项概括不同研究之间AD患病风险的评价[13]。

根据A lzGene数据库的最近更新显示,目前研究与AD相关的基因有695个,基因多态性位点有2973个,研究组织有1395个,为AD的研究提供新的方向和研究热点目标。表2列出了A lzGene数据库中基因变异位点。

表1 dbSNP数据库SNPs信息

表2 AlzGene数据库中给出的AD基因变异位点

2.1APOE基因

APOE编码的蛋白与Aβ的沉积和清除有关[14],还参与突触发生、Tau蛋白磷酸化、神经元死亡和脂质代谢。APOE编码蛋白有3种同型异构体(ε2,ε3,ε4)。其中ε3在人群中最常见。研究发现,APOEε3/ε4携带者发生AD的相对危险度是APOEε3/ε3携带者的2~4倍,而APOEε4/ε4携带者发生AD的相对危险度是6~30倍[15]。APOEε4有明显的年龄相关性,对于70岁之前发病的患者影响更明显[16]。

2.2CLU基因

CLU基因编码蛋白为聚集素,与Aβ以可逆方式特异性结合,使可溶性Aβ转化为不可溶性Aβ,通过血脑屏障后将其清除[17]。聚集素与APOE具有互补作用[18]。最新研究发现,CLU基因变异引起对神经元起保护作用的髓鞘损伤[19]。在青少年时期神经元可以自我修复损伤的髓鞘、不会出现认知能力减退;随着年龄增长,髓鞘自我修复能力减弱,认知能力逐渐减退,最终导致LOAD[20]。

2.3CR1基因

研究发现LOAD和免疫炎症反应密切相关,而CR1作为补体系统的重要成分在全基因组关联分析(genome-wide association study,GWAS)研究中已经被确认为LOAD的易感位点。其编码蛋白可以将Aβ作为外源物质通过补体系统给予清除[21]。一项研究显示,CR1与AD病理改变(淀粉样斑块沉积)、认知功能减退密切相关[22]。

2.4PICALM基因

PICALM编码的蛋白是网格蛋白介导内吞作用的重要成分。它能够募集网格蛋白和衔接蛋白AP-2到细胞膜[23],后者能识别目标蛋白。三者形成网格蛋白三角复合体,通过内吞作用进入细胞内。研究发现,PICALM可能在LOAD中参与Aβ的运输和清除,但具体机制尚不清楚[24-25]。

2.5其他易感性相关基因

B1N1也是一个显著的LOAD的易感位点,研究发现B1N1和动粒蛋白的细胞内吞相关;而另一个重要的易感基因PICALM也在细胞内吞中发挥作用。此外,CD33也是LOAD的易感位点[26],并且也得到了复制[27]。CD33在调节细胞内免疫应答中发挥作用,可以通过网格蛋白调控细胞内吞[28-29]。

根据AlzGene数据库,LOAD的易感位点中APOE的相对危险度最高,其他主要的易感位点与之相比相对危险度差距很大[30]。此推论与大量的文献报道相一致。

3 京都基因与基因组百科全书

该系统主要通过对基因功能和信号转导通路的诠释,有助于发现AD和其他神经变性疾病的发病机制,为鉴定复杂疾病的遗传因素,理解慢性复杂疾病潜在的病因学、生物学、发病机制,以及提供恰当的基因学检测和遗传学咨询提供帮助。

京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG,京都遺伝子ゲノム百科事典)是系统分析基因功能、基因组信息的数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在通路(PATHWAY)数据库里,包括图解的细胞生化过程,如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息[31]。KEGG提供的查询整合代谢途径完善,其中包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解[32],不仅提供所有可能的代谢途径,而且对催化各步反应的酶进行全面的注解,包含所有氨基酸序列、蛋白质资料银行(protein databank,PDB)库的链接等。KEGG是进行生物体内代谢分析、代谢网络研究的强有力工具[33]。目前在PATHWAY数据库中的代谢通路是已建立的最全面的网络体系,每个参考代谢途径是一个由酶或EC号(酶的识别符)组成的网络。

如图1所示,利用基因和表达信息可通过计算机构建出生物体特有的代谢通路:先根据基因的序列相似性和位置相关性确定基因组中酶的基因,然后合理地安排酶的识别符号,最后将基因组中的基因和参照通路中用酶的识别符号编号的基因产物结合起来,对可能的代谢途径进行推测和验证[34],为科研工作者提供指导作用。

图1 map05010

4个主要功能蛋白包括:淀粉样前体蛋白(APP)、presenilin 1(PS1)、presenilin 2(PS2)和载脂蛋白E(ApoE)。与APP和PS蛋白质相关的所有突变会导致β淀粉状蛋白质多肽产物的增加,尤其是增多淀粉样形式Aβ42。

4 分析与展望

遗传变异的范围极为广泛,还有很多未知领域。目前,全基因组相关性研究已逐渐成为探索AD等复杂疾病的有效工具,代表未来研究慢性复杂性疾病病因学、生理病理学机制的方向标[35]。虽然许多生物学数据库是在出现高通量数据后应运而生,但缺乏有效的数据分析方法。基因测序、基因组、SNP、基因芯片、小分子化合物和GWAS数据等数据库信息的共享,促进了生物信息学中多手段、多途径的分析和挖掘数据的飞跃发展。现有遗传变异信息并不是来自单一的数据库,需要的信息要从几个数据库中收集,甚至所有数据库中仍无法获得全部的信息,这样就更加需要借助详细的文献、网上搜索和一些生物信息学分析方法挖掘资料获得信息。

上述与发病机制和途径有关的基因均需要更多的证据来证实它们作为AD重要标志的临床实用性,揭示AD的神经病理学机制及其与发病机制间的密切关系。

总之,该领域的研究仍相对薄弱,有待于国内外学者的进一步阐述,以便为AD的早期诊断和基因治疗提出新的方向。

[1]Sassi C,Guerreiro R,Gibbs R,et al.Investigating the role of rare coding variability in Mendelian dementia genes(APP, PSEN1,PSEN2,GRN,MAPT,and PRNP)in late-onset A lzheimer'sdisease[J].Neurobiol Aging,2014,35(12): 2881-2886.

[2]Floudas CS,Um N,Kamboh M I,etal.Identifying genetic interactions associated with late-onsetAlzheimer's disease[J].Bio-DataMin,2014,7(1):35-54.

[3]Zou Z,Liu C,Che C,etal.Clinicalgeneticsof Alzheimer'sdisease[J].Biomed Res Int,2014,2014(1):862-872.

[4]D'Aoust LN,CummingsAC,Laux R,etal.Examination of candidate exonic variants for association to Alzheimer disease intheAmish[J].PLoSOne,2015,10(2):43-59.

[5]Reitz C.Genetic loci associated with Alzheimer's disease[J]. Future Neurol,2014,9(2):119-122.

[6]Kauwe JS,Bailey MH,Ridge PG,etal.Genome-wide association study of CSF levels of 59 Alzheimer's disease candidate proteins:significantassociationswith proteins involved in amyloid processing and inflammation[J].PLoS Genet,2014,10 (10):e1004758.

[7]Nguyen TT,Huang J,Wu Q,et al.Genome-wide association data classification and SNPs selection using two-stage quality-based Random Forests[J].BMCGenom ics,2015,16(2):S5.

[8]NCBIResource Coordinators.Database resources of the national center for biotechnology information[J].Nucleic Acids Res, 2015,43(1):6-17.

[9]Bhagwat M.Searching NCBI's dbSNP database[J].Curr Protoc Bioinformatics,2010,32(1):19-47.

[10]Bertram L,McQueen MB,Mullin K,et al.Systematic meta-analyses of Alzheimer disease genetic association studies: theAlzGene database[J].NatGenet,2007,39(1):17-23.

[11]Olgiati P,Politis AM,Papadim itriou GN,et al.Genetics of late-onset Alzheimer's disease:update from the alzgene database and analysisof shared pathways[J].Int JAlzheimers Dis, 2011,10(1):4061-4075.

[12]Wang XB,CuiNH,Yang J,et al.Angiotensin-converting enzyme insertion/deletion polymorphism is notamajor determ ining factor in the development of sporadic A lzheimer disease: evidence from an updatedmeta-analysis[J].PLoSOne,2014,9 (10):406-419.

[13]Potkin SG,Turner JA,GuffantiG,etal.Genome-wide strategies for discovering genetic influences on cognition and cognitive disorders:methodological considerations[J].Cogn Neuropsychiatry,2009,14(4):391-418.

[14]LiX,Song D,Leng SX.Link between type 2 diabetesand Alzheimer's disease:from epidemiology tomechanism and treatment[J].Clin Interv Aging,2015,10(1):549-560.

[15]Lyall DM,Harris SE,Bastin ME,etal.Are APOE varepsilon genotype and TOMM 40 poly-T repeat length associationswith cognitive ageing mediated by brain whitematter tract integrity[J].Transl Psychiatry,2014,4(1):449-456.

[16]Manning EN,Barnes J,Cash DM,etal.APOE epsilon4 is associated with disproportionate progressive hippocampal atrophy in AD[J].PLoSOne,2014,9(5):608-616.

[17]DiBattista AM,Stevens BW,Rebeck GW,etal.Two A lzheimer's disease risk genes increase entorhinal cortex volume in young adults[J].FrontHum Neurosci,2014,8(1):779-786.

[18]Khoury MJ,Bertram L,Boffetta P,etal.Genome-wide association studies,field synopses,and the development of the know ledge base on genetic variation and human diseases[J]. Am JEpidemiol,2009,170(3):269-279.

[19]Sekar S,M cDonald J,Cuyugan L,et al.Alzheimer's disease is associated with altered expression of genes involved in immune response and mitochondrial processes in astrocytes[J]. NeurobiolAging,2015,36(2):583-591.

[20]Braskie MN.Common Alzheimer's disease risk variantwithin the CLU gene affects white matter microstructure in young adults[J].JNeurosci,2011,31(1):6764-6770.

[21]Sleegers K.The pursuit of susceptibility genes for Alzheimer's disease:progress and prospects[J].Trends Genet,2010, 2010(2):84-93.

[22]Rosenthal SL,Kamboh M I.Late-onset A lzheimer's disease genes and the potentially implicated pathways[J].Curr Genet Med Rep,2014,2:85-101.

[23]Moreau K,Flem ing A,Imarisio S,et al.PICALM modulates autophagy activity and tau accumulation[J].Nat Commun, 2014,5:4998.

[24]Bohm C,Chen F,Sevalle J,etal.Currentand future implications of basic and translational research on amyloid-beta peptide production and removal pathways[J].Mol Cell Neurosci, 2015,2(1):1-9.

[25]Baig S,Joseph SA,Tayler H,et al.Distribution and expression of picalm in Alzheimer disease[J].J Neuropathol Exp Neurol,2010,69(10):1071-1077.

[26]Hollingworth P,Harold D,Sims R,et al.Common variants at ABCA7,MS4A6A/MS4A4E,EPHA1,CD33 and CD2AP are associated with A lzheimer's disease[J].Nat Genet,2011,5(1): 429-435.

[27]Carrasquillo MM,Belbin O,Hunter TA,et al.Replication Of EPHA 1 and CD33 associationswith late-onsetA lzheimer's disease:amulti-centre case-control study[J].Mol Neurodegener, 2011,6(1):54.

[28]Malik M,Simpson JF,Parikh I,et al.CD33 A lzheimer's risk-altering polymorphism,CD33 expression,and exon 2 splicing[J].JNeurosci,2013,33(33):13320-13325.

[29]Beecham GW,Hamilton K,NajAC,etal.Genome-wideassociation meta-analysis of neuropathologic features of Alzheimer's disease and related dementias[J].PLoS Genet,2014,10 (9):606-621.

[30]张博,金铮,别黎,等.晚发性阿尔茨海默病全基因组关联研究进展[J].中国临床医师杂志,2012,6(5):1278-1280.

[31]Kanehisa M,Goto S.KEGG:kyoto encyclopedia of genes and genomes[J].Nucleic Acids Res,2000,28(1):27-30.

[32]Anand Brown A,Ding Z,Viñuela A,etal.Pathway based factor analysis of gene expression data produces highly heritable phenotypes that associate with age[J].G3(Bethesda),2015,5 (5):839-847.

[33]Kanehisa M,Goto S,Sato Y,et al.Data,information,know ledge and principle:back to metabolism in KEGG[J].Nucleic Acids Res,2014,42(Database issue):D199-D205.

[34]Nersisyan L,Samsonyan R,Arakelyan A.CyKEGGParser: tailoring KEGG pathways to fit into systems biology analysis workflows[J].F1000Res,2014,3(1):145-157.

[35]Bertram L,TanziRE.Genome-wide association studies in Alzheimer'sdisease[J].Hum MolGenet,2009,18(2):137-145.

Research Progressof Geneticsof A lzheim er's Disease(review)

WANGMei-qin1,YANG Kai-bing1,JIRan1,PANGQing-hua1,ZHANG Da-bao1,2,ZHANGMin1,2
1.Departmentof Bioinformatics,School of Biomedical Engineering,Capital Medical University,Beijing 100069, China;2.A lzheimer's Disease Center,Beijing Institute for Brain Disorders,CapitalMedicalUniversity,Beijing 100069, China

Genetic factors play an important role in the developmentof A lzheimer's disease(AD).This articlemainly introduced some genes,which have been reported in recentyears,predisposing to differentaspects of AD.The occurrence and progress of the late onsetAlzheimer's disease(LOAD)can be better understood through further study of the susceptibility loci,especially by using the pathway analysis, and the importanthub genes can be found so as to provide targets for clinical prevention,diagnosis and treatment.Due to the dispersion of genetic variant information,itneeds detailed literature,online search and some bioinformaticsmethods to analyze the causative genes and signaling pathways related to LOAD.3 databaseswere took as recourses,and they were analyzed withmulti-meansandmulti-waysof analysisand dataminingmethods,in order to provide theoreticalbasis for furtherstudy and clinical treatmentof AD genetics.

A lzheimer's disease;single nucleotide polymorphism;pathway;database;review

10.3969/j.issn.1006-9771.2015.12.001

R749.1

A

1006-9771(2015)12-1365-05

1.科技部 “973”项目(No.2014CB744604);2.北京市教委科技计划面上项目(No.KM 201010025004;No.KM 201410025013);3.北京市脑重大疾病研究院基金项目(No.BIBDPXM 2014_014226_000016)。

1.首都医科大学生物医学工程学院生物信息学系,北京市100069;2.北京脑重大疾病研究院阿尔茨海默病研究所,北京市100069。作者简介:王美琴(1990-),女,汉族,江苏徐州市人,硕士研究生,主要研究方向:生物信息学。通讯作者:张敏(1970-),女,河北保定市人,博士,教授,博士研究生导师,长期从事生物信息大数据分析。E-mail:zhangmin@ccmu.edu.cn。

2015-02-09

2015-03-30)

猜你喜欢

阿尔茨海默基因组位点
阿尔茨海默病的预防(下)
“植物界大熊猫”完整基因组图谱首次发布
阿尔茨海默病的预防(上)
镍基单晶高温合金多组元置换的第一性原理研究
绿茶或能预防和延缓阿尔茨海默病
牛参考基因组中发现被忽视基因
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展