APP下载

全外显子组测序和目标序列靶向捕获测序在遗传性视网膜变性基因诊断中的差异

2020-10-09柳小珍李莹莹杨丽萍

北京大学学报(医学版) 2020年5期
关键词:证者家系覆盖度

柳小珍,李莹莹,杨丽萍

(北京大学第三医院眼科, 北京 100191)

遗传性视网膜变性(inherited retinal dystrophies,IRDs)是一组以进行性感光细胞和/或视网膜色素上皮细胞(retinal pigment epithelium,RPE)功能丧失为共同表现的单基因遗传性致盲眼病。世界范围内IRDs的发病率为1/3 000~1/2 000[1],根据是否伴有全身症状分为单纯性和系统性IRDs,前者主要包括视网膜色素变性(retinitis pigmentosa,RP)、锥杆细胞营养不良(cone-rod dystrophies,CORD)、Leber先天性黑朦(Leber congenital amaurosis,LCA)等,后者主要包括Usher综合征(Usher syndrome,USH)及Bardet-Biedl综合征等。IRDs种类繁多,包含至少20种疾病[1],截至目前,已报道的IRDs致病基因已超过300个(http://sph.uth.tmc.edu/Retnet/,2019), 提示IRDs具有高度的临床和遗传异质性,使得该类疾病的诊断困难重重。研究IRDs的致病基因,开发并应用相关的分子诊断技术是诊断、预防和治疗IRDs的前提条件。近年来,随着新一代测序技术(即高通量测序技术)的快速发展,IRDs的基因诊断逐渐成为临床诊断不可或缺的重要环节。

基于高通量测序技术所开发的各种基因诊断芯片和全外显子组测序(whole exome sequencing,WES)是IRDs分子诊断最常用的技术手段,高通量测序技术能够同时对海量基因片段进行平行测序,高效快速且诊断结果精确,目前已报道的各种文献显示其诊断率可达50%以上[2-4]。靶向捕获芯片以其准确性高、灵敏性高、运营成本低等方面的优势被越来越多地应用到IRDs的分子诊断中[3, 5]。近年来WES的成本也逐渐降低,且WES还具有发现单基因遗传病新致病基因的优势,被广泛应用于IRDs的基因诊断中[4, 6]。因而,选用哪种方式为IRDs患者做基因诊断已经成为摆在临床医生面前的一道难题。

本研究采用WES和本课题组设计并定制的“遗传性眼病基因诊断芯片”(hereditary eye disease enrichment panel,HEDEP)检测IRDs家系的致病基因,以明确遗传学诊断,并在本研究范围内对比WES和HEDEP两种检测方法的差异。

1 资料与方法

1.1 研究对象

收集2016—2017年在北京大学第三医院眼科门诊就诊的IRDs患者182例,按照就诊的时间顺序选取前91例家系的先证者进行WES检测,选取后91例先证者进行HEDEP检测,分组时只考虑时间因素。记录患者家族史、婚育史及全身疾病史,绘制家系图。本项目经北京大学第三医院医学伦理委员会批准(批准号2012093),征得患者及其家属同意并签署知情同意书。

1.2 全面眼科检查

患者进行眼部检查,包括最佳矫正视力、裂隙灯显微镜检查、散瞳后眼底检查、视野、眼底荧光血管造影、视网膜电图和光学相干断层扫描检查。做基因检测之前为所有患者做全面而系统的全身检查,至少两位眼科医生根据相同的诊断标准为所有患者做出临床诊断。招募100例中国汉族健康人作为对照。

1.3 基因组DNA提取

抽取患者和家属外周静脉血4 mL,EDTA-K2管抗凝,采用全血基因组DNA抽提试剂盒(D3392-02,美国OMEGA公司)抽提基因组DNA。

1.4 WES

有91位先证者使用Agilent’s SureSelect Human All Exon V5试剂盒(Agilent,Santa Clara,CA,USA)进行WES捕获测序,该试剂盒可以捕获20 965个基因的334 378个外显子。捕获后的DNA经扩增后使用Illumina Solexa HiSeq 2000测序平台进行测序。

1.5 HEDEP

本研究所使用的HEDEP为本课题组设计并定制,由美国安捷伦公司生产(Agilent,Santa Clara,CA,USA)。该芯片能够同时捕获441个遗传性眼病致病基因,其中包含291个与IRDS相关的致病基因。共有91例IRDs先证者经HEDEP捕获后,在Illumina Solexa HiSeq 2000测序平台进行高通量测序。

1.6 基因变异分析

182位先证者经WES或HEDEP高通量测序之后,按如下步骤对高通量测序结果进行分析[7],在UCSC数据库(University of California,Santa Cruz)上获取参考基因组序列,使用BWA工具将短序列排列组装成完整的参考基因组,并将其转换成BAM格式,然后使用GATK对序列进行重新排列,减少插入或缺失错误。随后,使用Samtools和Picard调整短序列顺序,去掉测序冗杂信息得到最终的BAM文件,使用Samtools mpileup和bcftools,查找单核苷酸多态性(single nucleotide polymophism,SNPs)及插入或缺失突变(indels),使用CoNIFER分析拷贝数变异(copy number variations,CNVs),使用ANNOVAR对SNPs和indels进行功能注释。应用千人基因组数据库、ESP 6500、ExAC及SNP数据库对SNPs和indels进行分析,排除多态性位点,确认高度可疑的致病变异。最后,使用PolyPhen-2、SIFT、Mutation Taster等在线软件对变异进行致病性预测分析。

1.7 基因变异分类及验证

本研究检测到的所有基因变异都根据美国医学遗传学与基因组学学会和分子病理学协会(American College of Medical Genetics and Genomics and the Association for Molecular Pathology,ACMG/AMP)制定的《ACMG/AMP变异分类标准与指南》进行分类,根据该指南可将基因变异分为五类,即“致病的”、“可能致病的”、“意义不明确的”、“可能良性的”和“良性的”基因变异。本研究中不包含“意义不明确的”、“可能良性的”和“良性的”基因变异。使用多重连接依赖的探针扩增技术(multiplex ligation-dependent probe amplification,MLPA)对HEDEP检测到的CNVs进行验证。所有可疑致病位点用 Sanger 测序进一步验证,用Sequencher软件对比分析找出突变位点,在家族成员中进行表型-基因型共分离分析,最终确定该家系致病突变。

1.8 RPGR ORF15区突变的检测

RPGR基因是X连锁遗传RP最常见的致病基因,该基因上的突变大多位于ORF15区[8]。由于该区域结构复杂,高通量测序技术较难覆盖,因而对该区域使用Sanger测序的方法进行验证。PCR扩增RPGRORF15区,正向引物为:5′-CAGAGATCCTATCAGATGACC-3′, 反向引物为:5′-TGTCTGACTGGCCATAATCG-3′,扩增产物长度为1 630 bp,选择4条反向引物进行测序。Sanger 测序后用 Sequencher 软件对比分析找出突变位点,在家族成员中进行表型-基因型共分离分析。

2 结果

2.1 临床诊断结果

本研究包含182例IRDs家系,先证者中男性99例,女性83例;平均年龄34.93岁,最小2岁,最大83岁。根据最初的临床诊断可知,本研究共包含9种不同的遗传性视网膜变性疾病(图1A), 最常见的疾病为RP(115例,63.18%),其他依次为CORD、LCA、USH、Stargard病、Bardet-Biedl综合征、Bietti结晶样视网膜变性(Bietti crystalline corneoretinal dystrophy,BCD)、黄斑变性和无脉络膜症。有家族史者28例,其中根据其临床资料判定为常染色体显性遗传者9例(4.95%)、常染色体隐性遗传者13例(7.14%)、X连锁遗传者6例(3.30%)、散发患者154例(84.61%,图1B)。

2.2 遗传学诊断结果

本研究使用HEDEP检测的确诊51例,阳性率为56.04%;使用WES检测的确诊30例,阳性率为33.00%;总阳性率为44.51%。在81例诊断阳性家系中,有3例先证者携带常染色体显性遗传基因的致病突变,9例先证者携带X连锁遗传基因的致病突变,其余69例先证者携带常染色体隐性遗传基因的致病突变(图2)。此次共检测到29个IRDs基因的致病突变(图2),其中呈常染色体显性遗传的致病基因3个(分别为RHO、PRPF31和SNRNP200),呈常染色体隐性遗传的致病基因24个,以USH2A最为常见,呈X连锁遗传的致病基因2个(分别为RPGR、RP2),以RPGR最为常见。

2.2.1散发病例 本研究有154例散发病例,包括65例基因诊断阳性的病例,其中38例由HEDEP诊断(38/75,50.67%),27例由WES诊断(27/79,34.18%),总阳性率为42.21%。IRDs散发病例中通常只有先证者一人发病,仅根据临床病史很难确定该家系的遗传方式,这增加了临床遗传咨询的难度,基因诊断不仅可以确定该家系的致病基因,还可以根据致病基因确定遗传方式。65例散发病例中,有3例患者携带X连锁遗传致病基因上的突变,包括RPGR(2例)和RP2(1例);有1例患者携带常染色体显性遗传致病基因上的突变,致病基因为SNRNP200(新发突变所致);其余61例患者携带常染色体隐性遗传致病基因上的突变,涉及的致病基因包括USH2A(19例)和ABCA4(12例)等24个。

2.2.2常染色体显性遗传家系 本研究中通过临床资料初步判定9例IRDs家系的遗传方式为常染色体显性遗传(图1B),其中基因诊断阳性的家系3例,临床诊断均为RP,因一家系的致病基因为USH2A,将其遗传方式更正为常染色体隐性遗传,另外两家系的致病基因分别为PRPF31和RHO。

2.2.3常染色体隐性遗传家系 本研究通过临床资料初步判定13例IRDs家系的遗传方式为常染色体隐性遗传(图1B),其中基因诊断阳性的家系7例:2例确诊为BCD,致病基因为CYP4V2;5例确诊为RP,致病基因分别为USH2A(1例)、EYS(2例)、RPE65(1例)和CNGA1(1例)。

2.2.4X连锁遗传家系 本研究通过临床资料初步判定6例IRDs家系的遗传方式为X连锁遗传,基因诊断确诊2例CORD家系的致病基因为RPGR, 4例RP家系的致病基因分别为RPGR(3例)和RP2(1例)。

2.3 HEDEP和WES的对比研究

2.3.1HEDEP检测 在HEDEP诊断阳性的51例IRDs家系中,携带复合杂合突变的家系有32例,携带纯合突变和半合子突变的各8例,携带杂合突变的3例。此次共检测到20个IRDs致病基因上的83个致病的及可能致病的突变,最常见的3个致病基因为ABCA4(11例)、USH2A(8例)和RPGR(7例)。由HEDEP初次发现的致病突变共29个(34.94%)。值得一提的是,HEDEP检测到ABCA4基因的一个CNV,提示HEDEP具有更优越地检测CNVs的潜力。患者1,女性,11岁,临床诊断为Stargard病,HEDEP发现患者携带ABCA4基因杂合突变c.2909C>T(p.T970I),同时患者在外显子38~44(E 38~44)靶向捕获测序覆盖度较其他样本明显增加,怀疑存在E 38~44大片段插入突变。Sanger测序验证发现患者携带父源ABCA4基因c.2909C>T杂合突变;MLPA验证显示患者携带母源ABCA4基因E 38~44 dup突变(图3);HEDEP制备的目标基因捕获探针可准确捕获并富集基因,覆盖441个遗传性眼病基因的全部外显子区(包含291个IRDs致病基因),获得的测序数据更具有针对性。目标区域平均测序深度(91例先证者)为414.60;99.44%目标区域≥10×覆盖度,99.04%目标区域≥20×覆盖度,97.90%目标区域≥50×覆盖度(图4)。

2.3.2WES检测 WES诊断阳性的家系30例,共检测出16个IRDs基因上的50个致病的及可能致病的突变,最常见的致病基因为USH2A(13例),USH2A的一个剪接位点的突变c.8559-2 A>G出现的频率最高(7次),该突变为已经报道的致病突变,也是该基因上中国人群的突变热点。WES共发现了24个新的致病突变(48.00%),在这24个突变中,10个为无义突变(由点突变或插入缺失突变等导致)。本研究使用的WES试剂盒可覆盖几乎所有基因的外显子编码区,目标区域平均测序深度(91例先证者)为79.00,99.22%目标区域≥10×覆盖度,97.23%目标区域≥20×覆盖度,73.16%目标区域≥50×覆盖度(图4)。

综上,分别检测两组相同数量的IRDs患者,HEDEP阳性率明显高于WES。在平均测序深度以及测序覆盖度方面,HEDEP优于WES,尤其在50×和100×以上覆盖度方面HEDEP较WES的优势更加明显(图4),且HEDEP具有检测CNVs的潜力。

2.4 表型-基因型对应关系分析

患者2,男性,38岁,自幼夜盲,近20年来中心视力逐渐下降,临床诊断为RP,基因诊断结果显示患者携带CEP290基因复合杂合突变c.7332_7333 insAGAAG(p.V2445Rfs*3)和c.367 C>T(p.Q123*)。c.367 C>T(p.Q123*)已被报道为LCA的致病突变[9],c.7332_7333 insAGAAG(p.V2445Rfs*3)为本研究新发现的变异位点。CEP290基因是多种常染色体隐性遗传IRDs的致病基因,如LCA、Senior-Loken综合征、Joubert综合征等。有文献报道CEP290上的致病突变可导致RP[3],该患者就诊时表现出典型的RP症状,如夜盲、进行性视力丧失及典型的RP眼底改变(图5),因而确定其诊断为由CEP290基因突变引起的常染色体隐性遗传RP。

患者3,男性,45岁,自幼夜盲,近15年中心视力逐渐下降直至失明。眼底彩照表现为典型的晚期RP改变,基因诊断结果显示患者携带CYP4V2基因复合杂合致病突变c.214+1G>T和c.1091-2 A>G,均为人类基因变异数据库(human gene mutation database,HGMD)收录的致病突变,HGMD数据库显示c.214+1G>T可导致RP,该位点的另一个突变c.214+1G>A可导致BCD[10],而c.1091-2 A>G可导致BCD[11],因此,将该患者诊断为晚期BCD患者(图6)。

3 讨论

本研究收集182例IRDs家系,各家系按时间顺序分别接受WES和HEDEP检测,共检测到29个IRDs基因上的致病突变,其中最常见的3个致病基因为USH2A、ABCA4及RPGR,在众多的致病突变中,有43个突变尚未见其他研究报道,此外,还发现6个家系携带RPGRORF15突变。通过对比HEDEP和WES在两组患者基因诊断中的数据,提示HEDEP是IRDs患者进行初次基因诊断的首选。

近年来,随着高通量测序技术的快速发展和应用,分子诊断逐渐成为IRDs诊断和分类的金标准。本研究结果显示,HEDEP基因诊断阳性率高于WES(56.04%vs. 33.00%),提示HEDEP应当作为IRDs临床基因诊断的首选方案,HEDEP筛选时认为可能由新的致病基因变异导致的IRDs病例,可选用WES进行后续研究。

与WES相比,HEDEP有以下几点优势:第一,HEDEP的测序深度和覆盖度明显高于WES,这意味着HEDEP的诊断结果更精确可靠;Consugar等[12]采用基因靶向捕获芯片(GEDi,可捕获257个遗传性眼病基因)对192例IRDs先证者进行基因诊断,为了分析GEDi和WES在IRDs诊断应用中的优劣,在这192例先证者中随机选出4例(1例作为参照)进行WES检测,采用相同的度量标准分析GEDi和WES的测序数据,结果显示,GEDi对于单核苷酸突变的检测敏感性和特异性分别为97.6%和100%,而WES对于单核苷酸突变的检测敏感性仅为88.3%,明显低于前者(WES的测序覆盖度明显低于前者所致),该课题组经过计算精确地证明了基因靶向捕获芯片的测序结果较WES更精确。第二,HEDEP靶向捕获特定数量的区域,测序深度高,样本之间差异小,该方法可较敏感地捕捉到CNVs导致的测序覆盖度的改变,提示CNVs的存在,这也是HEDEP的较大优势。而WES则不同,应用WES数据难以准确检测CNVs,通过查阅HGMD的最新数据及相关文献可知,CNVs是IRDs的重要致病因素[13]。实际应用中如果选用WES进行检测,当患者携带某些常染色体隐性遗传基因的杂合突变时,可考虑结合使用MLPA检测该基因上的CNVs[14-15],以提高基因诊断阳性率。第三,某些致病基因上的变异发生于深内含子区域,应用WES难以覆盖,但可以加入到HEDEP捕获区域,以增加HEDEP的阳性率。第四,WES会产生数以万计的海量数据[16],很难在如此之多的数据中分析出患者的致病突变位点,虽然目前计算技术高度发达,但仍有许多应用限制,相反,HEDEP有针对性地检测441个遗传性眼病基因,分析起来更加容易,结果也会更可靠。第五,HEDEP价格仅为WES的一半,且后续数据存储成本不高,适用于临床大样本检测。

WES也有HEDEP所不具备的优点,HEDEP和WES均能发现已知致病基因上的突变,但WES能够发现新的致病基因,ACMG推荐其他基因诊断方法结果阴性的家系使用WES,可作为其他基因诊断方法的补充手段[17]。与连锁分析不同,HEDEP和WES等高通量测序技术对患者的家族史和家系中患病成员数量并无要求,可为散发病例提供准确的致病基因诊断,进而提供遗传咨询等方面的帮助。为了就IRDs的临床分子诊断工作给眼科医师提供一些可行性建议,我们将各检测手段选择顺序绘成流程图(图7)。

本研究发现USH2A和ABCA4两个基因的突变频率分别为11.54%(21/182)和6.59%(12/182),RPGR基因的突变频率为3.85%(7/182),是中国IRDs患者中最常见的致病基因。目前,IRDs没有有效的治疗方法,产前预防是最好的干预手段,特别是对于散发家系,没有明确的基因诊断,下一代再发风险评估和遗传学咨询也无从谈起。本研究发现了43个新的致病突变,涉及家系共41例,为这些家系的遗传咨询及产前预防提供了可能,新致病突变的发现还丰富了突变频谱,为统计中国汉族人群突变热点提供了便利,是基因治疗方案研发的基础。此外,基因诊断亦发现新的表型-基因型对应关系,以往报道CEP290基因是LCA及IRDs的致病基因,本研究中该基因变异也可导致RP,进一步丰富了该基因的表型。

BCD在中国人群中较为多见,眼底彩照呈现出3个阶段的改变,第一阶段主要表现为RPE萎缩,大量闪亮的黄白色结晶颗粒集中于后极部或遍布整个视网膜,也是多数BCD患者典型的眼底改变;第二阶段RPE萎缩蔓延至整个后极部并伴后极部脉络膜萎缩;第三阶段RPE及脉络膜萎缩蔓延整个眼底[18],黄白色结晶样物质沉积反而不典型,患者3的眼底改变即处于第三阶段,临床诊断易与RP混淆,基因诊断为确诊的有效途径。BCD是一种进展性疾病,但也受环境因素影响[19],许多患者伴有脂质代谢异常,提示高脂饮食可能加剧疾病进展,基因检测可明确BCD的诊断,此时指导患者饮食将有益于预后。

本研究中尚有101例患者未能确诊致病基因,分析原因主要有:(1)HEDEP及WES均无法100%覆盖所有目标区域;(2)无法检测到基因深部内含子区及基因调控区的突变;(3)WES无法检测CNVs;(4)某些家系可能由新的致病基因上的突变所致。未来工作中需要结合使用其他测序方法(如全基因组测序)以提高阳性率[5, 20]。

综上所述,本研究证实HEDEP是一种快速高效的基因诊断手段,应当作为IRDs基因检测的首选方法,WES可作为补充方法;本研究发现了43个新的突变位点,丰富了IRDs基因的突变频谱,为将来IRDs基因诊断、遗传咨询和基因治疗奠定了基础。

(志谢: 感谢所有参与患者及其家属的积极配合。)

猜你喜欢

证者家系覆盖度
呼和浩特市和林格尔县植被覆盖度变化遥感监测
Ⅰ型肢根型点状软骨发育不良家系的遗传学分析
发育性癫痫性脑病75型家系的遗传学分析
新生儿异常Hb Q的家系分析*
ANKRD26基因突变所致THC2患儿的基因表型与临床特征分析
家族聚集性原发性胆汁性肝硬化患者临床特征分析
基于NDVI的晋州市植被覆盖信息提取
红花香椿不同家系测定及优良家系选择
塞罕坝机械林场植被覆盖度及景观格局变化分析
气候变化与人类活动对植被覆盖的影响