APP下载

基因拷贝数变异在遗传性耳聋研究中的进展

2021-04-25王秋权黄莎莎袁永一康东洋吴婕张昕戴朴

中华耳科学杂志 2021年2期
关键词:拷贝数遗传性耳聋

王秋权 黄莎莎 袁永一 康东洋 吴婕 张昕 戴朴

中国人民解放军总医院耳鼻咽喉头颈外科医学部,国家耳鼻咽喉疾病临床医学研究中心,聋病教育部重点实验室,聋病防治北京市重点实验室(北京 100853)

人类基因组上存在各种形式的遗传变异和多态性,随着各种基因工程技术的深入开展,单个核苷酸变异引起的多态性(Single Nucleotide Polymorphisms,SNPs)的突变机制及其与遗传性疾病的关联性更清晰明了,但其仅能阐明人类疾病复杂遗传因素的一小部分。越来越多证据表明,拷贝数变异(Copy Number Variations,CNVs)可能解释其余复杂遗传因素。作为遗传多样性的一种普遍形式,CNVs被认为是与参考基因组相比,基因组DNA中大小为几十个碱基(>50bp)到几Mb的DNA拷贝数变异现象,包括基因组重复、缺失、倒置和易位等,其中重复和缺失是最常见的[1]。

早在1959年,Lejeune及团队就发现人类基因组中存在长度大于5Mbp的基因变异[2]。2004年Iafrate小组和Sebat团队分别报道人类基因组中CNVs以多态性广泛存在,通过进一步分析发现其涉及的基因组区域包含许多参与调节细胞生长及代谢等功能的基因,且与多种出生缺陷疾病相关[3,4]。2006年,Redon团队鉴定出涵盖360Mbs大小,覆盖人类基因组全长约12%,共计1447个拷贝数变异区,并发布第一代人类基因组CNVs图谱[5]。千人基因组计划也已发现了100万个短插入或缺失和2万个CNVs位点[6],这极大程度地扩展了人类对遗传学领域的认知。基因组变异数据库(Database of Genomic Variants,DGV)整理并收录了现已发现报道的CNVs数据,目前发现CNVs约983845个,所覆盖的基因组片段占人类基因组的29%以上,远超SNPs。CNVs突变率大约是SNPs突变率的100~10000倍[7],对基因组遗传变异的多样性具有重要意义(详见表1)。相对SNPs的概念,将人群中等位基因频率>1%的CNVs定义为基因组拷贝数多态(Copy Number Polymorphisms,CNPs),超过90%的CNVs属于这一类型,而频率<1%的CNVs称为罕见CNVs[8]。

表1 CNVs与SNPs的比较Table 1 CNVs versus SNPs

在临床上常见两类CNVs:复发性CNVs和非复发性CNVs[9]。复发性CNVs断裂点常位于包含大量片段重复的固定区域,所以这类CNVs在不同个体中的情况基本一致,大量的不同临床表型被证实与复发性CNVs相关。与之不同,非复发性CNVs的断裂点处于特定序列区域,难获取准确序列数据,且微观同源性较低,在端点连接处具有短插入或钝端。部分致病性及非致病性CNVs属于此类。大多数非复发性CNVs是简单的删除或串联重复,但也有一些非常复杂,表现为数十个事件聚集在单个基因组区域中[10]。

1 CNVs的突变机制

目前提出的解释大多数CNVs形成的机制主要有四种,包括非等位基因同源重组(Nonallelic Homologous Recombination,NAHR),非同源末端连接(Non-homologous End Joining,NHEJ),复制叉停滞和模板转换机制(Fork Stalling and Template Switching,FoSTeS)及反转录转座子驱动机制,对几种主要机制特点及对比详见表2。

表2 CNVs形成主要机制的特点及比较Table 2 Characteristics and comparison of the main mechanisms of CNVs formation

1.1 非等位基因同源重组

NAHR是由彼此具有高度同源性的两个非等位基因DNA序列之间的比对和交叉引起的。据估计,大约28%的CNV可能通过NAHR形成而来[11],是串联重复和缺失的重要来源[12]。NAHR发生位点的分布存在重组热点现象,即存在有顺式作用基序(motif)“CCNCCNTNNCCNC”的富集[13]。NAHR可在减数分裂过程中产生带有CNVs的配子,并可遗传给后代[14]。

1.2 非同源末端连接机制

一些结构简单的CNVs则可能是源自NHEJ。NHEJ是修复哺乳动物细胞DNA双链断裂(DNA Double Strand Break,DSB)的关键机制,当双链断裂时,如果来自不同染色体的两个片段连接在一起,就会导致基因缺失和重复。有研究表明,56%的CNVs由NHEJ引起的。其产生的CNVs断点更集中于重复序列内部或周围,某些可以引起DSB或DNA弯曲的DNA基序(如TTTAAA)附近也比较容易出现CNVs。由于NHEJ发生时不需要高度同源性的DNA序列反应底物,并可能会有部分碱基插入连接处,这些使其与其他CNVs产生机制有所差异[15]。

1.3 复制叉停滞和模板转换机制

2007年Lee通过对基因组重排的观察,发现当DNA的复制叉停滞时,滞后链将会从模板上脱落,通过微同源序列转到另一个空间位置上接近的复制叉重新开始合成DNA,从而导致拷贝数删除或重复,而转换和重新合成可能会连续发生多次,导致更复杂的重排,据此提出了FoSTeS模型。而新复制叉在起始复制叉的上下游决定CNVs的类型[16]。

1.4 反转录转座子驱动机制

在人体中,逆转座子可在三个方面上介导CNVs形成。首先,人类基因组中的某些逆转录转座子仍然活跃,具有多态性,这些可被认为是CNVs本身[17]。其次,逆转录转座机制有时会导致加工过的mRNA整合回到基因组中,可能导致基因剂量的增加[18]。最后,逆转座子可能改变染色体结构可塑性而促进大片段CNVs的形成[19]。

2 CNVs与遗传性耳聋的相关研究

听力损失是临床上最常见的致残性疾病之一,全球约有4.66亿人口因聋致残,约占全球人口的5%,每1000个新生儿中就有2-3名耳聋或听力障碍患者,其中大约50%-60%是由遗传因素引起的[20,21],作为基因组变异的一种重要表现形式,CNVs也在遗传性耳聋的多基因遗传研究中越来越多的被发现。

早在1998年,Laer等人在DNFA5基因座上发现了一个插入/缺失突变,这是首次报道CNVs导致非综合征耳聋的文章[22]。2001年,Verpy等人通过候选耳聋基因方法发现STRC基因存在大片段的删除[23]。2012年,Francey等人鉴定出17个STRC基因缺失,发现大片段CNVs是STRC基因的主要突变类型[24]。据评估,在日本散发的明确遗传因素的中重度感音神经性聋患儿中,约1/3与STRC基因CNVs有关[25]。越来越多的研究证实CNVs是遗传性耳聋的常见原因之一,2014年Richard研究组发表的第一篇CNVs在遗传性耳聋的大宗病例报道,发现在明确分子病因的患者中CNVs参与致病者占18.7%,涉及16个基因的143种CNVs[26]。同年,复旦大学李华伟团队应用二代测序技术对79名散发耳聋患者进行检测,在27个耳聋基因中发现了CNVs[27]。

OTOA基因被认为是第二常见的受CNVs影响的耳聋基因,已有近30个在不同种族人群导致听力损失的OTOA基因缺失CNVs被报道[28]。在综合征型耳聋基因中也发现了大量CNVs,如覆盖EYA1基因的18q13基因片段上发生的缺失CNVs正是腮耳肾综合征的病因之一,EYA1基因部分外显子的重复也可导致此综合征的发生[29,30]。此外,至少有50个CNVs发生在USU2A基因上而导致Usher综合征[31]。截至目前已有64个耳聋基因被报道发生CNVs。在双侧耳聋患者中,20%的致聋基因被鉴定为存在CNVs,15%接受基因检测的患者携带有CNVs[32]。

3 遗传性耳聋CNVs的致病机制

目前研究表明,人类基因组CNVs并不是随机分布,近40%的CNVs更倾向分布于基因沙漠区,但仍有大量疾病易感基因或致病基因定位于CNVs区域,可解释多达20%的个体异常表型[5,33]。CNVs可通过基因破坏、基因融合、剂量效应、位置效应等机制导致疾病[34]。

CNVs可直接对听力功能所必需的蛋白质功能产生有害影响,从而导致耳聋。当CNVs累及整个基因时会导致耳聋发生,如当OTOA基因发生纯合缺失时,其编码序列缺失而无法编码Otoancorin蛋白,使耳蜗盖膜发生异常导致耳聋[35];当基因调控/启动子区发生CNVs时也会引起耳聋,POU3F4基因仅在上游增强子区域发生CNVs时便可导致内耳发育异常[36]。此外,CNVs可能会导致隐性基因暴露,如当TMPRSS3基因杂合变异时,复杂的基因组重排导致基因破坏,产生无效等位基因而导致耳聋[37]。

由于CNVs片段长度比较长,可能涵盖数个基因,且其结构复杂,因此其也可能通过影响分子表型或基因组表型异质性,进而导致耳聋发生,所以需要更好的了解CNVs对基因表达的影响,以评估其在遗传性耳聋复杂性状中的作用。

CNVs导致遗传性耳聋所涉及的具体基因及机制仍需进一步的分析和验证。对遗传性耳聋来说,有学者提出致病性CNVs应被定义为:1)覆盖已知致聋基因的编码区,临床表型及遗传模式与已报道的该基因表型及模式吻合;2)覆盖已知的致病CNVs;3)新发的CNVs或在多个受累家庭成员中发现已知引起疾病的基因突变与表型共分离CNVs;4)位于一个基因富集的区域;5)具有大片段的变异,CNVs处于特异的、富含基因序列的区域;6)为稀有CNVs,在内部数据库/公共数据库人群携带率<1%[38]。

4 CNVs的检测方法

近年来,研究人员提出了很多与标准参照基因进行比较的CNVs检测技术,以确定变异区域的拷贝数及断点位置为其重点研究方向,但不同的检测方法及其应用的计算策略在变异类型和CNVs拷贝数鉴定,及断点位置准确度等方面各有优劣[39]。

实时荧光定量PCR(Real-time Fluorescent Quantitive Polymerase Chain Reaction,FQ-PCR)是首先用于目标区域CNVs的检测技术,其敏感性高,操作简单,污染少,重复性好,但其不能进行高通量CNVs检测。多重链接探针扩增技术(Multiplex Ligation-dependent Probe Amplification,MLPA)是对待检DNA靶序列进行定性和半定量分析的检测技术,具有通量高,灵敏度高,特异性强,可重复性好的特点,但其只能检测已知序列,且探针的特异性要求高,无法检测出易位、倒位等情况。染色体微阵列分析技术中常用的微阵列比较基因组杂交(Array-based Comparative Genomic Hybridization,aCGH)技术使用双杂交策略检测待测样本位点的拷贝数变化,由于其可同时分析数万个基因,因此被广泛地应用于全基因组CNVs检测及产前诊断CNVs检测中,但其不能检测到倒位、易位及低水平的嵌合体,也无法检测断点信息,且对单拷贝数不敏感。下一代测序(Next Generation Sequencing,NGS)技术,其具有高通量及高分辨率的特性,可对CNVs进行深度挖掘,精确定位和鉴定,除此之外其还可检测到覆盖全染色体非整倍体、大及更低比例的嵌合,基于NGS的CNV-seq也越来越多地应用于产前诊断中[40]。但其受限于读长短特性,并易受覆盖率影响,很难检出较小的CNVs,且对断点的精确定位仍存在困难。

目前,检测技术都具有一定优势及不足,仅使用一种方法还不能完全的检测出一个个体基因组所包含的所有CNVs。测序技术正朝通量更高,读长更长,精度更高和成本更低的方向发展,如基于纳米孔测序原理的第三代测序技术(Third Generation Sequencing,TGS),其不再需要PCR扩增过程,可对每一条DNA分子进行单独测序,更好地解决复杂重复序列、高GC等问题。由于其长读长的特性,可准确检测CNVs,确定CNVs片段参考数据,更可以精确地定位CNVs的准确位置,找到确切断点信息[41]。

5 小结及展望

人类基因组中存在大量的CNVs,遗传效应远大于SNPs,对CNVs的研究更有助于对基因组变异与疾病间关系的深入理解。对于CNVs和耳聋基因突变的综合作用,尤其是在正常听力个体中CNVs多态性的认识,我们仍处于早期阶段。随着对CNVs研究方法及检测技术的发展,可使我们更深入了解耳聋相关致病基因CNVs的致病机制,进一步理解遗传性耳聋的表型及遗传变异之间的关系,为遗传性耳聋患者群体提供更有价值的分子诊断信息,指导临床发现新的治疗方法,以及制定更好的预防策略。

猜你喜欢

拷贝数遗传性耳聋
遗传性非结合性高胆红素血症研究进展
《中国肿瘤临床》文章推荐:中国家族遗传性肿瘤临床诊疗专家共识(2021年版)—家族遗传性乳腺癌
遗传性T淋巴细胞免疫缺陷在百草枯所致肺纤维化中的作用
线粒体DNA拷贝数在儿童脑性瘫痪患者中的表达及临床意义
6例X-连锁遗传性聋患者人工耳蜗植入术后效果评估
卵巢癌与宫颈癌PIK3CA基因拷贝数变异及意义
小麦Glu-3位点基因拷贝数的变异分析
不能耽误的急症:突发性耳聋
OsRhoGDI2过表达转基因水稻的筛选鉴定及外源基因拷贝数的初步分析
我国科学家发现新致聋基因