APP下载

动物全基因组拷贝数变异及其应用

2015-01-23杨明娟

中国牛业科学 2015年5期
关键词:拷贝数表型变异

徐 瑶,刘 梅,石 涛,杨明娟,陈 宏

(西北农林科技大学动物科技学院,陕西省农业分子生物学重点实验室,陕西杨凌,712100)

动物全基因组拷贝数变异及其应用

徐瑶,刘梅,石涛,杨明娟,陈宏*

(西北农林科技大学动物科技学院,陕西省农业分子生物学重点实验室,陕西杨凌,712100)

动物基因组研究的核心内容是了解引起表型差异的分子遗传基础。拷贝数变异(CNVs)作为基因组中一种新的变异形式,在表型多样性和遗传进化研究中占有非常重要的位置。由于CNVs在基因组中所占的片段较长,有的能够包含整个基因,因此,可以通过基因剂量改变,影响基因的表达,进而导致该基因控制的表型变化。研究表明,有的CNVs区域与表型差异有着密切的关系。本文介绍了CNVs的发现、作用机制,重点阐述了CNVs所产生的剂量效应及其在动物表型变异研究中的应用,为动物遗传育种提供了新的方法和思路。

拷贝数变异;剂量效应;表型变异;育种

随着检测和分析技术的不断进步,全基因组水平上的研究在各个物种上逐步展开。目前,已有数百万计的单核苷酸多态性(single nucleotide polymorphisms,SNPs)位点(包括位于编码区、非编码区和调控区)和一些短片段的插入/缺失(insertion/deletion,indel)在动物的基因组中被检测到[1,2]。由于这种变异类型在生物体内普遍存在,且容易进行群体分型,一直以来都是生物研究者们关注的焦点。然而,近几年来,基因组上的一种亚显微水平的结构变异--拷贝数变异(copy number variations,CNVs)被广泛报道[3,4],现已成为从“基因组变异”到“表型变异”的另一研究热点。

拷贝数变异是指DNA序列从几kb到几Mb范围内的拷贝数突变,也称为拷贝数多态性(copy number polymorphisms,CNPs)。通过对CNVs的广泛研究,发现CNVs能够通过基因剂量效应影响个体的表型性状[5,6]。本文主要针对CNVs在动物表型变异研究中的应用进行了综述,以期对CNVs在动物遗传育种中的作用有一个全新的认识。

1 CNVs的发现

以前,研究者们都认为基因组中的各种结构变异,如DNA重复(Duplication)、插入(insertion)、缺失(deletion)、染色体倒置(inversion)和易位(translocation),属于稀有事件,一旦发生便会引起机体的各种病变[7]。直到2004年,在全面开展“人类基因组计划”时,多个研究小组同时发现,正常个体基因组中的有些DNA序列存在拷贝数差异,其中,有两个团队率先提出了这一概念[8,9]。CNVs是指与参考基因组比较,序列大小在1 kb到几个Mb之间的重复、插入、缺失或多种类型同时存在的复合多位点变异。由此证明结构变异在基因组中是经常发生的。

此外,研究表明,CNVs在基因组中的分布也是有一定规律的,Hou等[10]研究发现:①检测到的CNVs大多都是串联排列在基因组中的,并非随机排列的;②较小的CNVs片段(<50 kb)的发生频率比大片段的要高;③基因组中的CNVs区域(CNVs Region)的GC含量为43.6%,大于整个基因组的GC含量,表明CNVs容易在GC含量丰富的区域发生。

2 CNVs的作用机制

在基因组中,CNVs通常发生的区域含有大片段同源序列重复(Homologous repeats)或SD序列(Segmental duplications)。SD序列是指由于基因组重排产生的长度大于1 kb串联重复的DNA片段,且序列之间具有90%以上的同源性[4]。

为了探索从基因组CNVs→RNA水平→表型变化的作用机理,科研人员通过大量的假设和实验验证,认为CNVs影响表型的作用机制主要有以下几个方面:①小片段的重复、缺失或插入,改变单个基因或与其临近的几个基因,直接导致基因剂量的改变,使相关的蛋白质的表达量的减少或增加,进而引起表型的变化,如DiGeorge综合征等[11];亦或是造成基因内部的结构破坏,丧失基因功能。研究表明,CNVs对临近基因的表达影响是通过调节转录单位与顺式调节子(cis-acting regulator )的分离和结合[12],改变染色质的结构[13]和修饰核内染色质的位置[14]实现的。②DNA片段的倒位,功能基因倒位至无活性异染色体区域,使基因不表达或表达量极少,从而导致表型的变化。Gimelli等[15]报道由于含有SRY基因的DNA片段倒位至无活性功能的Yq21区域,使该基因甲基化不参与蛋白质的表达而丧失其基因功能,导致性发育疾病和性腺母细胞瘤的发生。③调控基因转录调控因子,间接影响基因表达量[12,16,17]。例如:阻遏子的片段缺失可增强基因转录活性,而启动子及邻近区域的片段重复可导致次稳定重排,降低基因表达量。Stranger等[17]研究发现,CNVs与18%的基因表达呈正相关,即拷贝数增加促进覆盖区域或临近区域的基因表达;CNVs与15%的基因表达呈负相关,拷贝数增多可使相关的基因表达减弱。CNVs甚至可以间隔6 Mb的远距离来调控基因的表达。

另外,有些CNVs具有一定的干扰效应,但涉及到的区域通常不会引起重要的功能基因改变。正常个体的一个基因发生拷贝数变异不一定会导致表型的相应改变,因为很多表型都是多基因控制的数量性状,该基因发生CNVs所产生的功能缺失可能会被其他功能类似的基因补偿,从而缓冲了这种不平衡作用。

3 CNVs所产生的基因剂量效应

目前,高通量基因组分析已经发现了很多拷贝数变异,有些能够引起基因功能缺失(Loss-of-function)或基因功能重塑(Gain-of-function)等,这些变异在正常个体中也有可能发生,其对表型的影响大多是通过基因剂量效应(Gene dosage effects)来实现的。

3.1基因剂量效应定义

基因剂量改变在基因组中是普遍发生的,关于其效应研究已经在多个物种上开展,如哺乳动物[18,19]、鸟类[20]、酵母[21]等。以前,基因剂量效应的定义比较狭义,主要是指基因组上某个功能基因发生多次拷贝,但所形成的表型与未发生拷贝的个体相同的一种现象,如性染色体畸变和X染色体失活等[22]。随着CNVs的发现和广泛研究,基因剂量效应的概念也随之发生改变,它是指结构基因或者调控序列在基因组上的数量发生改变,从而通过“剂量效应”引起表达水平或者表型变化的现象[23]。

3.2基因剂量改变与表型形成的关系

基因剂量改变对表型的影响主要是通过以下两个途径:①功能基因在染色体上数量改变,影响该基因的mRNA表达量,进而导致表型的变异;②调控基因或序列数量改变,能够引起它所控制的基因活化或功能失调,最终在表型上体现出来。在人上的研究发现,CNVs的基因剂量效应是引起人类健康、疾病和进化等性状形成的重要因素之一[24]。Yim等[25]通过qPCR和B细胞定量的方法,研究了VPREB1基因CNVs剂量效应与风湿性关节炎的关系,结果发现该基因在基因组上为2个拷贝时,提高了疾病的患病几率,而拷贝数为<2或≥3时,患病个体数目明显下降。此外,以533个韩国人为研究对象,检测了趋化因子配体3-样蛋白1(Chemokine ligand 3-like 1)基因的CNVs,发现该基因具有正向剂量效应,即拷贝数与基因表达量呈正相关。并且该基因的拷贝数目≤1时,会增加个体患哮喘病的几率[26]。随着CNVs遗传效应研究的逐渐深入,在家畜上也将逐步展开关于功能基因CNVs的剂量效应与家畜经济性状相关性及其作用机理的研究。

4 CNVs在动物表型变异研究中的应用

CNVs发现初,大部分的研究还是集中在人类各种复杂疾病上,由于动物的生长发育性状属于复杂性状,是受多基因多通路综合调控的,这些性状是否也会由于基因组内片段的拷贝数变异而发生改变。这一问题的提出,受到了畜禽遗传工作者们的重视。因此,大量的关于畜禽基因组拷贝数变异的研究被报道。

CNVs是家畜遗传变异的一个重要来源。Kijas等人[27]采用寡核苷酸芯片杂交的方法,对普通牛和瘤牛的基因组CNVs进行检测和比较,共检测到51个CNVs(占全基因组序列的0.5%),对CNVs区域中包含的基因进行注释,发现82%的CNVs内包含至少一个基因,且很多功能基因与牛的表型性状具有一定的相关性。Liu等(2010)采用CGH芯片检测了90个来自来自不同地区的牛全基因组CNVs,并通过qPCR和荧光原位杂交(FISH)技术对部分CNVs进行了进一步验证。结果共检测到了200个CNVs区域,其中的177个位于已知的染色体上的具体位置,有约50%的CNVs(89/177)在多个牛上同时被检测到,有些CNVs是品种特异性的。对400个位于CNVs区域中的基因做注释,发现很多位点与重要性状相关,如免疫、泌乳、繁殖等。Bickhart等(2012)利用通过全基因组测序,检测到了1265个CNV区域,通过比对分析,发现了多个与牛生长、肉质相关的QTLs位于CNVs区域内。Zhang等[28]利用CGH芯片检测了12个中国黄牛品种、2个水牛品种和1个牦牛品种的全基因组CNVs,共发现了605个CNVs,对功能基因研究发现,PLA2G2D基因CNVs与黄牛的表型性状显著相关。此外,Xu等[29,30]研究了肌肉生长发育相关基因MYH3和MICAL-L2拷贝数变异对基因表达和表型性状的影响,结果显示MYH3基因拷贝数增加能够通过基因剂量效应促进基因的表达,MICAL-L2基因拷贝数增加可以抑制基因的表达,最终均能够影响黄牛的生长性状。

Wang等[31]利用2.1 M CGH芯片,在来自不同地区的12个猪全基因组中检测到了1,344个CNVs,覆盖基因组的1.7%(47.79 Mb),涉及到的CNVs基因(如KIT、CAT3等)在不同品种间拷贝数有较大差异。Seo等[32]研究猪8号染色体上的KIT基因发现,该基因的完整或部分的复制显著影响猪的毛色。另外,研究表明,猪基因组中的CNV区域不仅能够反映表型差异,还可以与SNPs一样用来研究猪的进化历程[33]。Fontanesi等人[34]研究发现,不同品种山羊的毛色存在差异,与山羊刺鼠信号蛋白(Agouti signaling protein)基因拷贝数的变异显著相关。与哺乳动物相比,在进化的过程中,尽管禽类的基因组保持着相对的稳定,但是其基因组拷贝数的变异仍然能导致表型的变化。Griffin等[20]比较了鸡和火鸡之间的细胞遗传学图谱,通过CGH发现了16个种间差异的CNVs。Wright等[35]通过CGH和荧光定量试验研究发现,由于SOX5的第一内含子区域内一段重复序列的大量扩增形成了鸡豆冠表型。Chen等[36]对9个狗(包含4个品种)的基因组进行CGH检测,并且绘制了第一张狗的CNVs/SV图谱,发现了多个品种内特异性的CNVs。当然,随着检测技术的不断进步,人们对CNVs的研究及在家畜育种中的应用必将越来越深入和广泛。

5 展望

基因组变异是研究表型性状差异最重要的基础资料,各种高通量检测技术为全面、准确的获取基因组遗传变异提供了强有力的手段。在家畜上,多个物种的全基因组拷贝数变异遗传图谱已经构建,并且通过生物信息学分析,预测出了很多与家畜肌肉生长、脂肪代谢、繁殖力和抗病性等数量性状相关的位点。然而,这些关键位点是如何在基因组中发挥作用的还要通过进一步验证,不仅要用多种技术研究同一个体的不同变异位点,还要研究不同个体的同一变异位点间的差异。由此可见,基因组拷贝数变异研究是连接自身遗传本质与表型性状的桥梁,作为一种新型的分子遗传标记,CNVs将在今后的遗传疾病诊断和定向育种方面具有广阔的应用前景。

[1]Eck SH,Benet-Pagès A,Flisikowski K,et al.Whole genome sequencing of a single Bos taurus animal for single nucleotide polymorphism discovery[J].Genome Biol,2009,(10):R82.

[2]Vali U,Brandstrom M,Johansson M,Insertion-deletion polymorphisms (indels) as genetic markers in natural populations[J].BMC genetics,2008,9:82.

[3]Khaja R,Zhang JJ,MacDonald JR,et al.Genome assembly comparison identifies structural variants in the human genome[J].Nature Genetics,2006,38:1413-1418.

[4]Redon R,Ishikawa S,Fitch KR,et al.Global variation in copy number in the human genome[J].Nature,2006,444:444-454.

[5]Byars SG,Stearns SC,Boomsma JJ.Opposite risk patterns for autism and schizophrenia are associated with normal variation in birth size:phenotypic support for hypothesized diametric gene-dosage effects[J].P Roy Soc B-Biol Sci,2014,281.

[6]Szigeti K,Trummer B,Lal D,et al.Genome-wide scan for copy number variation association with biomarker quantitative trait loci in aging[J].Eur J Inflamm,2014,12:267-276.

[7]Bridges CB.The bar“ gene” a duplication[J].Science,1936(83):210-211.

[8]Iafrate AJ,Feuk L,Rivera MN,et al.Detection of large-scale variation in the human genome[J].Nature Genetics,2004,(36):949-951.

[9]Sebat J,Lakshmi B,Troge J,et al.Large-scale copy number polymorphism in the human genome[J].Science,2004,(305):525-528.

[10]Hou YL,Liu GE,Bickhart DM,et al.Genomic characteristics of cattle copy number variations[J].BMC Genomics,2011,(12):127.

[11]Bittel DC,Yu S,Newkirk H,et al.Refining the 22q11.2 deletion breakpoints in DiGeorge syndrome by aCGH[J].Cytogenetic and Genome Research,2009,(124):113-120.

[12]Kleinjan DA,van Heyningen V.Long-range control of gene expression:Emerging mechanisms and disruption in disease[J].American Journal of Human Genetics,2005,(76):8-32.

[13]Gabellini D,D'Antona G,Moggio M,et al.Facioscapulohumeral muscular dystrophy in mice overexpressing FRG1[J].Nature,2005,(439):973-977.

[14]Fraser P,Bickmore W.Nuclear organization of the genome and the potential for gene regulation[J].Nature,2007,447:413-417.

[15]Gimelli G,Gimelli S,Dimasi N,et al.Identification and molecular modelling of a novel familial mutation in the SRY gene implicated in the pure gonadal dysgenesis[J].European Journal of Human Genetics,2006,(15):76-80.

[16]McCarroll SA,Hadnott TN,Perry GH,et al.Common deletion polymorphisms in the human genome[J].Nature Genetics,2005,(38):86-92.

[17]Stranger BE,Forrest MS,Dunning M,et al.Relative impact of nucleotide and copy number variation on gene expression phenotypes[J].Science,2007,(315):848-853.

[18]Perry GH,Yang F,Marques-Bonet T,et al.Copy number variation and evolution in humans and chimpanzees[J].Genome Research,2008,(18):1698-1710.

[19]Schrider DR,Hahn MW.Gene copy-number polymorphism in nature[J].Proceedings of the Royal Society B:Biological Sciences,2010,(277):3213-3221.

[20]Griffin D,Robertson L,Tempest H,et al.Whole genome comparative studies between chicken and turkey and their implications for avian genome evolution[J].BMC Genomics,2008,(9):168.

[21]Carreto L,Eiriz MF,Gomes AC,et al.Comparative genomics of wild type yeast strains unveils important genome diversity[J].BMC genomics,2008,(9):524.

[22]Chen Z-X,Golovnina K,Sultana H,et al.Transcriptional effects of gene dose reduction[J].Biology of sex differences,2014,(5):5.

[23]Haraksingh RR,Snyder MP.Impacts of variation in the human genome on gene regulation[J].Journal of molecular biology,2013,(425):3970-3977.

[24]Zhang F,Gu W,Hurles ME,et al.Copy number variation in human health,disease,and evolution[J].Annual Review of Genomics and Human Genetics,2009,(10):451-481.

[25]Yim S-H,Chung Y-J,Jin E-H,,et al.The potential role of VPREB1 gene copy number variation in susceptibility to rheumatoid arthritis[J].Molecular immunology,2011,(48):1338-1343.

[26]Lee H,Bae S,Choi BW.Copy number variation of CCL3L1 influences asthma risk by modulating IL-10 expression[J].Clinica Chimica Acta,2011,(412):2100-2104.

[27]Kijas JW,Barendse W,Barris W,et al.Analysis of copy number variants in the cattle genome[J].Gene,2011,(482):73-77.

[28]Zhang LZ,Jia SG,Yang MJ,et al.Detection of copy number variations and their effects in Chinese bulls[J].BMC genomics,2014,15.

[29]Xu Y,Shi T,Cai HF,Zhou Y,Lan XY,et al.Associations of MYH3 gene copy number variations with transcriptional expression and growth traits in Chinese cattle[J].Gene,2014,(535):106-111.

[30]Xu Y,Zhang LZ,Shi T,et al.Copy number variations of MICAL-L2 shaping gene expression contribute to different phenotypes of cattle[J].Mammalian Genome,2013,(24):508-516.

[31]Wang J,Jiang J,Wang H,Kang H,Zhang Q,et al.Enhancing genome-wide copy number variation identification by high density array CGH using diverse resources of pig breeds[J].PloS one,2014,9:e87571.

[32]Seo BY,Park EW,Ahn SJ,Lee SH,Kim JH,et al.An accurate method for quantifying and analyzing copy number variation in porcine KIT by an oligonucleotide ligation assay[J].BMC genetics,2007,8:81.

[33]Paudel Y,Madsen O,Megens H-J,Frantz LA,Bosse M,et al.Evolutionary dynamics of copy number variation in pig genomes in the context of adaptation and domestication[J].BMC genomics,2013,14:449.

[34]Fontanesi L,Beretti F,Riggio V,Gómez González E,Dall'Olio S,et al.Copy number variation and missense mutations of the agouti signaling protein ( ASIP) gene in goat breeds with different coat colors[J].Cytogenetic and Genome Research,2009,126:333-347.

[35]Wright D,Boije H,Meadows JR,Bed'hom B,Gourichon D,et al.Copy number variation in intron 1 of SOX5 causes the Pea-comb phenotype in chickens[J].PloS genetics,2009,5:e1000512.

[36]Chen WK,Swartz JD,Rush LJ,Alvarez CE.Mapping DNA structural variation in dogs[J].Genome Research,2009,19:500-509.

Copy Number Variations of Animals Genomes and their Further Applications

XU Yao, LIU Mei, SHI Tao, YANG Ming-juan, CHEN Hong*

(CollegeofAnimalScienceandTechnology,NorthwestA&FUniversity,ShaanxiKeyLaboratoryofMolecularBiologyforAgriculture,Yangling,Shaanxi, 712100,China)

The core point of genomic research in animals was to acquaint the molecular genetic basis of phenotypic differences. As a new type of genomic variations, copy number variations (CNVs) played important roles in phenotypic diversity and genetic evolution. CNVs were known to cover long rang in genome, and of these, many CNV regions included the whole sequences of functional genes. Therefore, the CNVs were likely to affect related gene expression, and ultimately altering the phenotypic variations by gene dosage effect. Previous studies reported that several CNV regions were significantly associated with phenotypic variations. In this paper, we described the discovery and molecular mechanisms of CNVs, focusing on the dosage effect of CNVs and their applications in phenotypic variation research of animals. All the information will provide promising methods and idea for animal breeding programs.

copy number variations; dosage effect; phenotypic variation; breeding

2015-03-19修改日期:2015-03-25

本研究由国家肉牛牦牛产业技术体系专项(编号:CARS-38),国家自然科学基金项目(编号:30972080),陕西省科技统筹创新工程计划项目(2015KTCL02-08,2014KTZB02-02-02-02)资助完成。

徐瑶(1987-),女,陕西咸阳人,博士研究生,主要从事动物基因组变异研究。

陈宏(1955-),男,陕西西安人,教授,博士生导师,主要从事牛分子遗传与育种。

S823.2

A

1001-9111(2015)05-0066-04

猜你喜欢

拷贝数表型变异
线粒体DNA拷贝数在儿童脑性瘫痪患者中的表达及临床意义
承德所选实生核桃资源果实表型性状评价初报
线粒体DNA拷贝数变异机制及疾病预测价值分析
体型表型与亚临床动脉粥样硬化有关
慢性阻塞性肺疾病急性加重期临床表型及特征分析
变异危机
变异
胎儿染色体组拷贝数变异与产前超声异常的相关性分析
土壤盐碱对不同表型猴樟渗透调节物质的影响
变异的蚊子