APP下载

畜禽生长发育相关性状的全基因组关联分析研究进展

2019-11-27贺小云刘秋月胡文萍王翔宇储明星

中国畜牧杂志 2019年11期
关键词:基因组位点畜禽

陶 林,贺小云,狄 冉,刘秋月,胡文萍,王翔宇,储明星

(中国农业科学院北京畜牧兽医研究所,农业农村部动物遗传育种与繁殖重点实验室,北京 100193)

全基因组关联分析(Genome-wide Association Study,GWAS)最早应用于人类疾病,是用于解析复杂性状的重要研究手段[1]。过去十多年中,高通量测序技术的快速发展和测序成本降低使得GWAS 用于畜禽相关经济性状研究成为可能,尤其是各种商用畜禽基因芯片的成功研发极大推动了GWAS 的发展。在全基因组选择育种时代,GWAS 是预测畜禽生产性能和评价畜禽遗传资源的有力工具。本文综述了GWAS 的基本原理、方法、优劣势以及GWAS 在畜禽生长发育相关性状中的应用现状,并对GWAS 在今后畜禽育种中的应用前景进行展望,以期为GWAS 在畜禽育种中的深入研究提供参考。

1 GWAS 的基本原理与方法

1.1 GWAS的基本原理 GWAS依赖于连锁不平衡(Linkage Disequilibrium,LD)检测群体的遗传变异(主要是SNP)与性状之间的关联,然后通过统计基因型和表型的关联性大小筛选出影响显著的遗传变异。因此,GWAS 通过分析遗传变异和表型变异的关联性,定位影响表型性状的重要数量性状位点(QTL)和候选基因,从而确定其遗传机制[2]。GWAS 的一般分析流程为采集样品和表型记录、基因分型、群体分层分析、关联分析、SNP 注释和候选基因筛选、连锁不平衡分析和单倍型分析。

GWAS 常用的高通量基因分型手段有基因芯片技术、全基因组重测序、简化基因组测序、全基因组外显子测序等。基因芯片可以实现对特定群体特定SNP 位点的快速分型。全基因组重测序对基因组遗传信息挖掘全面,但数据量大,成本较高。全基因组外显子测序极大降低了待测序列总量,但并未过多降低遗传信息。与全基因组外显子测序相类似,简化基因组测序只针对基因组中特定区域进行遗传变异检测。较低的分型成本、时间成本、储存成本和分析成本是目前基因芯片技术的优势所在。GWAS 常用高通量基因分型方法见表1。根据具体情况适当选择或有机结合多种分型方法尤为重要。

1.2 试验设计与分析方法 根据实验阶段可以分为单阶段和多阶段,单阶段一般直接选择大群体进行关联分析,多阶段一般先选择小群体,然后在大群体中进行验证。根据研究群体亲缘关系可分为基于无关个体的设计和基于家系的群体设计,前者包括用于研究数量性状的基于随机群体的关联分析和研究质量性状的病例-对照设计。由于样本量和系谱信息的限制,畜禽中的GWAS 设计通常基于无关个体。

GWAS 的任务是挖掘遗传变异和表型性状的关系,其前提假设是芯片密度足够检测出致因突变和SNP 之间的连锁不平衡。线性回归、方差分析、t检验等方法都可以用于GWAS 研究。将多个SNP 合并为一个单倍型与复杂性状进行关联分析的方法叫做单倍型关联分析,其应用较多且效果较好。标签SNP(tag SNP)的鉴定对于确定单倍型和阐明潜在的遗传机制十分重要。此外,计算杂合亲本将等位基因传递给患病子代的概率是否高于50%,即传递不平衡检验(Transmission Disequilibrium Test,TDT),其主要用于存在家系群体的研究。用于群体结构和亲缘关系估计的常见软件有STRUCTURE、EIGENSOFT、ADMIXTURE 和SPAGeDi,用于GWAS分析的常见软件有PLINK、TASSEAL、EMMAX、GCTA和QTXNetwork 等[9]。通常样本和基因型数据的质量控制条件:①个体SNP 检出率>95%;②除去不符合Hardy-Weinberg 平衡检验的SNP;③最小等位基因频率≥1%;④重复样品检出结果>95%。

1.3 GWAS 的优势和缺陷 QTL 定位是研究变异的首选方法。与传统方法(基因组扫描和候选基因分析)相比,GWAS 对低效致因变异的检测效力更强,能进行QTL精细定位,进一步缩短基因区段范围。可实现高通量分析是GWAS 的最大优势。利用基因芯片进行基因分型是GWAS 的常用方式。GWAS 对数以万计个SNP 或变异位点同时进行关联分析,对影响性状的变异信息检出率较高,因此特别适合于复杂性状的遗传机制的研究。GWAS 数据通过网络等途径共享,这对研究相同问题的同行非常有价值。

GWAS 的不足和常见对应方法:①研究群体遗传背景的不一致将出现分层现象,导致结果不可靠。可利用主成分分析、结构关联分析等统计手段进行分层控制。②多重假设检验可能会导致假阳性结果,目前常采用Bonferroni 校正法和控制错误发现率法(FDR)进行校正。③群体重复性不强,要求对大样本量的群体进行多次验证。同时各种后GWAS 策略的出现将有助于完善GWAS 的结果。

微效多基因效应系统使得影响性状的基因组合情况非常复杂。考虑到等位基因数量和效应的大小,GWAS仍不能很好解释遗传方差。因此,基于基因芯片的GWAS 主要关注[10]:①影响研究群体目标性状的位点数量;②位点的联合分布效应和等位基因频率;③实验群体大小;④基因芯片所包含的全基因组变异数量;⑤性状的变异度。

表1 GWAS 常用高通量基因分型方法

表2 GWAS 在畜禽体重和体型性状中的应用

2 畜禽生长发育相关性状的GWAS

本文总结的生长发育相关性状主要指体重和体型性状(表2)、耳性状、角性状、毛性状、乳头数性状、骨性状和肉品质性状等。一次基因分型数据与畜禽多种性状同时进行关联分析,可以达到充分挖掘多性状间的遗传机制和节约实验成本的目的。畜禽的体型大小和体重通常呈正相关,考虑到动物表型数据准确获取的难度较大,且多数研究未区分二者,本文综述了二者的GWAS 研究进展。

2.1 体重体型相关性状的GWAS

2.1.1 猪 针对前肢结构、背部结构、后肢结构和整体结构性状,Le 等[11]利用GWAS 在长白猪、大白猪和杜洛克猪3 个品种分别检测到14、12 个和13 个相关QTL,发现最显著的SNP 分别解释了长白猪 2% 背部结构、大白猪 2.3%整体结构和杜洛克猪 11.4%背部结构的遗传变异,也筛选出骨骼和肌肉发生相关基因LRPPRC、WRAP73、VRTN和PPARD以及生长过程相关基因IGF2BP2、GH1、CCND2和MSH2。Ji 等[12]利用Illumina 公司Porcine SNP60K 芯片分别筛选出611个和79 个与白杜洛克和二花脸猪杂交二代群体210 d 体尺(体高、体长、胸围、胸深、胸宽、管围、腹围和臀围)和体重相关SNP,并鉴定出7 个新QTL 和5 个候选基因。562 头大白猪的GWAS 检测出6 个与生长性状(体重达到100 kg 和115 kg 的日龄以及30~100 kg 和30~115 kg的平均日增重)显著相关的SNP,并注释到9 个骨骼、肌肉、脂肪和肺发生相关基因上[13]。

2.1.2 牛 Nellore 牛的GWAS 结果表明,全基因组范围内最显著的SNP 位于区段BTA14:25376827,该区段跨越多个已报道与初生重、性成熟体重、胴体重、体高和断奶前平均日增重相关QTL[14]。1 562 头婆罗门牛的GWAS 结果 表 明,ADAMTSL3、CAPN2、FABP6和ZEB2等候选基因与其初生重、断奶重和周岁重显著相关[15]。Zhang 等[16]利用Bovine SNP50 v2 BeadChip对中国荷斯坦牛4 个生长阶段(6、12、18、24 月龄)的胸围和臀高进行GWAS 发现,在基因组水平显著的27 个SNP 位点周围寻找到的66 个候选基因在16 个信号通路和互作网络中发挥重要生物学功能。1 314 头中国荷斯坦奶牛29 个体型性状的GWAS 筛选出59 个基因组范围内显著的SNP,其中16 个位于或邻近已经发现的QTL,22 个位于注释基因区段[17]。Zhang 等[18]利用3 种GWAS 方法筛选出影响西门塔尔牛平均日增重的28 个共同SNP 和候选基因区段DCAF16-NCAPG,并在转录水平得以验证。外显子测序发现影响西门塔尔牛胸围和体长的稀有变异,GO 富集分析和KEGG 通路分析将注释到的基因富集到生物体生长发育相关通路[19]。

2.1.3 山羊 Rahmatalla 等[20]利用Goat SNP52 BeadChip对苏丹4 个品种山羊的14 个体型性状关联分析发现,2 号染色体上的CNTNAP5基因与胸宽显著关联,3 号染色体上的SNP 位点56482-scaffold89-467312 与体长显著关联。样本量小(n=95)和多品种是影响该研究结果准确性的主要因素。解决多性状GWAS 实施性不强的办法可以利用参考算法整合GWAS 信息或者进行主成分分析。一项结合GWAS 和GBA 的研究筛选出39 个与Frizarta 奶山羊体尺性状显著相关的基因,其中前5 个 分 别 是TP53、BMPR1A、PIK3R5、RPL26和PRKDC,这与之前GWAS 得到的结果相似[21]。最开始基于重测序的GWAS 发现KDM6A是影响崂山奶山羊繁殖力的候选基因[40],最近在陕西白绒山羊中也证实了KDM6A基因内的1 个16 bp InDel 突变与生长性状显著相关,其中II 型个体的体重、体高、胸深、体长、胸围和臀高显著高于DD 和ID 型个体[22]。

2.1.4 绵羊 GWAS 筛选出大量影响绵羊体重的SNP和候选基因。位于6 号染色体40.3~42.9 Mb 区段的13个SNP 被证明与体重相关,其中最显著的2 个SNP 可以解释24.33% 和24.57% 澳大利亚美利奴羊的体重表型标准方差[23]。GWAS 发现5 个新基因(CAMKMT、TRHDE、RIPK2、MEF2B和RFXANK)与苏尼特羊、杜泊羊和德国肉用绵羊的断奶体重相关[24]。Baluchi绵羊的GWAS 鉴定出2 个影响平均日增重的候选基因MAGI1和ZNF770[25]。Lori-Bakhtiari 绵羊初生重性状的GWAS 挖掘出RAB6B、Tf serotransferri和GIGYF23 个候选基因[26]。

2.1.5 马 16 个品种马的GWAS 发现,分别位于3 号、6 号、9 号和11 号染色体的4 个区段可以解释83% 的体型变异,其中注释到的LCORL、HMGA2和ZFAT基因被报道与人、牛和狗的体型相关[27]。随后的研究证明,LCORL基因的相对表达量和马体型大小存在显著相关,CT 型和CC 型相对于TT 型体型分别减小40%和56%[28]。结合XP-CLR 分析的GWAS 表明,位于ANKRD1基因的标记ECA1:37676322 bp 与体高变异显著相关[29]。3 种检测拷贝数变异算法同时筛选出50个与马体型大小相关的拷贝数变异(CNV),这提高了GWAS 的准确性[30]。以蒙古马和伊犁马为参照,通过FST 和XP-EHH 分析方法发现德宝矮马X 染色体上5 个区段受到强烈选择,其中最显著的2 个SNP 位于骨形态发生蛋白(BMP)超家族中与BMP4 存在拮抗关系 的CHRDL1基 因[31]。184 匹Quarter 马 的GWAS 证实WWOX和AAVPR1A基因与其形态(体重、体长和尻长)显著相关[32]。

2.1.6 家禽 惠阳胡须鸡和快大型肉鸡F2代杂交群体的GWAS 发现与22 个生长相关性状的44 个QTL,其中39 个QTL 同时影响多个性状[33]。乌骨鸡和白洛克鸡杂交群体GWAS 表明,4 号染色体上LDB2基因与7~12 周龄体重和6~12 周龄的日增重均显著相关[34]。结合GWAS 和表达谱实验筛选出与体重相关的QTL miR-16 后,进一步发现miR-15a-16 上游的54 bp 插入突变可以显著提高肉鸡体重、肌肉产量和增大骨架[35]。5 个家系444 只鸡通过CornellGBS 方法的GWAS 找到了20 个与饲料转化效率相关的SNP、1 个与5 周龄体重相关的SNP 以及大量与生产性状相关的SNP[36]。该方法参考数据库中来自小染色体的SNP 信息密度更高。利用特定区段扩增片段测序(Specific-Locus Amplified Fragment Sequencing,SLAF-seq)技术对汶上坝鸡的GWAS 鉴定出6 个达到全基因组显著水平与体重相关的SNP,并定位到PRSS23、ME3、FAM181B、NABP1、SDPR、TSSK6L2和RBBP8 7个基因附近[37]。与芯片技术相比,SLAF-seq 技术的优势包括[41]:①深度测序确保分型准确;②成本较低;③优化的标记效率;④适合大群体检测。运用广义线性模型和压缩混合线性模型对Arian 肉鸡× 伊朗Orumieh 本地鸡F2群体开展的GWAS 表明,定位到的10 个基因与细胞分裂、骨骼肌生成和转录活性的调节等生物学过程相关[38]。在GWAS 的基础上,结合qPCR 和高通量染色体构象捕获(High-Throughput Chromosome Conformation Capture,Hi-C)等技术发现,IGF2BP1的1 个突变能使鸭饲料效率提高6%,且体型(体重、头重、翅重、心脏重、肝脏重、腿重、胸宽、跖骨长)增大15%[39]。

2.2 其他生长发育相关性状的GWAS

2.2.1 耳性状 猪耳朵在实践中具有较高的经济价值。通过GWAS 筛选出位于5 号染色体的与猪耳面积相关的LEMD3和WIF1基因,并验证了WIF1是主效基因[42]。刘晨龙[43]对苏太猪和白色杜洛克和二花脸F2代群体的GWAS 表明,LEMD3、MSRB3和HMGA2是影响耳面积的3 个候选基因;但在随后莱芜猪、二花脸猪和杜长大群体中的GWAS 结果表明,位于5 号染色体上的MSRB3是影响猪耳面积的主效基因。不同品种存在的遗传背景差异可能是导致相同性状定位到不同基因的主要原因。Brito 等[44]通过GWAS 发现,SIX2和WNT5A基因与山羊耳发生与形态相关。多浪羊的GWAS 研究发现,DCC、PTPRD、SOX5是影响耳面积的重要基因[45]。

2.2.2 乳头数性状 大白猪乳头数的GWAS 研究鉴定了VRTN、Prox2、MPP7、ARMC4和MKX等候选基因,且发现这些基因均与椎骨数相关[46]。SCAMP2 g.25280 G>A 位点、HDDC3 g.1319 G>A 位点和SCAMP2 g.14198 G>A 位点分别与总乳头数、左侧乳头数和右侧乳头数显著相关[47]。对3 个群体的GWAS 和荟萃分析表明,VRTN和KDM6B是影响猪乳头数量的候选基因[48]。阿尔卑斯山羊和萨能奶山羊副乳头的GWAS 发现该性状由多基因控制,但未检测出相关基因[49]。GWAS 检测出63 个达到染色体水平、显著影响洼地绵羊乳头数的SNP,并将其注释到1 号染色体上的BBX和CD47基因[50]。

2.2.3 毛性状 Kijas 等[51]研究发现,KIT和MITF是影响绵羊毛色的候选基因。Li 等[52]研究发现,ASIP、TYRP1和MITF是影响芬兰绵羊毛色的候选基因。全球50 个品种山羊群体的拷贝数变异群体研究也证实,ASIP 是影响毛色的重要基因[53]。利用66K SNP 芯片进行GWAS 发现,AKT1和ALX4是影响绵羊绒细度的候选基因[54]。Yang 等[55]通过GWAS 发现NUAK1和SHH可能是影响鸡羽毛黑色素沉积的候选基因。最近研究证明MITF基因的1 个内含子插入可导致鸭出现白羽性状[39]。

2.2.4 角性状 角是动物性选择的产物,实际生产中人们更倾向于培育无角动物。Johnston 等[56]研究发现,RXFP2是影响Soay 野生绵羊角型的主效基因,可以解释正常角型大小形状76% 的加性遗传方差。利用RXFP2基因上的OAR10_29458450 位点为GG 和OAR10_29546872.1 位点为TT,可以预测美利奴绵羊的无角性状[57]。Greyvenstijn 等[58]通过GWAS 筛选出了影响Damara 绵羊角数量的HOXD家族候选基因。Jacob 绵羊和Navajo-Churro 绵羊的GWAS 研究也发现MTX2基因和HOXD家族基因影响角的数目[59]。大角羊角长和角基部周长性状的GWAS 并未找到显著相关SNP[60]。单步加权GWAS 研究发现,Nelore 牛的角型相关候选基因IFNAR1、IFNAR2、IFNGR2、KRTAP11-1、MIS18A、OLIG1、OLIG2和SOD1[61]。GWAS 研究表明,SYNJ1、PAXBP1和C1H21orf62基因显著影响牦牛的无角性状[62]。

2.2.5 骨性状 结合重测序技术和GWAS 定位到了影响大白猪和民猪杂交F2代群体肋骨数性状的潜在型转化生长因子β结合蛋白基因LTBP2[63]。长白猪和韩国本地猪杂交F2代群体的GWAS 也证实了LTBP2是影响胸椎数的候选基因[64]。利用SNP 芯片对300 日龄巴马香猪检出的CNV 进行GWAS,寻找到18 个位于2、5 和7 号染色体上、显著影响骨骼(肩胛骨、臂骨、前臂骨、股骨和小腿骨)长度的拷贝数变异区域[65]。孙艳发等[66]的GWAS 研究发现,LDB2、BOD1L1、QDPR是影响鸡胫长和胫围的重要候选基因。运用一步法SNP-GWAS 发现,FAM184B、LAP3、LCORL和NCAPG是影响牛骨重的重要候选基因[67]。

2.2.6 肉品质性状 张立敏[68]对620 头西门塔尔育肥公牛的肉质性状进行GWAS 研究,发现7 号染色体上CAST基因周围的7 个SNP 与剪切力显著相关,2 号染色体上CXCR4基因附近6 个SNP 与肌内脂肪显著相关。GWAS 研究结果发现,FGF9、SPIDR、LAMA4、TCF4等基因与西门塔尔牛的屠宰率和净肉率性状显著相关[69],CDC42BPA、VPS41、COX7C、PALM2、GLIS3和EFNA5基因与西门塔尔牛的里脊重显著相关[70],PLAG1基因内Bovine HD1400007259 位点与西门塔尔牛的和尚头重、金钱腱重和后腱子重以及雪龙黑牛的金钱腱重显著相关[71],S100A10是影响牛肉pH 的重要候选基因[67]。京海黄鸡腿肌和胸肌脂肪含量、腿肌和胸肌蛋白含量的GWAS 找到LOC101747478、CBLN2、HPGDS、SETD2、ANKRD46、ZFPM2和GRM4等相关基因[72]。大尾寒羊和小尾寒羊的GWAS 筛选出了影响尾脂的部分候选基因CREB1、STEAP4、CTBP1和RIP140[73]。

3 展 望

通过特定位点的分型可以预测畜禽的某些性状或生产力,这对畜禽育种中经济性状的选择至关重要。GWAS 在阐明畜禽复杂性状的遗传机制上的应用越来越广泛,其研究结果为畜禽多基因聚合育种和基因组编辑奠定了坚实的基础。但必须认识到,群体分层现象、多重假设检验不准确、群体重复性不强、基因的精细定位和解释相应的遗传机制对GWAS 是不可避免的挑战。作为一种研究手段和方法,GWAS 只能对遗传信息进行初步挖掘,加上后续的各项实验验证才能较具体说明相关问题。常见的验证手段有候选基因的qRT-PCR 验证、同源基因的比对、多组学结合验证、扩大群体验证和转基因验证等。

今后的研究中,由于样本数限制等原因,基因芯片分型的方法有望被全基因组测序取代;选择遗传力较高和容易精确度量的性状可提高GWAS 统计效力;表型有向分子层面延伸的趋势,如基因表达水平、DNA 甲基化水平和代谢物水平;统计分析方法和相关算法的完善以及多组学等后GWAS 分析策略的出现将会极大提高GWAS 准确度。之前的十多年中,GWAS 在人类疾病和畜禽相关性状的遗传研究方面硕果累累。在全基因组选择育种时代,期待GWAS 在今后的畜禽育种和动物遗传资源保护与利用中得到更加广泛的应用。

猜你喜欢

基因组位点畜禽
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
“植物界大熊猫”完整基因组图谱首次发布
畜禽夏季喂野菜 防病快长真不赖
菌株出马让畜禽污染物变废为宝
夏季养畜禽 驱蚊有妙招
牛参考基因组中发现被忽视基因
上海祥欣畜禽有限公司
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
科学家找到母爱改变基因组的证据