APP下载

比较机器学习等算法对肉鸡产蛋性状育种值估计的准确性

2022-05-30丁纪强李庆贺张高猛郑麦青赵桂苹

畜牧兽医学报 2022年5期
关键词:遗传力产蛋准确性

丁纪强,李庆贺,张高猛,李 森,郑麦青,文 杰,赵桂苹

(中国农业科学院北京畜牧兽医研究所,北京 100193)

产蛋性状是肉种鸡重要的经济性状,产蛋数的提高不仅直接增加产雏数,同时增加投入产出比,是育种中必须持续稳定选育的指标之一。但产蛋数属于低遗传力性状,在肉用品系中由于种鸡体型大,传统的家系选择方法准确性低,急需应用新技术提高遗传进展。目前,利用基因组信息开展的产蛋性状基因组选择将有效提高选育准确性。

Henderson于上世纪60年代提出了基于混合模型方程组的最佳线性无偏预测(best linear unbiased prediction, BLUP)模型,利用个体以及亲属信息构建亲缘关系矩阵。传统BLUP方法过度依赖于系谱和表型信息的记录准确性,因此受到环境和其他因素的影响较大。基因组选择技术在2001年被提出,其优势在于可以提高遗传评定的准确性,缩短世代间隔,对表型不易测量和低遗传力的性状选择具有较大的优势。在褐壳蛋鸡中的研究发现,基于基因组选择的后代测定的16个性状,其性成熟年龄、产蛋量、产蛋率等都优于进行常规选择的群体。在鸡的疾病抗性选择中也表现出相同的结果。Yin等于2020年提出了一种机器学习方法KAML方法(Kinship-adjusted-multiple-loci,KAML),其机器学习方法整合了交叉验证、二分法迭代等算法,可以将较大标记效应纳入到混合线性模型协变量中,并同时根据标记贡献赋予一定权重,从而提高估计准确性。

本研究的目的是比较不同算法基因组预测准确性,以白羽肉鸡产蛋数为研究重点,对遗传参数进行估计,并分析包括机器学习算法在内的7个模型对白羽肉种鸡产蛋性状的预测准确性。为在白羽肉鸡产蛋性状中实施基因组选择技术提供理论依据。

1 材料与方法

1.1 试验群体

本研究使用的产蛋数和蛋重数据来源于弥勒新广农牧科技有限公司培育的快大型白羽肉鸡的一个品系,共选择了8个世代,本研究使用第6和7世代个体,共包含2 474个个体的系谱数据和基因型数据。其中包括公鸡697只,母鸡1 777只。每只鸡单笼饲养,每个笼位附有条形码。用条码扫描器产蛋记录系统记录鸡群每日产蛋数量,并标注畸形蛋和破蛋情况。统计43周龄、60周龄的合格蛋数、合格蛋率、总产蛋数等指标,其中只有第6世代有60周 产蛋数。在52周龄连续测定1周个体蛋重,剔除称量蛋数少于3枚的蛋重,计算每个个体的平均蛋重。

1.2 基因分型、填充和质量控制

在43周龄时翅下静脉采血,EDTA抗凝后-20 ℃ 保存用于基因组DNA提取,通过苯酚-氯仿法提取血样中的基因组DNA,利用“京芯一号” 55K SNP 芯片对2 474个个体进行基因型检测。基因分型后共得到44 561个SNPs,使用PLINK(V1.9)软件对数据进行质量控制,质控条件设为保留最小等位基因≥5%、基因分型率≥90%的位点,个体分型率≥90%的个体。质控后使用Beagle 5.0软件对缺失的SNP进行填充。最终保留个体2 474个,SNP位点个数是38 019个,保留个体和SNP用于后续研究。

1.3 基因组预测的统计模型

分别利用KAML、PBLUP、GBLUP、SSGBLUP、Bayes A、Bayes B和Bayes C7种模型进行分析。其中KAML算法的模型介绍同文献[8],通过R软件包“KAML”进行计算。

Bayes方法使用R软件包“BGLR”进行计算,迭代次数设置为5 000次。

基于系谱(PBLUP)、基因型(GBLUP)和两者结合(SSGBLUP)的最佳线性无偏预测方法对有基因型和系谱的2 474只鸡的群体进行育种值估计。统计模型如下:

=++

在逆矩阵中:

=(1-)+w

为加权系数,VanRaden将=0.05作为构建矩阵的默认参数,对矩阵进行加权:=095+005

本次试验估计的方差组分和预测的育种值基于ASReml v4.1软件进行计算。遗传力和方差组分计算使用单性状模型,产蛋性状之间的相关性采用双性状模型进行估计。

1.4 不同算法基因组预测准确性比较

对43周总产蛋数和52周蛋重两个性状进行不同算法基因组预测准确性的比较。

育种值预测准确性评估方式为交叉验证,育种值估计准确性用固定效应校正后的表型与估计育种值的pearson 相关系数表示,秩相关用spearman相关系数表示。本研究利用5倍交叉验证进行评估,将有表型个体随机分为5组,其中4组为参考群,剩余1组为验证群,重复5次。为了获得更准确的结果,本研究进行了20次5倍交叉验证进行准确性评估。

SSGBLUP对于不同的群体和性状可能会有不同的加权值,为了提高SSGBLUP对基因组育种值预测的准确性,需要首先调整的参数确定对每个性状的最佳预测能力。

2 结 果

2.1 群体数据的基本统计

表型数据通过利用箱线图法剔除异常值,(Q1-1.5*IQR)~(Q3+1.5*IQR)以外的数值。式中:Q1指第一四分位数,Q3为第三四分位数;IQR为四分位距,指第三四分位数与第一四分位数的差值。描述性统计见表1。

表1 产蛋性状描述性统计结果

2.2 不同模型遗传力估计

使用PBLUP、GBLUP、SSGBLUP三种模型估计6个性状的遗传力估计值见表2。结果表明,GBLUP模型估计得到的遗传力略低于其他两个模型的估计值。4个产蛋数性状属于低遗传力性状,蛋重性状属于中等遗传力性状。

表2 PBLUP、GBLUP和SSGBLUP方法估计产蛋性状的遗传力

2.3 产蛋性状遗传相关分析

产蛋性状之间的遗传相关性结果见表3。产蛋数之间存在强的遗传正相关,蛋重与43周产蛋数存在中等的遗传负相关,与60周产蛋数存在中等偏低的遗传负相关。采用矩阵和矩阵估计的遗传相关与基于矩阵估计的结果相似,未存在显著性差异。

表3 产蛋性状之间的遗传相关性

2.4 计算不同w加权系数SSGBLUP预测准确性

不同加权系数下SSGBLUP对43周产蛋数和52周蛋重的预测准确性和秩相关见图1、2。当=0.3时,对产蛋数和蛋重的基因组育种值估计的准确性和秩相关系数最高,当=0.3时相较于默认值=0.05时构建的矩阵,预测准确性略有提升,但是提升幅度较小,因此下面计算依然以=0.05为加权值。

图1 不同w加权准确性比较

2.5 不同模型对产蛋数和蛋重性状育种值估计准确性比较

本研究通过5倍交叉验证将育种值估计的准确性用表型与估计育种值的pearson相关系数表示。准确性结果和秩相关结果见表4。1)使用基因组选择方法估计基因组育种值的准确性高于基于系谱信息预测的结果。Bayes方法相对于KAML方法和BLUP方法均有更高的准确性。2)KAML与GB-LUP估计育种值的准确性相似,Bayes A、Bayes B和Bayes C的准确性接近。3)Bayes A方法对于蛋重有最高的准确性。4)Bayes C对产蛋数有最高的准确性。

表4 不同方法估计育种值的准确性和秩相关结果

3 讨 论

白羽肉鸡产业在畜牧业中贡献显著,其饲料转化率高,温室气体排放量低。鸡肉中蛋白质含量高,是一种环境友好、营养健康的肉类。产肉和产蛋是鸡产业的两大重要经济性状,由于肉鸡和蛋鸡在这两大经济性状中的选育方向不同,导致肉鸡在产蛋方面与蛋鸡相差甚远,因此肉鸡在产蛋性状中还有很大的选育空间。

本研究采用系谱和基因组信息估计了白羽肉鸡品系产蛋性状遗传参数,产蛋数遗传力为0.061~0.16,属于低遗传力性状,蛋重的遗传力为0.28~0.39,属于中等偏高遗传力性状。本文PBLUP和SSGBLUP估计遗传力的结果与在洛岛红鸡报道的遗传力结果(蛋重遗传力0.22~0.36,产蛋数0.07~0.39)基本一致,但是GBLUP计算的遗传力相较于马赞达兰土鸡和洛岛红鸡的遗传力报道较低。GBLUP估计得到的遗传力低于PBLUP和SSGBLUP估计的遗传力,该情况在鸡、猪和奶牛报道中也有发现,可能的原因是:1)本研究用的基因组信息是55 K SNP芯片,并不能完全代表基因组,并且所用的模型只估计了加性遗传效应,导致估计出的加性遗传方差偏低;2)由于矩阵没有定义基础群体,使得基因组遗传力估计值很可能偏低。矩阵基于血缘一致性,根据系谱第一世代的公鸡和母鸡,合理地确定了一个定义基础群体。矩阵基于状态一致性,缺乏系谱信息,使用研究群体作为基础群体。Niknafs 等对伊朗本地品种鸡的研究表明,1、8和12周龄体重与产蛋数之间存在低的遗传负相关关系,因此前期体重与产蛋数有可能实现共同选育提高。

图2 不同 w 加权秩相关比较

本研究的相关性分析结果表明,60周产蛋数、合格蛋数和43周产蛋数、合格蛋数之间是强的正遗传相关关系,表明在选育的过程中提高43周产蛋数、合格蛋数的同时就可以提高60周产蛋数、合格蛋数。在蛋鸡中研究较多的有开产日龄、产蛋数、蛋重和开产体重之间的关系。本研究结果表明,蛋重和产蛋数之间是中等的遗传负相关(平均是-0.41)的关系。本研究只用了52周的蛋重,而在洛岛红鸡中有研究表明,28、36、56、66和72周的蛋重之间是强的遗传正相关,相关性在0.85以上。有研究报道了开产体重与蛋重存在中等正相关的关系;开产日龄与产蛋数是较强的遗传负相关,开产日龄早的比开产晚的鸡倾向于产更多蛋,开产体重与产蛋数有中等负相关的关系。De Ketelaere 等报告称,蛋重较大可能会降低蛋壳厚度;此外,蛋重与鸡蛋内部营养物质之间也有很强的遗传正相关。因此,对蛋鸡产蛋数的选择要考虑蛋重的影响,过度选择产蛋数可能会导致蛋重减小,蛋重过小会影响孵化率和雏鸡质量。相反,肉种鸡的体型较大,蛋重通常也较大,因此控制一定的蛋重对于提高产蛋数和保持蛋品质是必要的。

本研究重点比较了KAML、PBLUP、GBLUP、SSGBLUP、Bayes A、Bayes B和Bayes C7种方法对白羽肉鸡产蛋数和蛋重性状的育种值预测准确性。Bayes方法比KAML和BLUP方法有更高的准确性,这与Wu等和Habier等在奶牛群体和模拟数据中的研究结果一致。其原因是,与BLUP模型相比,Bayes模型更好地利用了SNP的连锁不平衡信息,并且更适合于标记密度增加的基因组预测以及参考群和候选群之间亲缘关系较远的情况。3种Bayes模型计算出来的准确性较一致,它们之间的区别在于:一是对每个SNP具有的效应假设不同,Bayes A假设每个SNP都具有效应,且效应不同;Bayes B假设只有一部分SNP具有效应,且效应不同;Bayes C假设一部分SNP具有相同的效应。二是Bayes C将 SNP 具有零影响的先验概率视为未知,而Bayes A认为=0,Bayes B认为>0。计算效率是基因组选择与基因组预测在实际应用中的一个重要要求,这往往阻碍了Bayes方法的应用,导致BLUP模型成为基因组选择与基因组预测方法中应用最广泛的方法之一。

KAML方法与GBLUP和SSGBLUP方法估计育种值准确性相近,在Yin等的报道中表明,KAML方法预测准确性显著高于GBLUP方法,与Bayes方法准确性相似,与本研究的结果不同。KAML方法提高预测准确性的方式是通过全基因组关联分析找到目标性状的显著相关位点,然后根据这些位点的贡献赋予更大权重后进行育种值估计。本研究使用的是55 K SNP芯片,并不能完全代表鸡的整个基因组,全基因组关联分析可能找不到准确的显著相关位点;同时产蛋数和蛋重性状是由微效多基因控制,显著效应位点较少。

基因组选择中常用的BLUP方法有GBLUP和SSGBLUP,GBLUP是根据SNP标记信息构建的基因组关系矩阵,GBLUP假设的是基因组中的每个SNP均具有效应,且对总方差的效应是相等的。由于GBLUP的计算要求所有个体具有基因型,而对于群体较大,个体价值小的经济动物,对全部个体基因分型成本较高,因此SSGBLUP方法的提出很快得到了应用。该方法将基于系谱关系构建的矩阵与标记信息构建的矩阵结合构成新的矩阵。通过两方面信息的整合可以使用更多的记录信息,减少基因分型成本,提高育种值估计的准确性。SSGBLUP受到芯片密度、群体系谱深度和完整性等因素的影响,不同群体、不同性状矩阵的矩阵和矩阵加权系数可能会有不同影响,因此在使用SSGBLUP时检验矩阵中两者的最佳权重是有必要的,本研究结果显示在本群体中调整权重对准确性有小幅度的提升,但是提升不显著,因此在实施SSGBLUP时依然以=005为加权值是可行的。

育种值估计准确性表明,SSGBLUP预测产蛋数的准确性高于GBLUP和PBLUP,其原因在于SSGBLUP结合了系谱信息和基因组信息,相比于GBLUP,加入系谱信息可以补充SNP无法解释的遗传方差,可以提高预测的准确性。本研究也表明,GBLUP的预测准确性高于PBLUP,可能的原因是PBLUP通过系谱估计亲缘关系是一个经验值,无法准确识别半同胞和全同胞个体之间的亲缘关系,得到的是一个期望的推断值,略差于基因组信息估计的亲缘关系。在其他物种中也表现出以上的结果,Habier等报道,GBLUP对于育种值的估计相较于传统PBLUP方法更加准确。在猪中,基因组选择技术对生长速度、饲料转化率、产仔数、肉品质、抗病力等指标普遍具有较高的育种值估计准确性。Yan等对1 344只鸡进行基因分型,以28周体重、蛋重、产蛋量和哈氏单位4个性状为研究对象,发现SSGBLUP比基于系谱的PBLUP的准确性提高了16%。

4 结 论

本研究以白羽肉鸡作为研究群体,以产蛋性状为研究对象,通过PBLUP、GBLUP、SSGBLUP估计不同时期产蛋数和蛋重的遗传力与遗传相关,表明产蛋数性状是低遗传力性状,蛋重是中等遗传力性状,43周和60周产蛋数之间是强的遗传正相关的关系,产蛋数与蛋重是中等遗传负相关关系。比较7种方法的育种值估计准确性表明,机器学习方法KAML与GBLUP方法的准确性相似;Bayes方法预测准确性高于KAML和BLUP方法;BLUP方法中SSGBLUP方法预测产蛋数性状准确性最高;GBLUP预测蛋重性状准确性最高。研究结果显示基因组选择显著优于传统的选择方法。

猜你喜欢

遗传力产蛋准确性
美系大白种猪生长性状和繁殖性状遗传力估计
CT及超声在剖宫产瘢痕部位妊娠中的诊治价值及准确性
CT诊断中心型肺癌的准确性及MRI补充诊断的意义
浅谈如何提高建筑安装工程预算的准确性
种鸭产蛋饲料宜分期控制喂量
通过胎盘效率改良母猪繁殖性能的研究进展
通过胎盘效率改良母猪繁殖性能的研究进展
母鸡喜欢在舒服的地方产蛋
抗虫棉品种系主要农艺性状配合力与遗传力分析
蛋鸡需要强制换羽的六项因素