APP下载

深县猪全基因组选择信号检测分析

2021-10-21芦春莲贾梦雨任丽琴曹洪战

中国畜牧杂志 2021年10期
关键词:梅山位点基因组

刘 刁,芦春莲,李 尚,贾梦雨,任丽琴,李 赛,曹洪战*

(1.河北农业大学动物科技学院,河北保定 071000;2.张家口市万全区水产技术推广站,河北张家口 0762503;3.河北正农牧业有限公司,河北辛集 052360)

我国地域辽阔,地形复杂,拥有丰富的猪遗传资源库。深县猪作为河北省现存的唯一地方黑猪,具有肉质好、耐粗饲、繁殖性能高等特点。为了更好地利用深县猪种质资源及对这一品种进行保护,我国学者和研究人员开展了一系列的遗传选育研究工作。例如,在选育过程中计算各世代的近交系数,结合仔猪生长性能和母猪繁殖性能的变异系数掌握近交程度,可以防止出现近交衰退,提高选育速度,加速深县猪遗传进展,使群体中的优良基因迅速纯合,并淘汰掉不利基因,从而达到亲本优良性状稳定遗传给下一代的选育效果[1];利用微卫星位点标记分析深县猪群体遗传多样性,并计算各家系在微卫星位点标记上的标准遗传距离,为分析育种改良潜力奠定基础[2-3]。随着单核苷酸多态性(SNP)芯片和全基因组重测序技术的快速发展,从分子层面揭示畜禽遗传多样性的研究日益普遍。有研究表明,中国南方猪与北方猪的表型特征也存在较大差异[4],同时与深县猪选择信号检测的相关研究相对匮乏,因此需要进一步研究。本文通过对深县猪进行全基因组选择信号分析,并与南方太湖猪的一个品系——梅山猪对比,探究深县猪的分子遗传特点,为深县猪的保种选育工作提供生物信息学参考。

1 材料与方法

1.1 实验材料 本研究所用深县猪来自河北正农牧业有限公司深县猪保种场。随机选取10 头35 日龄以上的断奶仔猪,断奶体重8 kg 左右,对猪耳组织剪毛并用75%酒精消毒,使用耳标钳采集约100 mg 的耳组织样本,样本保存于装有95%酒精的EP 管中,使用冰袋运输带回实验室,保存在-20℃冰箱中备用。

1.2 实验方法

1.2.1 DNA 提取及重测序 将深县猪耳组织样品送到北京康普森生物技术有限公司进行全基因重测序。基于Illumina 技术测序平台,利用双末端测序(Paired-END)的方法,测序策略采用Illumina PE150,完成10 个深县猪DNA 样品的全基因组重测序。

1.2.2 选择信号检测 在全基因组范围内进行选择性消除分析,采用群体分化指数(Fst)和核酸多样性(θπ)相结合的检测策略,取共同鉴定到的区域作为候选的受选择区域,并提取相应区域内的变异位点信息。采用滑动窗口法进行Fst 的计算。利用R 语言计算出深县猪每个SNP 位点与梅山猪相对应的SNP 位点的Fst 值,然后通过使用窗口大小100 000 bp、步长10 000 bp 的滑动窗口计算出每个窗口内所有SNP 位点Fst 值的总和,除以每个窗口内的SNP 数量,得到每个窗口的平均Fst值,之后将深县猪与梅山猪相对应的窗口平均Fst 值进行比较,将差异最大和最小的Fst 值分别作为maxFst和minFst,从而确定深县猪分化差异明显的染色体区段。计算公式如下:

采用滑动窗口法对每个群体分别进行θπ 值的计算,然后计算2 个群体θπ 的比率(θπ Ratio)。公式如下:

1.2.3 候选位点基因注释及功能富集分析 从Ensembl数据库中下载目标物种基因注释文件,将筛选出的受选择位点定位到基因。使用DAVID 在线生物信息网站[5]进一步对基因进行基因本体(Gene Ontology,GO)功能富集及京都基因与基因组百科全书(Kyoto Encycloprdia of Genes and Genomes Pathway,KEGG)通路富集分析。

2 结果与分析

2.1 全基因组重测序 本研究基于全基因组重测序技术对10 头深县猪进行了测定分析,获得了测序深度达10倍、有效数据总量为280G 的全基因组重测序数据,平均86% 以上的数据能够比对到参考基因组。测序质量Q20 ≥95.42%,Q30 ≥89.46%,GC含量在42.10% 和42.96% 之间,没有发生碱基分离的现象(表1)。10头梅山猪全基因组重测序数据从NCBI 数据库中的SRA数据库(http://www.ncbi.nhm.nih.gov/sra)中下载。

表1 深县猪全基因组重测序数据

2.2 SNP 变异检测结果 深县猪共检测到28 169 424 个SNPs 位点,通过Annovar 软件进行注释,得到深县猪SNP 所在基因区域及类型统计结果如下:基因上游1 kb区域和下游1 kb 区域SNP 含量分别为0.75%和0.87%,基因间区域SNP 含量为45.84%,外显子和内含子SNP含量分别为0.85%和51.69%。梅山猪(MS)共检测到5 529 160 个SNPs 位点,其中基因上游1 kb 区域和下游1 kb 区域SNP 含量分别为0.49% 和0.70%,基因间区域含量为43.21%,外显子和内含子平均含量分别为1.05%和52.24%。将深县猪和梅山猪测得的SNP 在基因组区域分布绘制成群体特异SNPs 分布图(图1),可以发现多数SNP 位点位于基因的非编码区,即基因间区域和内含子,位于基因编码区外显子的SNP 仅占1%左右。进一步统计了高质量多态性SNP 标记在染色体上的数量和密度分布。结果表明,SNP 标记覆盖11 条染色体,并且在染色体上的分布并不均匀。相对于梅山猪,深县猪独有的变异位点有21 602 538 个,并且15号染色体上的选择变异较多(图2)。

2.3 选择信号检测与候选基因筛选 筛选同时出现在Fst 滑窗分析1% 的窗口和θπ Ratio 分析TOP 1% 中的位点(图3、图4),共获得580 个高质量的多态性SNP,定位于23 个基因,筛选出强选择信号基因7 个,基因功能涉及生殖、钙信号转导、脂质代谢、免疫等方面(表2)。

图3 Fst 曼哈顿图

图4 θπ 曼哈顿图

表2 深县猪群体信号选择区域

2.4 候选基因GO 和KEGG 分析 对候选基因进行GO富集分析,结果表明:候选基因富集到分子功能、细胞组分和生物过程3 大类,共182 条GO 条目。选取显著富集(P<0.05)的条目作图发现,富集到分子功能、细胞组分和生物过程的条目分别有3、8 条和10 条(图5),涉及到的基因有CPEB2、EIF3A、PDLIM3、SNX10。

图5 GO 富集分析图

对候选基因进行KEGG 通路富集分析,结果表明:候选基因富集到的KEGG 通路有53 条,其中显著富集的通路有16 条,涉及到的基因有ADCY8、CPEB2、MS4A2、TACR1(表3)。其中ADCY8、CPEB2、TACR1基因极显著富集到与繁殖性能相关的通路(P<0.01)。

表3 KEGG 富集分析

3 讨 论

遗传分化是生物长期进化的产物,Wright 认为当0<Fst<0.05 时,表明群体间遗传分化程度很小[6]。本研究中,深县猪和梅山猪的平均Fst 值为0.174 6,说明深县猪和梅山猪之间的遗传分化程度较高。由于所受选择强度和选择方向不同,主要在外貌特征和生产性能上表现出较大的遗传差异。在23 个候选基因中,有7 个与肉质、繁殖和免疫性状相关,说明在品种选育过程中,相对于梅山猪,深县猪在肉质、繁殖及免疫性状上经历了人工选择。

已有研究能将肉质性状的QTL 进行定位,并找到相关连锁的SNP 进行标记[7-9],关于猪肉质性状的QTL更多定位于15 号染色体上[10-11]。本研究基于全基因组重测序技术对深县猪进行选择信号分析,获得的SNP在染色体上的数量和密度分布并不均一,与梅山猪对比发现,PDLIM3基因的突变位点最多。PDLIM3即PDZ和LIM 结构域蛋白3(PDZ And LIM Domain 3),也称为ALP,是一种肌节基因[12],定位于15 号染色体。Wang 等[13]人通过构建猪PDLIM3 蛋白的3 种不同亚型的过表达载体,发现猪PDLIM3 蛋白在猪肌纤维生长和发育中发挥作用。SNX10 是一种磷酸磷脂酰肌醇3-磷酸结合蛋白,在脂质代谢中起着关键作用。研究表明,深县猪拥有优良的肉质性状[14],结合本文研究结果不难推测,这可能与深县猪PDLIM3和SNX10的突变有关。

繁殖性状属于猪生产上的重要性状之一,与经济效益密切相关,但深县猪繁殖性能总体上遗传稳定性较差,繁殖性状又大多受数量性状基因控制,但目前的SNP 芯片技术不足以进行猪数量性状的定位研究。本研究通过选择信号检测,筛选出与繁殖性能相关的候选基因:CPEB2、TACR1、ADCY8,揭示了深县猪繁殖性状的分子调控机制。CPEB2是CPEB 蛋白家族的新成员,作为卵子发生和精子发生中的转录因子,在配子发生过程中,通过细胞质聚腺苷酸化控制特定mRNA 翻译,从而发挥基本作用[15]。CPEB2基因突变在深县猪上受到选择,可能对提高受精率有重大意义。TACR1是一种蛋白质编码基因,其编码的NK1R 蛋白是TAC1的受体之一,而TAC 通过下丘脑-垂体-性腺轴调节动物卵巢排卵和妊娠等生殖过程[16],本研究中TACR1基因显著富集到钙离子信号通路(Calcium Signaling Pathway)上,已有研究表明钙离子信号通路在山羊繁殖过程中发挥着重要作用[17],因此可以推测TACR1基因通过参与钙离子信号通路影响深县猪的繁殖过程。ADCY8基因参与雌激素信号通路[18],它受雌激素受体和雌激素的正向调节,而雌激素能够有效刺激乳腺细胞生长发育[19]。Zhang 等[20]研究推测ADCY8在子宫内膜接受能力中发挥着重要作用,可能会提高子宫内膜的接受能力,促进胎儿着床。深县母猪窝产仔数高以及高泌乳力可能与ADCY8基因受到选择有关。

本研究筛选出了与免疫性状相关的基因:EIF3A和MS4A2。先前的研究表明EIF3A是管家基因,但最近的研究发现EIF3A与肿瘤癌症发生和耐药性密切相关[21-23]。MS4A2基因参与的信号转导途径有免疫应答FcεRI 途径和鞘磷脂信号传导途径,研究证实与哮喘病密切相关[24-25]。相对于梅山猪,这2 种基因在深县猪上受到选择,或许对培养环境适应能力至关重要。

4 结 论

本研究利用深县猪和梅山猪2 个群体的全基因组重测序数据对深县猪进行群体选择信号分析,检测到受选择区域580 个,落入这些区域的候选基因有23 个,选择信号较强的基因有7 个,分别富集到生殖、细胞作用、代谢及免疫相关的通路上。本研究结果表明,相对于梅山猪,深县猪在肉质、繁殖及免疫性状上经历了人工选择,这为深县猪的遗传选育工作提供了新思路。

致谢:感谢河北省生猪产业技术创新体系项目的资助,感谢河北正农牧业有限公司提供的研究样本,也感谢工作人员帮助收集样品。感谢实验室每一位成员的辛苦付出。

猜你喜欢

梅山位点基因组
Pd改性多活性位点催化剂NH3-SCR脱硝反应机理研究
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
处方分析在中药房药学服务中的应用
梅山民歌的地域文化简析*
第一代基因组设计的杂交马铃薯问世
牛参考基因组中发现被忽视基因
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
基因型和表现型的快速判断法
一种改进的多聚腺苷酸化位点提取方法