基于全基因组重测序的大豆分子标记开发及籽粒蛋白质含量QTL定位

2019-08-27王嘉曾召琼梁建秋于晓波吴海英张明荣

中国农业科学 2019年16期

王嘉，曾召琼，梁建秋，于晓波，吴海英，张明荣

王嘉，曾召琼，梁建秋，于晓波，吴海英，张明荣

（四川省南充市农业科学院大豆研究所/国家大豆产业技术体系南充综合试验站，四川南充 637000）

【】基于全基因组重测序结果，开发与高蛋白、耐荫、抗倒伏等性状紧密相关的分子标记，同时利用开发的分子标记构建遗传连锁图谱，并对籽粒蛋白质含量进行QTL定位，为后续高蛋白、耐荫、抗倒育种研究提供参考和分子标记资源。【】以大面积栽培品种南豆12和地方品种十月黄为亲本，构建F2分离群体。对亲本材料进行覆盖度约为40×的全基因组重测序，用BWA、GATK及Breakdancer等软件比对，检测亲本材料在全基因组范围内的突变类型，挖掘相关变异基因。结合种子不同发育时期和荫蔽处理获得的转录组数据，结合qRT-PCR对发生突变的储藏蛋白、环境适应相关基因进行表达规律分析。同时，基于重测序数据，挖掘亲本间存在于基因编码区的SNP位点，对其进行酶切位点分析，将SNP标记转化为CAPS或dCAPS标记。此外，搜索亲本间存在的插入/缺失变异位点，在插入/缺失位点两侧高度保守的区域设计引物开发InDel标记。对开发的CAPS标记和InDel标记进行多态性筛选，选取具有多态性的CAPS分子标记和InDel标记，对F2材料进行基因分型。根据分型结果，利用JoinMap 4.0软件进行遗传连锁图谱的构建。依据构建的遗传图谱，结合近红外分析获得F2材料的籽粒蛋白质含量数据，使用Windows QTL Cartographer V2.5软件对大豆籽粒蛋白质含量进行QTL分析。【】测序结果显示，南豆12大量储藏蛋白、环境适应相关的重要基因或同源基因发生突变。转录组数据分析结果显示部分变异基因呈现不同的表达模式且差异显著，qRT-PCR分析进一步验证了该结果。此外，经检测开发的540个CAPS分子标记中有332个具有酶切多态性，300对InDel引物中有201对引物能扩增出多态性。基于533个多态性分子标记构建了一张包含20个连锁群的遗传连锁图谱，覆盖长度2 973.87 cM，标记间平均遗传距离5.58 cM。利用此图谱对大豆籽粒蛋白质含量进行QTL定位，共检测到QTL位点6个，可解释4.68%—18.25%的表型变异。【】基于亲本间的变异位点，共开发了533个多态性分子标记（包含8个基因特异性分子标记），检测到6个大豆籽粒蛋白质含量QTL位点，其中，主效QTL位点1个（）。

大豆；全基因组重测序；套作；高蛋白；耐荫；抗倒伏；分子标记

0 引言

【研究意义】大豆是中国重要的粮油饲兼用作物，在国民经济中占有重要地位。南方地区是中国大豆第三大主产区，同时也是重要的高蛋白生态区，常年种植面积200万hm2，种植方式以与玉米、果树等高大作物套作为主[1-3]。玉米-大豆带状复合种植模式作为南方旱地农业的一种主体模式，在不影响玉米产量的同时增加大豆种植面积和产量，对保障区域及国家粮食安全具有重要意义[4-5]。在玉米-大豆套作模式中，玉豆共生期50—60 d，大豆作为矮秆作物，共生期间会受到玉米的严重荫蔽影响，这就要求大豆耐荫性好、抗倒力强[6]。因此，结合高蛋白生态优势，培育高产、耐荫、抗倒伏等优良特性的大豆品种，提高大豆生产潜力，提升大豆品种竞争力对改善中国大豆产业现状至关重要。然而传统的育种方法需要10—15年才能培育出一个大豆新品种，既费时又费力[7]。近年来，随着现代分子生物学的迅猛发展对作物遗传育种产生了极其深远的影响，特别是分子标记辅助选择技术克服了常规育种周期长、预见性差、选择效率低的局限性。随着大豆基因组测序的完成以及高通量测序技术的快速发展，使得基因组范围内进行遗传分析成为可能，为功能性分子标记的开发提供了支撑。【前人研究进展】基于高通量重测序技术进行遗传分析已经在玉米[8-10]、水稻[11-13]、谷子[14-15]、油菜[16]、番茄[17]、辣椒[18]等作物中得到了广泛应用。束永俊等[19]基于大豆基因组重测序数据，共设计163对引物，其中73对引物的PCR产物具有酶切多态性，开发出CAPS标记73个，这73个CAPS标记靶向的基因与大豆重要农艺性状的形成相关。Song等[20]对荷豆12进行全基因组重测序，共检测到49 276个小片段插入/缺失位点（insertion/deletion，InDel）和242 059单核苷酸多态位点（single nucleotide polymorphisms，SNP）。基于突变位点，开发了243个InDel标记，其中165个在荷豆12和Williams 82之间存在多态性，多态性率68%。为检测这些InDel标记的效能，构建了一个皱叶突变体的遗传图谱，并成功将CRINKLY LEAF位点定位到第7染色体上一个360 kb的区域内。在大豆籽粒蛋白质含量QTL定位方面，自1992年Diers等[21]发展关于大豆蛋白含量QTL定位研究后，大量大豆蛋白含量相关QTL位点被报道。截止目前，美国农业部大豆种质资源数据库（SoyBase，http://www.soybase.org）收录了多达303个蛋白含量相关的QTL，其中，利用连锁分析检测到241个，利用关联分析检测到62个。对这些QTL分析发现，大豆蛋白质含量在遗传背景不同的群体中检测到的QTL数量有差异，QTL所在的连锁群或连锁区域也存在差异。连锁分析和关联分析均显示在第20染色体（I连锁群）检测到大豆籽粒蛋白质含量QTL的频率最高，其中，A688-Satt239在多个环境和多个遗传群体中均检测到，可能是一个比较稳定的大豆籽粒蛋白质含量QTL区段，且在该区段上预测了一些大豆籽粒蛋白质含量相关的候选基因[22]。其次，第15染色体（E连锁群）和第6染色体（C2连锁群）也分别存在一个多次检测到的QTL区段。【本研究切入点】目前，针对大豆籽粒蛋白质含量等性状的遗传规律，前人已开展了大量研究并取得较大进展。但前人研究所用的高蛋白亲本材料蛋白质含量普遍集中在45%—50%，鲜有超过50%的育成品种作亲本，且构建遗传群体的亲本表型差异较小。【拟解决的关键问题】本研究通过南豆12进行全基因组重测序，深度挖掘南豆12全基因组突变类型。针对其超高蛋白、耐荫、抗倒伏等优良特性分析相关变异基因及其表达模式，开发特异性分子标记，对籽粒蛋白质进行QTL定位分析，为后续高蛋白、耐荫、抗倒育种研究提供参考和分子标记资源。

1 材料与方法

1.1 供试材料及性状考察

母本南豆12是南充市农业科学院育成的大豆品种，该品种籽粒蛋白质含量为51.79%，蛋脂和为69.42%，具有耐荫性好、抗倒力强、抗病毒病等优良特性，适宜与玉米间、套种植[23-25]。该品种于2009—2015连续7年被列为农业部主导品种和四川省主导品种，成为川渝地区大面积间套作当家品种和重要骨干亲本。父本为地方品种十月黄，该品种籽粒蛋白质质含量为40.50%，耐荫性差，极易倒伏。两亲本杂交获得F1植株，F1自交获得672个单株组成的F2分离群体。栽培大豆测序品种Williams 82由南京农业大学馈赠，蛋白质含量为39.5%，套作下重倒。所有材料均种植于南充市农业科学院潆溪试验基地，田间管理同常规生产，确保所有样本的外部生长环境一致。成熟后单株收获、脱粒，自然风干后使用近红外品质分析仪测定籽粒蛋白质含量。

1.2 DNA提取、重测序及基因组变异检测与注释及变异基因分析

待材料第一片三出复叶全展时，分别采集所有材料中间小叶，采用改良的CTAB法[26]提取叶片总DNA。质检合格的南豆12和十月黄的DNA，分别随机选取5株混样送至华大基因研究院，在Illumina HiSeq 2500测序平台下，进行深度为40×的基因组重测序。其余材料DNA-20℃保存备用。

以Glyma.Wm82.a2v1作为参考基因组[27]，应用BWA软件将质控后的测序数据比对到参考基因组上[28]。GATK（https://www.broadinstitute.org/gatk/）被用于检测SNP和InDel[29]，Breakdancer（http:// breakdancer.sourceforge.net/）被用于检测SV[30]，基于SOAP比对结果，计算基因组上各个位置间测序深度，并对各个位置的深度进行标准化，从而计算出基因组上各个位置的拷贝数变异值。应用BGI自主开发的软件对检测结果进行注释和统计。

1.3 转录组数据分析及qRT-PCR

提取南豆12花后14、21、28和35 d的种子RNA，每个时期3株等量混匀，送至公司进行转录组测序，3个生物学重复。荫蔽处理转录组数据来自Gong等[31]研究结果，分别选取遮阴和对照处理的成熟叶和嫩叶进行转录组测序。选取10个重测序挖掘的高蛋白、耐荫等相关且差异表达的变异基因进行qRT-PCR验证，qRT-PCR所用引物见表1。qRT-PCR分析使用一步法qRT-PCR试剂盒（One Step qRT-PCR Kit），反应体系为10 μL 2×one step qRT-PCR Master Mix、0.4 μL Primer F（10 μmol·L-1）、0.4 μL Primer R（10 μmol·L-1）、0.65 μL RT enzyme Mix和0.1—100 ng RNA Template，添加ddH2O至20 μL。qRT-PCR反应程序为50℃反转录5 min，95℃ 3 min；95℃ 10 s，60℃ 30 s，40个循环；以为内参，以65—95℃作产物溶解曲线，每个qRT-PCR反应设3次生物学重复。

1.4 CAPS标记和InDel标记开发

根据比对结果，提取非同义突变SNP位点两端各1 000 bp序列，利用NEBcutter V2.0（http://nc2.neb.com/ NEBcutter2/index.php）进行限制性内切酶识别位点分析，选取对酶切位点产生影响的SNP，利用Primer 5在该SNP的旁侧序列上设计引物开发CAPS标记。若SNP处无酶切位点，利用dCAPS Finder 2.0开发dCAPS标记[32]。参照New England Biolabs（NEB）公司的限制性内切酶操作指南，用限制性内切酶酶切PCR扩增的目标基因片段。酶切反应体系包含2 μL限制性内切酶（10 U·μL−1）、2 μL buffer和10 μL PCR扩增产物，18 μL无核酸酶水。37℃恒温水浴2 h，用2%琼脂糖凝胶电泳检测标记多态性。

表1 qRT-PCR验证基因引物信息

InDel标记选取发生在CDS区域上的InDel位点进行引物设计，为后续检测方便，以差异碱基数10个以上，且两侧高度保守为理想的InDel设计区。提取InDel位点两端各500 bp序列，使用Primer 5软件设计引物。所有引物由生工生物工程（上海）股份有限公司合成。

1.5 遗传连锁图谱构建及QTL分析

采用JoinMap 4.0软件构建遗传连锁图谱，在重组率＜0.1情况下对标记进行分群，采用极大似然函数值作为标记排序的目标函数，用Kosambi作图函数将重组率转换为遗传距离。采用QTL分析软件Windows QTL Cartographer 2.5及复合区间作图（composite interval mapping，CIM）法对籽粒蛋白质含量进行QTL定位及效应检测[33]。LOD≥2.0时，即认为该区间可能存在一个QTL。运行软件后可同时给出各QTL的加性效应和解释的表型变异。

2 结果

2.1 南豆12全基因组重测序结果及变异基因分析

测序结果显示，DNA文库共获得199.35 M个原始reads。去除带接头的或低质量的reads后得到169 072 750（84.82%）个Clean reads，定位到参考基因组的Clean reads数占比95.73%，正确识别率大于Q30的碱基占比89.52%以上，基因组GC含量39.27%，样品平均覆盖深度55×。根据Clean reads在参考基因组的定位结果进行变异检测，共得到2 453 344个SNP，476 953个Small Indel，20 085个SV以及12 605个CNV（图1-a）。通过寻找参考基因组与南豆12基因组间的各种变异，发现与Williams 82相比，南豆12基因组共存在38 896个基因变异，其中14 491个基因存在2种或2种以上类型的突变，318个基因同时存在4种类型的变异（图1-b）。KOG分析结果表明，信号传导机制，功能预测，翻译后修饰、蛋白折叠和伴侣蛋白，转录，碳水化合物转运与代谢，氨基酸转运与代谢以及次生代谢产物的生物合成、转运和分解等7个功能类存在较多的变异基因，其中，信号传导机制类变异基因2 630个，氨基酸转运与代谢类变异基因713个，次生代谢产物的生物合成、转运和分解类变异基因807个（图1-c）。KEGG分析结果表明，植物激素信号传导存在1 301个变异基因，内质网蛋白质加工存在839个变异基因，其他次生代谢产物的生物合成存在485个变异基因，环境适应存在375个变异基因（图1-d）。

2.2 南豆12和十月黄相关性状等位基因的比较分析

为了鉴定南豆12和十月黄中存在的关于高蛋白、耐荫、抗倒伏等性状丰富的等位基因信息，对其基因型进行了比较。基于全基因组重测序数据，两亲本间共检测到9 705个SNP位点和796个InDel位点。进一步分析位于基因区域内可能介导功能变异的SNP发现，1 658个SNP出现在编码区，其中，595个出现在CDS区的SNP，导致263个基因因非同义替换事件而出现蛋白序列差异。根据发生非同义替换的SNP数目，分析发生非同义替换最多的前10个基因发现（表2），存在的非同义替换SNP位点最多，其基因内存在72个SNP位点，31个位于CDS区域的SNP中有20个为非同义替换。属于ABI3-like转录因子家族成员，且大豆ABI3-like转录因子通过与贮藏蛋白基因启动子中的RY重复元件结合并促进贮藏蛋白基因的表达[34]，ABI3-like转录因子对大豆蛋白质的积累具有重要作用。（）为大豆球蛋白基因家族成员之一，编码一个11S球蛋白亚基，在种子形成的胚乳期大量表达，其变异会影响大豆种子贮藏蛋白的积累[35]。比较发现，存在46个SNP，33个位于CDS区域的SNP中18个属于非同义替换。其余含有较多非同义替换SNP的基因功能主要涉及荫蔽反应、储藏蛋白合成及运输以及形态建成等。

a：南豆12全基因组注释结果；b：4种变异类型的基因韦恩图；c：变异基因COG注释分类图；d：变异基因KEGG注释图

a: Whole genome annotation results of Nandou 12; b: Diagram of gene variations identified in four variations on Nandou 12 coding region; c: Classification of gene variations compared with COG database by blast; d: Classification of gene variations compared with KEGG database by blast

图1 南豆12全基因组注释结果

Fig. 1 Whole genome annotation results of Nandou 12

2.3 变异基因表达模式分析及qRT-PCR验证

基于南豆12和十月黄重测序结果，结合转录数据对发生变异的储藏蛋白合成及运输、荫蔽反应及形态建成和抗倒伏相关性状的基因进行表达模式分析。结果发现，在大豆籽粒发育过程中，相关基因呈现不同的表达模式，跟储藏蛋白合成相关的基因如（）、（）、（）等基因在花后14—28 d一直处于较低表达水平，到花后35 d时表达量急剧上升（图2-a）。在荫蔽调节方面，参与荫蔽调节的相关基因在成熟叶与嫩叶中的表达水平呈现明显的差异，例如参与叶片发育的基因（）在成熟叶中，对照和遮阴处理下表达水平均较低，而在嫩叶中表达水平升高。此外，部分基因如、、等无论在成熟叶还是嫩叶中，遮阴处理下的表达水平均高于对照，表明这些基因可能参与荫蔽条件的响应（图2-b）。

表2 南豆12和十月黄之间出现非同义替换最多的前10个基因

随机挑选其中10个差异表达的变异基因进行qRT-PCR验证（5个储藏蛋白相关基因，5个荫蔽调节相关基因）。qRT-PCR分析结果显示5个上调表达基因的表达趋势均与转录组测序结果相符合，5个下调表达基因也与转录组测序结果基本一致（图2-c和图2-d），说明转录组测序的结果具有较高的准确性。

2.4 CAPS标记和InDel标记开发及多态性分析

在重测序基础上，经10种限制性内切酶（ⅠⅡ、NⅠ、Ⅰ、RⅠ、HⅠ、dⅢ、Ⅰ、Ⅰ和Ⅰ）酶切位点分析后，在两亲本材料中共获得540个均匀分布在全基因组上的CAPS/dCAPS标记位点。利用亲本和F2群体进行CAPS/dCAPS引物多态性筛选，获得332对多态引物，多态性率61.48%。其中，有7对多态性引物分别靶向、、、、等功能基因（图3-a和图3-b）。通过搜索InDel位点，根据其在基因组上的分布，筛选并设计300对代表性InDel引物。利用南豆12、十月黄和F2群体对InDel引物多态性进行筛选，获得201对多态引物，占总设计数比例为67.0%。其中，GmIn113靶向调节避荫反应的基因（图3-c和图3-d）。

2.5 遗传图谱构建及QTL分析

采用JoinMap 4.0软件对533个多态性标记进行连锁分析，构建了一张包含332个CAPS/dCAPS标记、201个InDel标记、20个连锁群（分别对应于大豆20条染色体）的大豆遗传连锁图谱，覆盖基因组长度2 973.87 cM，标记间的平均遗传距离为5.58 cM，各连锁群长度从83.69 cM（C2）到194.50 cM（C1）（数据未发表）。

a：籽粒发育时期蛋白合成与积累相关基因表达热图；b：遮阴处理下荫蔽调节相关基因在成熟叶和嫩叶中的表达模式图；c、d：随机挑选的变异基因的qRT-PCR验证

a: Expression heatmap of related to protein synthesis and accumulation gene during seed development; b: Expression pattern of shade regulation related genes in mature and young leaves under shading treatment; c, d: validation of transcriptome sequencing data by qRT-PCR

图2 变异基因表达热图及转录组测序数据的qRT-PCR验证

Fig. 2 Expression heatmap of mutant genes and validation of transcriptome sequencing data by qRT-PCR

对亲本及F2的籽粒蛋白质含量分析发现，粗蛋白含量在F2群体中均呈连续分布和双向超亲分离，基本符合正态分布，可以进行QTL分析（表3）。利用Windows QTL CartographerV 2.5复合区间作图法对F2群体的籽粒蛋白质含量进行QTL分析，共检测到与籽粒蛋白质含量相关的QTL位点6个，分别分布在C2、E、I和M4条连锁群上（表4和图4），其中在I连锁群上（第20染色体）检测到2个QTL位点，位于35.61 cM处的QTL加性效应为-0.47，可解释9.32%的表型变异。位于103.41 cM处的QTL加性效应为-0.68，可解释18.25%的表型变异，为主效QTL位点。

表3 亲本及F2群体籽粒蛋白质含量表型分析

a：靶向Gy1含限制性酶切位点BanⅡ的SNP部分序列比对结果。线条代表标注出的限制性内切酶识别位点，箭头代表酶切位点；b：南豆12和十月黄中BBX21包含InDel的部分序列比对结果；c：靶向Gy1的CAPS标记酶切检测结果；d：靶向BBX21的InDel标记的琼脂糖凝胶电泳结果。S：Shiyuehuang，N：南豆12，1—10：部分F2材料

表4 利用复合区间作图法检测到的籽粒蛋白质含量QTL

3 讨论

3.1 大豆籽粒蛋白质含量的QTL分析

由于大豆种子含有约40%的蛋白质，全世界71%的膳食消费依赖于大豆，且这一比例还在逐年上升[36]。因此，通过遗传改良提高大豆籽粒蛋白质含量是大豆重要的育种目标之一。研究表明，大豆蛋白质含量是以加性效应为主的数量性状，受微效多基因控制，且存在基因型与环境互作现象[37]。随着分子标记技术和统计方法的发展，基于连锁作图的QTL定位分析方法被广泛应用于解析动植物的复杂数量性状。近20年来，美国农业部大豆种质资源数据库（SoyBase, http://www.soybase.org）报道了大量与蛋白质含量相关的QTL。然而，这些QTL中仅有57个被验证[38]。虽然各个染色体上均检测到大量大豆蛋白含量相关的QTL，但是绝大多数位点检测的频率不高。这些QTL中大多数是利用F2、重组自交系（RIL）和回交自交系（BIL）群体检测到的，然而这些遗传群体大多来自表型差异较小的2个亲本，因此很难有效地检测影响相关性状表型差异显著比例的微效QTL[38]。除了受分析方法、遗传背景、群体大小、标记数目以及环境影响外，等位基因的分散导致不可能用单个群体检测到影响特定性状的所有QTL。因此，利用表现型差异较大的大豆品种构建相关性状的图谱群体是提高QTL鉴定准确性的前提[21]。此外，需要通过不同的试验来检测不同的QTL和QTL等位基因。在本研究中，以高蛋白品种南豆12为亲本，结合全基因组重测序和转录组测序，利用开发出的分子标记构建的遗传连锁图谱共检测到6个与大豆蛋白含量相关的QTL。其中，位于I连锁群上的主效QTL与前人利用多群体多环境检测到大豆籽粒蛋白质含量QTL置信区间重叠（数据来自SoyBase，http://www.soybase.org），进一步印证了该处可能是一个比较稳定的大豆籽粒蛋白质含量QTL区段，为下一步分子设计育种提供了有价值的参考。

SPC：籽粒蛋白含量seed protein content

3.2 可靠的标记资源是开展分子标记辅助选择育种的必要前提

随着现代分子生物学的快速发展，分子标记辅助选择日益成为作物改良过程中的一种重要辅助手段。分子标记也由过去基于基因组DNA随机开发的、位置不确定的DNA标记，向代表编码区序列的分子标记以及具有相应功能的功能标记转变[39]。同时，覆盖全基因组的丰富的分子标记是鉴定大豆相关性状主效QTL和候选基因的必要前提。目前，在植物育种中应用最广泛的是基于PCR技术的分子标记，如RAPD、SSR、SCAR以及ISSR等。Zeng等[40]利用SSR标记以及基于亲本间差异开发的分子标记，采取杂交、回交与分子标记定向选择等技术策略，成功将优质目标基因的优异等位聚合到受体材料，在高产的基础上，使稻米外观品质、蒸煮食味品质、口感和风味等方面均有显著改良。成功实现了“籼稻的产量，粳稻的品质”的理想目标。Zhang等[41]利用3个大豆蛋白质含量主效QTL的侧翼标记SSR和PAV标记，通过标记辅助亲本选择和标记辅助子代选择2个阶段进行标记辅助育种，在F2:5:6代获得了最高比原始亲本蛋白质含量高54.15%的材料。本研究开发的部分CAPS标记是由基因上的SNP位点转化来的，InDel标记更是直接来自基因编码区的插入/缺失变异，2种标记都保留了与目标基因直接连锁的特性，具有基因特异性。代表、和序列变异的CAPS标记与大豆种子储藏蛋白含量紧密连锁，代表序列变异的InDel标记则与耐荫密切相关。PCR扩增结果显示，这些标记在F2分离群体中存在明显的多态性。利用构建的遗传连锁图谱，结合籽粒蛋白质含量数据对这些标记的效能进行了验证，检测到的QTL位点与前人定位结果置信区间重叠。上述结果表明，本研究开发的部分标记，可为下一步分子设计育种提供可靠的标记资源。

3.3 中国大豆生产面临的现状及探讨

作为重要的植物蛋白质和食用油来源，中国对大豆的需求量逐年提高。2017年中国大豆总产量为1 450万t，而进口大豆高达9 554万t，自给率仅13.2%。受国内外环境影响，2018年中国大豆种植面积创下新高，但2018年大豆进口量仍高达8 803万t，国产大豆的发展形势依然严峻。西南、华南间套作食用大豆生产区被农业部《十二五种植业发展规划》列为全国大豆优势主产区。发展间套作大豆，不仅科学的解决了作物间争地、争肥、争劳动力的矛盾，同时具有显著的增产节肥增效增收优势，能够一定程度的缓解中国大豆供不应求的紧张局面。如何提高大豆耐荫抗倒性，筛选出适合玉豆带状套作种植的材料，是当下玉米大豆套作大豆研究的重点[42]。利用已有骨干亲本，解析其优异遗传背景，开发相关性状紧密连锁的分子标记，结合杂交、回交与分子标记定向选择等技术，将优质目标基因的优异等位聚合到受体材料，并充分保留原品种的优良特性。在保留原有优异特性的基础上，使大豆蛋白质含量、耐荫性、抗倒伏能力等方面均有显著改良。通过高效、精准、定向的分子设计育种是加快选育优良品种的有效途径。本研究对间套作育种的重要亲本南豆12进行遗传解析，发现大量储藏蛋白、环境适应相关的重要基因或同源基因发生突变，这些变异可能导致了相关基因的功能分化或不等量表达，进而塑造了南豆12的优良特性，变异基因的具体功能还需要下一步验证。但针对这些突变位点，开发在高产优质大豆品种选育中更有功效的标记，使基因选择与表型选择真正结合，加快育种进程，选育出适合南方地区间套作的优良品种，有助于加强中国大豆的市场竞争力。

4 结论

基于亲本间的变异位点，开发了533个分子标记，构建了一张长度为2 973.87 cM包含20个连锁群的遗传连锁图谱，QTL分析检测到大豆籽粒蛋白质含量QTL位点6个，其中主效QTL位点1个。

[1] 周新安, 年海, 杨文钰, 韩天富. 南方间套作大豆生产发展的现状与对策(Ⅰ). 大豆科技, 2010(3): 1-2.

ZHAOU X A, NIAN H, YANG W Y, HAN T F. Current situation and countermeasures of intercropping soybean production in the south (Ⅰ)., 2010(3): 1-2. (in Chinese)

[2] 周新安, 年海, 杨文钰, 韩天富. 南方间套作大豆生产发展的现状与对策(Ⅱ). 大豆科技, 2010(4): 1-3.

ZHOU X A, NIAN H, YANG W Y, HAN T F. Current situation and countermeasures of intercropping soybean production in the south (Ⅱ)., 2010(4): 1-3. (in Chinese)

[3] 周新安, 年海, 杨文钰, 韩天富. 南方间套作大豆生产发展的现状与对策(Ⅲ). 大豆科技, 2010(5): 1-2.

ZHOU X A, NIAN H, YANG W Y, HAN T F. Current situation and countermeasures of intercropping soybean production in the south (Ⅲ)., 2010(5): 1-2. (in Chinese)

[4] 刘广才. 不同间套作系统种间营养竞争的差异性及其机理研究[D]. 兰州: 甘肃农业大学, 2005.

Liu G C. Difference and its mechanism of interspecific nutrition competition in different intercropping systems[D]. Lanzhou: Gansu Agricultural University, 2005. (in Chinese)

[5] 杨文钰, 雍太文, 任万军, 樊高琼, 牟锦毅, 卢学兰. 发展套作大豆, 振兴大豆产业. 大豆科学, 2008, 27(1): 1-7.

YANG W Y, YONG T W, REN W J, FAN G Q, MOU J Y, LU X L. Develop relay-planting soybean, revitalize soybean industry., 2008, 27(1): 1-7. (in Chinese)

[6] YANG F, HUANG S, GAO R C, LIU W G, YONG T W, WANG X C, WU X L, YANG W Y. Growth of soybean seedlings in relay strip intercropping system in relation to light quantity and red: far-red ratio., 2014, 155(155): 245-253.

[7] 张彦威, 李伟, 张礼凤, 王彩洁, 戴海英, 徐冉. 基于重测序的大豆新品种齐黄34的全基因组变异挖掘. 中国油料作物学报, 2016, 38(2): 150-158.

ZHANG Y W, LI W, ZHANG L F, WANG C J, DAI H Y, XU Ｒ. Genome-wide variations of soybean cultivar Qihuang 34 by whole genome re-sequencing., 2016, 38(2): 150-158. (in Chinese)

[8] LAI J, LI R, XU X, JIN W, XU M, ZHAO H, XIANG Z, SONG W, YING K, ZHANG M, JIAO Y, NI P, ZHANG J, LI D, GUO X, YE K, JIAN M, WANG B, ZHENG H, LIANG H, ZHANG X, WANG S, CHEN S, LI J, FU Y, SPRINGER N M, YANG H, WANG J, DAI J, SCHNABLE P S, WANG J. Genome-wide patterns of genetic variation among elite maize inbred lines., 2010, 42(11): 1027-1030.

[9] 杜龙岗, 王美兴. 玉米SLAF标记的开发及其在玉米果皮纤维素含量BSA分析中的应用. 中国农业科学, 2018, 51(8): 1421-1430.

DU L G, WANG M X. SLAF-marker development and its application in BSA analysis of cellulose content in pericarp of maize kernel., 2018, 51(8): 1421-1430. (in Chinese)

[10] CHIA J M, SONG C, BRADBURY P J, COSTICH D, DE LEON N, DOEBLEY J, ELSHIRE R J, GAUT B, GELLER L, GLAUBITZ J C, GORE M, GUILL K E, HOLLAND J, HUFFORD M B, LAI J, LI M, LIU X, LU Y, MCCOMBIE R, NELSON R, POLAND J, PRASANNA B M, PYHAJARVI T, RONG T, SEKHON R S, SUN Q, TENAILLON M I, TIAN F, WANG J, XU X, ZHANG Z, KAEPPLER S M, ROSS-IBARRA J, MCMULLEN M D, BUCKLER E S, ZHANG G, XU Y, WARE D. Maize hap map2 identifies extant variation from a genome in flux.2012, 44(7): 803-807.

[11] TAKAGI H, ABE A, YOSHIDA K, KOSUGI S, NATSUME S, MITSUOKA C, UEMURA A, UTSUSHI H, TAMIRU M, TAKUNO S, INNAN H, CANO L M, KAMOUN S, TERAUCHI R. QTL-seq: rapid mapping of quantitative trait loci in rice by whole genome resequencing of DNA from two bulked populations., 2013, 74(1): 174-183.

[12] MUKESH J, KANHU C M, RAMA S, ROMIKA K, ROHINI G. Genome wide discovery of DNA polymorphisms in rice cultivars with contrasting drought and salinity stress response and their functional relevance., 2014, 12(2): 253-264.

[13] XU X, LIU X, GE S, JENSEN D J, HU F J, LI X, DONG Y, GUTENKUNST R N, FANG L, HUANG L, LI J X, HE W M, ZHANG G J, ZHENG X M, ZHANG F M, LI Y R, YU C, KRISTIANSEN K, ZHANG X Q, WANG J, WRIGHT M, MCCOUCH S, NIELSEN R, WANG J, WANG W. Resequencing 50 accessions of cultivated and wild rice yields markers for identifying agronomically important genes., 2012, 30(1): 105-111.

[14] BAI H, CAO Y G, QUAN J Z, DONG L, LI Z Y, ZHU Y B, ZHU L H, DONG Z P, LI D Y． Identifying the genome-wide sequence variations and developing new molecular markers for genetics research by re-sequencing a landrace cultivar of., 2013, 8(9): e73514.

[15] 赵庆英, 张瑞娟, 王瑞良,高建华, 韩渊怀, 杨致荣, 王兴春. 基于名优谷子品种晋谷21全基因组重测序的分子标记开发. 作物学报, 2018, 44(5): 686-696.

ZHAO Q Y, ZHANG R J, WANG R L, GAO J H, HAN Y H, YANG Z R, WANG X C. Genome-wide identification of molecular markers based on genomic re-sequencing of foxtail millet elite cultivar Jingu 21., 2018, 44(5): 686-696. (in Chinese)

[16] 岳晓鹏. 基于甘蓝型油菜基因组重测序开发InDel标记[D]. 武汉: 华中农业大学, 2014.

YUE X P. Development of Indel markers based on whole genome resequencing in[D]. Wuhan: Huazhong Agricultural University, 2014. (in Chinese)

[17] LIN T, ZHU G, ZHANG J, XU X, YU Q, ZHENG Z, ZHANG Z, LUN Y, LI S, WANG X, HUANG Z, LI J, ZHANG C, WANG T, ZHANG Y, WANG A, ZHANG Y, LIN K, LI C, XIONG G, XUE Y, MAZZUCATO A, CAUSSE M, FEI Z, GIOVANNONI J J, CHETELAT R T, ZAMIR D, STÄDLER T, LI J, YE Z, DU Y, HUANG S. Genomic analyses provide insights into the history of tomato breeding., 2014, 46(11): 1220-1226.

[18] KANG Y J, AHN Y K, KIM K T, JUN T H. Resequencing ofparental lines (YCM334 and Taean) for the genetic analysis of bacterial wilt resistance., 2016, 16(1): 235.

[19] 束永俊, 李勇, 柏锡, 才华, 纪巍, 朱延明. 基于基因重测序信息的大豆基因靶向CAPS标记开发. 作物学报, 2009, 35(11): 2015-2021.

SHU Y J, LI Y, BAI X, CAI H, JI W, ZHU Y M. Development of soybean gene-driven functional caps markers based on gene resequencing., 2009, 35(11): 2015-2021. (in Chinese)

[20] SONG X, WEI H, CHENG W, YANG S, ZHAO Y, LI X, LUO D, ZHANG H, FENG X. Development of INDEL markers for genetic mapping based on whole genome resequencing in soybean., 2015, 5(12): 2793- 2799.

[21] DIERS B W, KEIM P, FEHR W R, SHOEMAKER R C. RFLP analysis of soybean seed protein and oil content., 1992, 83: 608-612.

[22] 魏荷, 王金社, 卢为国. 大豆子粒蛋白质含量分子遗传研究进展. 中国油料作物学报, 2015, 37(3): 394-410.

WEI H, WANG J S, LU W G. Molecular genetics advances in soybean seed protein., 2015, 37(3): 394-410. (in Chinese)

[23] 颜彦, 周加权. 南豆12不同播期的产量效应初探. 种子科技, 2018, 36(1): 115-116.

YAN Y, ZHOU J Q. A preliminary study on the yield effect of different sowing dates of Nandou 12., 2018, 36(1): 115-116. (in Chinese)

[24] 罗玲, 于晓波, 万燕, 蒋涛, 杜俊波, 邹俊林, 杨文钰, 刘卫国. 套作大豆苗期倒伏与茎秆内源赤霉素代谢的关系. 中国农业科学, 2015, 48(13): 2528-2537.

LUO L, YU X B, WAN Y, JIANG T, DU J B, ZOU J L, YANG W Y, LIU W G. The relationship between lodging and stem endogenous gibberellins metabolism pathway of relay intercropping soybean at seedling stage., 2015, 48(13): 2528-2537. (in Chinese)

[25] 张明荣, 吴海英. 四川间套作大豆生产现状与发展分析. 中国种业, 2009, 10: 16-18.

ZHANG M R, WU H Y. Analysis of production status and development of relay cropping soybean in Sichuan., 2009, 10: 16-18. (in Chinese)

[26] STEWART C N J, VIA L E. A rapid CTAB DNA isolation technique useful for RAPD fingerprinting and other PCR applications., 1993, 14: 748-750.

[27] GRANT D, NELSON R T, CANNON S B, SHOEMAKER R C. SoyBase, the USDA-ARS soybean genetics and genomics database.2010, 38 (suppl. 1): 843-846.

[28] LI H, DURBIN R. Fast and accurate short read alignment with Burrows-Wheeler transform., 2009, 25: 1754-1760.

[29] MC K A, HANNA M, BANKS E, SIVACHENKO A, CIBULSKIS K, KERNYTSKY A, GARIMELLA K, ALTSHULER D, GABRIELS, D M, DEPRISTO M A. The genome analysis toolkit: a map reduces frame-work for analyzing next-generation DNA sequencing data., 2010, 20(9): 1297-1303.

[30] CHEN K, WALLIS J W, MCLELLAN M D, LARSON D E, KALICKI J M, POHL C S, MCGRATH S D, WENDL M C, ZHANG Q Y, Locke D P, Shi X q, Fulton R S,Ley T J, Wilson R K, Ding L, Mardis E R. BreakDancer: an algorithm for high- resolution mapping of genomic structural variation., 2009, 6(9): 677-681.

[31] GONG W Z, QI P, DU J B, SUN X, WU X L, SONG C, LIU W G, WU Y S, YU X B, YONG T W, WANG X C, YANG F, YAN Y H and YANG W Y. Transcriptome analysis of shade-induced inhibition on leaf size in relay intercropped soybean., 2014, 9(6): e98465.

[32] NEFF M M, TURK E, KALISHMAN M. Web-based primer design for single nucleotide polymorphism analysis., 2002, 18: 613-615.

[33] LANDER E S, BOTSTEIN D. Mapping mendelian factors underlying quantitative traits using RFLP linkage maps., 1989, 121: 185-199.

[34] DU R C, KHAN A, QIAO Y G, YI Y Y, WANG L, LIU X Y, LI H Q, WANG J S. Expression pattern of abscisic acid insensitive 3 & IT;(ABI3 & IT;) in: Soybean & IT;(Glycine max)& IT; and its interaction mechanism between storage protein gene promoter., 2018, 20(4): 833-838.

[35] 刘春, 王显生, 麻浩.大豆种子贮藏蛋白遗传改良研究进展. 大豆科学, 2008, 27(5): 866-873.

LIU C, WANG X S, MAO H. Genetic improvement on soybean seed storage proteins., 2008, 27(5): 866-873. (in Chinese)

[36] Van K, McHale L K. Meta-analyses of QTLs associated with protein and oil contents and compositions in soybean [(L.) Merr.] seed., 2017, 18(6): 1180.

[37] Mckendry A L, Mc Vetty P B, Voldeng H D. Inheritance of seed protein and seed oil content in early maturing soybean.1985, 27(5): 603-607.

[38] Karikari B, LI S G, Bhat J A, Cao Y G, Kong J J, Yang J Y, Gai J Y, Zhao T J. Genome-wide detection of major and epistatic effect QTLs for seed protein and oil content in soybean under multiple environments using high-density Bin map., 2019, 20(4): 979.

[39] JEONG S C, SAGHAI-MAROOF M A. Detection and genotyping of SNPs tightly linked to two disease resistance loci, Rsv1 and Rsv3, of soybean., 2004, 123(4): 305-310.

[40] Zeng D L, Tian Z X, Rao Y C, Dong G J, Yang Y L, Huang L C, Leng Y J, Xu J, Sun C, Zhang G G, Hu J, Zhu L, Gao Z Y, Hu X M, Guo L B, Xiong G S, Wang Y H, Li J Y, Qian Q. Rational design of high-yield and superior-quality rice., 2017, 3: 17031.

[41] Zhang Y H, Liu M F, He J B, Wang Y F, Xing G N, Li Y, Yang S P, Zhao T J, Gai J Y. Marker‑assisted breeding for transgressive seed protein content in soybean [(L.) Merr.]., 2015, 128(6): 1061-1072.

[42] 向达兵. 钾对套作大豆的抗倒伏效应与提高产量的机理研究[D]. 成都: 四川农业大学, 2012.

XIANG D B. Studies on effect and mechanism of potassium on lodging-resistance and yield improvement in relay strip intercropped soybean[D]. Chengdu: Sichuan Agricultural University, 2012. (in Chinese)

Development New Molecular Markers for Quantitative Trait Locus (QTL) Analysis of the Seed Protein Content Based on Whole Genome Re-sequencing in Soybean

WANG Jia, ZENG ZhaoQiong, LIANG JianQiu, YU XiaoBo, WU HaiYing, ZHANG MingRong

(Soybean Research Institute, Nanchong Academy of Agricultural Sciences/Nanchong comprehensive experimental station of National Soybean Industry Technology System, Nanchong 637000, Sichuan)

【】 Based on the results of genome-wide re-sequencing, molecular markers closely related to high protein, shade tolerance, lodging resistance and other traits were developed. At the same time, At the same time, genetic linkage maps were constructed using the developed molecular markers, and seed protein content was mapped by QTL, providing reference and molecular marker resources for subsequent research on high protein, shade tolerance and lodging resistance breeding. 【】 A F2segregating population derived from the cross of Nandou 12 and Shiyuehuang consists of 672 individuals， and two parents were re-sequenced. With the published genome as a reference, the obtained data were assembled with BWA, and explored for the SNP and InDel by GATK and SV by Breakdancer. Carry out expression pattern analysis toward mutational storage proteins and genes related to environmental adaptation by combining with the transcriptome data obtained from different development stages and shade processing of seeds and qRT-PCR, At the same time, based on the resequencing data, excavate the SNP sites in the gene coding region between the parents, analyze the restriction enzyme cutting site and transform the SNP markers into CAPS or dCAPS markers. In addition, search the insertion/deletion mutation site and design primer development InDel marker in highly conserved regions on both sides of the insertion/deletion site. Perform polymorphism screening on the CAPS markers and InDel markers developed, select the CAPS molecular markers and InDel markers with polymorphism and carry out genotyping toward F2materials. Utilize JoinMap 4.0 software to construct the genetic linkage map according to the genotyping result. Obtain the seed protein content data of F2 material according to the genetic map constructed by combining with the near-infrared analysis and use Windows QTL Cartographer V2.5 to carry out QTL analysis toward soybean seed protein content. 【】 The results showed that a large number of storage proteins and important genes or homologous genes related to environmental adaptation mutated in Nandou 12. The results of transcriptome data analysis showed that some variant genes showed different expression patterns and significant differences and the results were further validated by qRT-PCR analysis. In addition, 332 of the 540 CAPS molecular markers had polymorphic, and 201 of 300 pairs of InDel primers could amplify polymorphism. A genetic linkage map containing 20 linkage groups was constructed based on polymorphic molecular markers, covering 2973.87 cM with an average genetic distance of 5.58 cM. Using this map to map the seed protein content of soybean, six QTL loci were detected, which could explain 4.68%-18.25% phenotypic variation.【】 Based on the variation loci among parents, 533 polymorphic molecular markers (including 8 gene-specific molecular markers) were developed. Six QTL loci were detected for seed protein content in soybean, including one major QTL locus (qSPC-6).

soybean; whole genome re-sequencing; relay intercropping; high protein; shade tolerant; lodging resistance; molecular marker

2019-03-25；

2019-05-07

国家重点研发计划（2017YFD0101500）

王嘉，E-mail：wangjia0724@126.com。

张明荣，E-mail：zhangminron@126.com

（责任编辑李莉）