APP下载

利用芥菜转录组信息挖掘SSR标记及用于种质分析

2020-06-19李永平张双照薛珠政温庆放

福建农业学报 2020年2期
关键词:转录组芥菜多态性

李永平 张双照 薛珠政 温庆放

摘要:[目的]为开发高效的芥菜Brassicajuncea.分子标记。[方法]本研究通过对芥菜转录组测序的信息搜索SSR位点并分析其分布特点,应用Primer 3.0软件设计SSR引物,随机选择50对引物扩增44份芥菜种质,检测其多态性。[结果]芥菜转录组测序共获得55636条tmigene,全部序列有48193376bp;有7834条unigene包含SSR的序列,从中鉴定出9526个SSR位点,其中有1371条序列包含1个以上SSR,复合SSR有572个,SSR发生频率为14.08%。优势重复基序为三核苷酸和二核苷酸,分别占总SSR的51.12%和41.91%。二核苷酸重复基元中以AG/CT为优势重复基元,占总位点的34.74%,三核苷酸重复基元以AAG/CTT为主,占总位点的18.30%。共设计出21282对SSR引物,随机选择50对引物进行PCR扩增,其中41对扩增出清晰可重复的预期条带,17对(占34%)在44份芥菜种质中表现出多态性。应用UPGMA得到将44份供试材料分为4大类聚类图,可准确地体现了芥菜种质材料的关系。[结论]根据芥菜转录组数据能开发出类型丰富、效率较高的SSR标记,为芥菜亲缘关系分析和遗传图谱构建等提供更可靠的标记。

关键词:芥菜;转录组;SSR;多态性

中图分类号:S649文献标志码:A 文章编号:1008-0384(2020)02-0169-09

(研究意义)芥菜(Brassicajuncea)十字花科芸薹属植物,原产中国,并在中国发生丰富的变异和分化,全国有1000多份不同的芥菜品种。收集的种质资源混杂多样,因此对芥菜的种质资源的亲缘关系鉴定及分类意义重大,有利于提高芥菜种质的利用效率。(前人研究进展)目前对芥菜的起源进化、分类和遗传多样性已有研究。依据叶形态特征,如基生叶的裂刻、刺毛的有无、叶形的变化、茎与根的变异等,Vauzb8n等将芥菜划分了4个类群。孟秋峰等对17个芥菜变种植物学性状进行聚类,结果分为叶用芥菜、茎用芥菜、根用芥菜、薹用芥菜和籽用芥菜等5个类。(本研究切入点)微卫星序列(Simple sequence repeat,SSR)分子标记,在生物基因组中普遍存在,是一种可信赖的、使用方便分子标记之一,常用于作物遗传信息分析、品种鉴别、建立遗传图谱等。EST-SSR标记较基于基因组序列开发的SSR标记种间通用性更高,更经济方便。EST-SSR标记在辣椒、菜薹、菠菜、大白菜、甘蓝和洋葱等一些主要蔬菜作物中都有开发与应用,芥菜的EST-SSR标记开发利用未见报道。(拟解决的关键问题)本研究中应用转录组测序获得的数据进行SSR标记搜索,设计EST-SSR引物,评价引物的多态性效率,为芥菜种质遗传信息鉴定、遗传信息利用等开发可靠、高效的分子标记。

1 材料与方法

1.1转录组测序

测序材料“龙芥2号”于9月15日播种,lo月5日定植于福建省龙岩市新罗区龙门镇赤水村,11月5日,选取3株健康无病植株,每株选幼叶叶稍处取5g样品,液氮速冻,-80℃保存备用。广州基迪奥生物科技有限公司采用Illumina HiSeq TM 2500PEl25系统,设3个生物学重复进行转录组测序(无参),经过滤得到4.82G的有效RNA-seq数据。

1.2材料及其DNA提取

项目组收集的44份芥菜种质材料(表1)用于SSR引物筛选和有效性评价。供试材料基因组DNA用CTAB法提取。

1.3 SSR位点搜索及SSR引物设计

用MISA程序(http://pgrc.ikp-gatersleben.de/misa)对转录组的所有Unigene进行搜索,寻找Unigene中的SSR,搜索参数为二、三、四、五、六核苷酸重复次数分别大等于6、5、5、4和4次且2個SSR序列的距离不短于100bp;用Primer 3.0软件对每条SSR设计3对引物并评价。引物要求为:序列长度18~25bp,GC含量40%~60%,上、下游引物的Tm值≤2℃,预期扩增产物100~400bp,不产生二聚体。

1.4 SSR引物筛选

20uLPCR反应体系:lommol·L-1dNTPs0.4uL,5U Taq酶0.3uL,100ng DNA 1.0uL,10umol·L-1的上、下游引物各0.8uL,10× Buffer(Mg2+)2.0uL,ddH2O 14.7ul.PCR热程序如下:94℃5m;94℃30s,58℃30s,72℃ 30s,30个循环;72℃5min.PCR扩增产物琼脂糖凝胶电泳检测。

1.5 数据分析

SSR发生频率=SSR的unigene数量/总unigene数;SSR出现频率=SSR个数/总unigene数,SSR平均分布距离=unigene碱基数/SSR数。“1”:“0”法统计电泳数据,应用NTsys2.10e聚类分析。

2 结果与分析

2.1SSR的分布特征

芥菜转录组测序获得55636条unigene(总长约48193376bp),经MISA软件搜索发现9526个SSR位点发布于7834条unigene上。SSR发生频率14.08%,出现频率、17.12%,平均5.06kb有1个SSr.包含有二至六核苷酸重复类型,其中三核苷酸和二核苷酸重复是主要形式,分别占总SSR的51.12%与41.91%;其他3种苷酸重复类型数量较少共占总数的6.97%(表2)。

芥菜转录组SSR重复单元的重复次数最低4次,最高位42次,共有9241个SSR重复次数为4~10次,占总数的97.01%;285个SSR重复次数在11~42次,占总数的2.99%。芥菜转录组SSR的长度为12~324bp,主要集中于12~18bp,此长度间SSR达8230个,占总数的86.40%,长度大于18bp的SSR有1296个,只占13.60%。

2.2 转录组中SSR基序重复类型和频率特征

芥菜转录组的重复基序较为丰富,共有172种重复基序,分布见表3.AG/CT重复基序发生频率最高为34.74%,占二核苷酸重复的总数的82.89%;其次是AAG/CTT重复基序,发生频率为18.30%,占三核苷酸总数的35.79%。四核苷酸有25种重复基序、五核苷酸41重复基序、六核苷酸重复基序达92种,分布较散,发生的频率不高。

2.3 芥菜转录组SSR引物设计与筛选

遵照引物设计的标准,7834条含SSR位点的unigene序列,共设计得引物21282对。从不同核苷酸重复单元的引物中随机挑选50对,PCR扩增龙芥2号DNa.结果为50对引物均能扩增,其中4l对(82.00%)PCR扩增产物长度为100~400bp,9对(18%)扩增产物长度超400bp.

2.4多态性分析

用上述扩增产物与预期大小相符的41对引物扩增44份芥菜种质资源(图1),有17对(41.46%)引物具有特异性(表4)。17对多态性引物扩增46个多态性片段,平均每对引物扩增2.71个多态性片段。PIC值的大小代表多态性息的丰富程度,17对引物的PIC最高值达到0.82,平均值为0.60,仅BaSSR007、BaSSR043引物PIC值较低为0.43和0.47,表明这些17对芥菜SSR标记含有丰富的多态信息。17对多态性引物中二核苷、三核苷酸、五核苷重复的各4、6、3对,四核苷酸重复和六核苷酸重复的各2对。

对多态性SSR引物的扩增结果聚类分析,在遗传距离0.82处,44份芥菜种质材料被分成四大类(图2)。

第Ⅰ大类包括36个茎用、叶用芥菜材料;第Ⅱ大类包括5个结球芥材料:17、35、22、4l、43;第Ⅲ大类包括2个紫叶芥材料:2、42;第Ⅳ大类:薹芥品种38单独成类。第Ⅰ大类36个材料在遗传距离0.67处聚为4个亚类:(1)此亚类包含1、4、9、15、44、30、36、40、39、37、11等11个茎用材料和21、16、7、24、19、23、29、20、18等9个叶用材料;(2)含叶面有刺毛4个材料25、26、27、28;(3)此亚类包含5个株型半直立的材料32、31、12、33、34;(4)此亚类包含7个叶面平滑材料3、14、5、13、8、6、10.

3 讨论

高通量测序快速发展,EST数量得到迅速增加,为EST-SSR标记的开发应用提供了条件,许多植物的EST-SSR标记已被开发应用。芥菜EST-SSR标记的开发利用国内未见报道。本研究从芥菜的转录组测序结果的55636條unigene搜索获得7834条unigene序列共9526个SSR位点,SSR发生频率为14.08%,出现频率为17.12%。此结果较菠菜、洋葱、党参等4.33%~16,10%的频率范围略高,但低于菜薹19.26%和萝卜23.79%和的SSR位点频率。SSR发生频率与物种基因组差异、转录组测序的时期选择、获得数据量大小与质量、SSR搜索工具的选择及筛选的参数设置等因素密切相关。芥菜SSR含二、三、四、五、六核苷酸重复5种类型,以三核苷酸和二核苷酸重复为主要形式,分别占总SSR的51.12%与41.91%;四核苷酸、五核苷酸和六核苷酸重复类型数量较少,分别占总数的3.70%、1.40%和1.87%,与菜薹、芝麻、萝卜等作物的研究结果有所不同,这与SSR搜索参数设置有关。二、四和五核苷酸重复多在非翻译区(UTR),三、六核苷酸重复与编码序列(CDS)密切相关,芥菜三核苷酸重复SSR占绝对优势,说明芥菜转录组unigene中的CDS信息更丰富。AAG/CTT和AG/CT重复基序在众多基序占优势,与在大白菜、黄秋葵的结果一致。选取的50对SSR引物扩增‘龙芥2号DNA,9对(18%)引物扩增产物超预期,扩增不成功的因素可能是引物内含子在启动位点引起SNPS/InDel变异,或是组装错误。多态性引物占有效引物的41.46%,低于洋葱(45.00%),高于辣椒(36.84%)、菠菜(17.43.00%),说明所设计的芥菜SSR标记引物多态性较好。有研究认为,SSR标记的多态性可能与重复序列长度呈正相关,重复序列长于20bp的SSR,表现多态性的概率高;重复序列长度小于20bp的SSR呈多态性的可能性明显较低。本研究中17对多态性引物仅有2对来自于长度小于20bp重复序列。PIC值可用于衡量标记的多态信息,本研究中17对多态引物的平均PIC值为0.60,最低值0.43发生在重复序列最短序列的引物BaSSR007上,15对引物PIC值均大于0.5,结果说明本研究开发的芥菜EST-SSR有较高的多态性。

李宁等用SRAP标记将111份芥菜归为薹芥、叶用芥和茎用芥、紫叶芥和长柄芥5类,遗传相似系数为0.38~0.89,表明芥菜在分子水平上遗传多样性较丰富。本研究应用EST-SSR标记分类44份芥菜种质材料的结果与其相似,但与运用AFLP、RAPD、ISSRL等标记研究的结果不尽相同,这可能与不同分子标记所揭示的基因组片段的变异方式不同有关。

RAPD、ISSR、SRAP等标记技术均开发于无基因组(或转录组)序列信息,随机性强、稳定性差。EST-SSR来自基因的转录区并与功能基因紧密连锁,具有丰富多态性,较高灵敏度,可重复性强等优势。本研究利用基于芥菜转录组数据筛选得17对SSR引物,对44份芥菜种质材料进行遗传多样性分析,以遗传距离0.82为阈值,44份芥菜种质材料分为四大类,SRAP标记等无法将结球和不结球芥菜完全分开,而SSR标记可以准确分开,较ISSR、SRAP等标记的分析结果,SSR标记更准确地体现了芥菜种质材料的关系。

猜你喜欢

转录组芥菜多态性
APOE基因多态性与老年动脉粥样硬化性脑梗死严重程度及预后相关性分析
家乡的芥菜
基于转录组测序的山茱萸次生代谢生物合成相关基因的挖掘
金钗石斛转录组SSR位点信息分析
基因多态性与老年高血压的研究进展
人参属药用植物转录组研究进展
种子在黑暗中能发芽吗
美味芥菜很开胃
TGF—β1基因多态性与糖尿病肾病患者易感性关系的探讨