APP下载

西洋接骨木转录组SSR挖掘及荧光标记开发

2019-12-10姚俊修李善文李庆华刘学良吴德军燕丽萍

中南林业科技大学学报 2019年12期
关键词:核苷酸西洋多态性

姚俊修,李善文,任 飞,李庆华,刘学良,吴德军,燕丽萍

(1.山东省林业科学研究院,山东 济南 250014;2.山东省林木遗传改良重点实验室,山东 济南 250014;3.山东农业大学,山东 泰安 271018)

简单序列重复(Simple sequence repeat,SSR)是一类由1~6 个碱基组成的简单串联重复序列,在真核、原核生物基因组中分布广泛[1-2]。根据SSR 来源可分为EST-SSR 和基因组SSR[3],传统的利用基因组数据开发SSR 标记具有成本高、试验步骤繁琐、位点较少等缺点[4],近年来,随着测序成本降低,转录组测序已经成为研究分子生物学相关内容的短平快思路之一,不同植物的转录组数据相继被开发利用,基于转录组测序开发不同植物SSR 标记的研究也越来越多[5-7]。

接骨木属SambucusLinn系忍冬科Caprifoliaceae 植物,为落叶乔木或灌木,本属约20 种,遍布于温带和亚热带地区[8-9]。我国约6 种,南北均产。接骨木是珍贵的药用植物,不少种类果实含油量高(35%~44%)[10],是农业部公布的木本油料植物之一。我国接骨木资源十分丰富,其具有很强的适应性,抗寒、抗旱、抗病能力强[11],而对接骨木属树种的开发利用,我国仍处于起步阶段,大多处于自然状态且人为破坏严重,仅在药用及种质资源概述较多,其它高值化利用等研究较少[12-13],也未见基于转录组测序的标记开发及分子标记辅助育种等相关报道,本研究基于前期对西洋接骨木果实转录组进行测序获得的数据,开发大量微卫星标记,为利用SSR 标记进行接骨木种质资源遗传多样性、连锁图谱构建及功能基因挖掘奠定基础[14-16]。

1 材料与方法

1.1 转录组数据的获得

转录组数据来源于本课题组2016年对一株成年西洋接骨木(1987年由美国引进,树龄31 a,现定植于山东省济南泉城公园)果实进行Illumina HiSeq 2000 高通量测序的结果。测序时采取3 个发育时期(青果、中熟、晚熟)的果实,每阶段取样3 次重复,分别提取RNA 后委托北京诺禾致源基因公司进行RNA-Seq 转录组测序,并通过De Novo 方法组装获得[17],组装结果作为原始数据后续使用。

1.2 转录组SSR 位点鉴别

西洋接骨木转录组数据采用Trinity 软件进行拼接,拼接得到的转录本序列信息以FASTA 格式储存,拼接主要参数为SS_lib_type,min_kmer_cov,min_glue。通过拼接得到Unigenes 库,并对混合的Unigenes 库利用MISA 程序进行SSR 位点搜索[18],搜索标准为:二核苷酸、三核苷酸、四核苷酸、五核苷酸和六核苷酸最少重复次数分别为6、5、5、5 和5 次。

1.3 引物设计原则

采用Primer 3.0 引物设计程序(2.3.5 版,默认参数)对含有SSR 位点的序列进行引物设计,且SSR 位点侧翼序列长度≥50 bp。引物设计的主要参数:1)退火温度(Tm)在55~75 ℃之间,上、下游引物的Tm 值相差5 ℃;2)PCR 扩增产物大小在100~300 bp 之间,引物长度在15~30 bp之间;3)GC 含量在40%~60%之间,且上、下游引物之间无引物二聚体和二级结构的出现。对设计的SSR 引物在Unigenes 库中进行SSR 引物的blast 验证[18-19]。

1.4 试验材料及DNA 提取

选取8 株接骨木的成熟叶片(加拿大接骨木Sambucus canadensis3 株,金叶接骨木Sambucus canadensis‘Aurea' 1 株,花叶接骨木Sambucus nigra‘Variegata' 1 株,金羽接骨木Sambucus racemosa‘Plumosa Aurea' 1 株, 接骨木Sambucus williamsii2 株),DNA 采用英芮诚生化科技(上海)有限公司植物组织基因组DNA 提取试剂盒提取(磁珠法)[20],-70 ℃保存备用。

1.5 荧光PCR 扩增体系及程序优化

以上述8 个接骨木成熟叶片进行引物筛选。荧光引物PCR 扩增体系采取半巢式PCR,经降低退火温度及进行梯度PCR 扩增等优化过程获得最佳荧光PCR 扩增体系及程序。

扩增产物利用毛细管电泳检测:取PCR 产物0.3 μL、分子量内标0.5 μL 和去离子甲酰胺9.5 μL混合加入PCR 板,95 ℃变性5 min,4 ℃冷却后离心,1×Buffer 缓冲液上机检测[21]。

1.6 荧光SSR 引物筛选

100 对荧光引物来源于Primer 3.0 软件设计所得,由北京市睿博兴科生物技术有限公司合成,纯化方式PAGE。引物筛选原则为Tm 值范围:55~62 ℃;引物重复碱基的个数:2 bp,如(AG),(AT)等;重复碱基的次数:8~11 次;PCR 扩增体系及程序选自实验所得的最优方案。

2 结果与分析

2.1 转录组中SSR 的分布及结构特点

通过对西洋接骨木转录组的257 975 条Unigene序列进行搜索(序列总长254 175 kb),发现其中51 336 条Unigene 序列中含有64 148 个SSR 位点,SSR 位点出现频率为24.87%(SSR 位点数与总的Unigene 数的比值),平均每3.96 kb 出现1 个SSR,SSR 的类型丰富,其中,单核苷酸重复是主要类型,占总SSR 的51.13%。其次是二、三核苷酸重复,分别占总SSR 的38.63%和9.11%。A/T和AG/CT 是单核酸和二核苷酸的优势重复基元。四核苷酸、五核苷酸和六核苷酸重复类型数量较少,分别占总数的0.86%、0.1%和0.17%(表1,图1)。

表1 西洋接骨木转录组不同SSR 重复单元类型分布Table1 Distribution of different SSR repeat types of transcriptome in Sambucus nigra

图1 SSR 位点分布Fig.1 SSR locus distribution

2.2 荧光PCR 扩增体系及程序优化

以西洋接骨木叶片DNA 为模板,根据SSRPCR 的基本条件和扩增程序优化PCR 体系[18,22-23]。

荧光引物PCR 扩增体系及程序如下:

加M13接头PCR 扩增体系:20 μL PCR 体系中含DNA 原液1 μL,2×Mix 10 μL,10 μM 的M13接头及上下游引物各0.2、0.1、0.3 μL,H2O 8.4 μL;

荧光引物PCR 扩增程序:95 ℃预变性5 min;然后进行35 个循环,每个循环包括95 ℃变性30 s,57 ℃退火30 s(退火温度因不同引物而异),72 ℃延伸30 s;最后72 ℃延伸10 min。

以上述扩增体系及程序为基础条件,经降低退火温度及进行梯度PCR 扩增等优化过程获得最佳荧光PCR 扩增体系及程序如下:

两步荧光引物PCR 扩增法:

1)加M13接头PCR 扩增体系:10 μL PCR 体系中含DNA 原液1 μL,2×Mix 5 μL,10 μM 引物各0.1 μL,H2O 3.8 μL;PCR 扩增程序见表2。

表2 PCR 扩增程序Table2 Procedure of PCR amplification

由于第一步与荧光接头引物结合扩增结果较差,而两步法可提高与荧光引物结合度,可大大提高引物的扩增效率。

2)第二步荧光引物PCR 扩增体系:20 μL PCR 体系中含第一步扩增产物DNA 原液2 μL,2×Mix 10 μL,10 μM M13 接头(加荧光标记)及反向引物各0.15 μL,H2O 7.7 μL;荧光引物PCR扩增程序见表3。

表3 荧光引物PCR 扩增程序Table3 Procedure of fluorescent PCR amplification

2.3 荧光SSR 标记筛选

对含SSR 位点的51 336 条Unigene 序列进行引物设计,共设计了64 148 对SSR 引物。为了验证其有效性,挑选合成了以二核苷酸重复基元为主的100 对荧光SSR 引物,利用已合成的100 对引物对8份不同种接骨木个体进行荧光SSR扩增,结果表明,80 对引物扩增有条带,即扩增效率为80%。在扩增成功的80 对引物中有25 对引物多态性较好,即引物多态性效率为31.25%。图2为5号引物在8 份不同种接骨木个体中的扩增情况。

2.4 荧光SSR 标记多态性

从25 对扩增有多态性的引物中选取14 对多态性较好的引物(表4)对不同种接骨木进行遗传多样性分析并对荧光标记多态性进行评价。14对多态性引物共检测出67 个等位基因(Na),每位点3~7 个,平均等位基因4.786 个;每位点有效等位基因数(Ne)1.684~6.095 个,平均有效等位基因数3.413 个,观测杂合度(Ho)及期望杂合度(He)分别在0~0.875 和0.406~0.836之间,平均值分别为0.313、0.664;Shannon 多样性指数(I)在0.736~1.862 之间,平均1.310 (表5),说明不同种接骨木具有较高的遗传多样性。

3 讨论与结论

3.1 讨 论

随着高通量测序技术的快速发展及成本优势,转录组测序所得数据可包含某物种特定时期某一组织或器官的转录本[24-25],对于缺乏基因组信息的物种,其转录组测序对于该物种分子标记开发及标记辅助育种是一个的短平快的方法。

本研究中,对一株成熟西洋接骨木果实进行转录组测序所得cDNA 文库中的257 975 条Unigene进行SSR 搜索,得到了64 148 个SSR 位点,出现频率为 24.87%,此频率高于萝卜的23.79%[26]、皂荚的20.7%[27]、刺梨的20.37%[19]、南方红豆杉的2.24%[18]、但低于芙蓉李的54.51%[28],厚朴的52.75%[29],出现这种差异可能是由转录组测序方法,不同物种间SSR 位点信息差异、SSR 位点查找软件、不同数据库中数据量大小等原因造成的[18,30]。随着不同数据库的不断补充和完善,SSR 出现频率在各数据库中将有统一标准[19]。在大多数物种中二核苷酸和三核苷酸是最常见的SSR 重复类型[31],而从西洋接骨木SSR 位点结构来看,单核苷酸(51.13%)出现频率最高,明显高于二核苷酸(38.63%)和三核苷酸(9.11%),这与鄢秀芹等对刺梨的SSR 重复类型研究并不一致:三核苷酸出现频率最高,高于四核苷酸及二核苷酸[19];西洋接骨木转录组中二核苷酸优势重复基元是 AG/CT,这与青稞[32]、刺梨[19]、蓝靛果[33]、芝麻[34]中有一致的研究结论。

图2 8 个样本在5 号位点的基因型 Fig.2 Genotypes of 8 samples at No.5 SSR locus

根据257 975 条Unigene 序列进行引物设计,共设计了64 148 对SSR 特异引物。通过试验优化方案得到了西洋接骨木荧光SSR-PCR 最优体系,在合成的100 对SSR 荧光标记中,80 对标记扩增有特异条带出现,20 对未扩增出条带,部分标记扩增失败可能与引物及模板质量有关[35-36]。80 对有扩增条带的引物中25 对引物具有较好多态性,多态性比率为31.25%,明显低于铁皮石斛的86%[37]、柿树的45.2%[38]、低于红豆杉的38.71%[18],但高于芝麻的10%[39],而对于西洋接骨木近缘种分子标记相关内容未见研究报道。综上,不同物种间引物的多态性比率并不一致,这可能与标记类型、参试实验材料及数量有关。从SSR 位点多态性潜能考虑[40],本研究从25 对有扩增产物的SSR 标记中筛选出的14 对引物具有较高的多态性,用于接骨木遗传变异研究是可行的,本研究结果也表明利用西洋接骨木转录组数据开发的SSR 标记为接骨木种质资源遗传多样性分析、分子标记辅助育种、遗传图谱构建和功能基因的挖掘等奠定了基础[14-16]。本研究用14 对标记评价8 个不同种接骨木遗传多样性具有一定局限性,下一步工作将扩大引物筛选范围,增加检测群体的数量,以期获得更多多态性较高的标记来验证本研究结论。转录组测序获得的大量SSR 引物将会为接骨木和其它忍冬科植物的资源分类、基因定位及比较基因组学等研究提供更多、更有效的分子标记。

表4 14 对SSR 引物与最佳退火温度Table4 14 pairs of SSR primers and optimal annealing temperature

表5 不同种接骨木遗传多样性分析Table5 Analysis of genetic diversity of Sambucus williamsil in different populations

3.2 结 论

本研究利用高通量测序对西洋接骨木进行转录组测序,对数据中SSR 位点分布、核苷酸重复类型进行概括总结;通过试验优化获得最优的两步荧光引物PCR 扩增体系;根据引物设计原则在转录组数据中合成100 对荧光SSR 标记,利用8个不同种接骨木个体对100 对荧光标记进行引物筛选,80 对可扩增出条带,25 对可成功扩增出多态性,选择14 对多态性较好的引物对不同种接骨木进行遗传多样性预测。西洋接骨木荧光SSR 标记的开发为接骨木属分子标记辅助育种、杂种优势预测等提供理论基础。

猜你喜欢

核苷酸西洋多态性
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
MTHFR C677T基因多态性与颈动脉狭窄及其侧支循环形成的关系
RANTES及其受体CCR5基因多态性及环境因素在昆明汉族T2DM发生中的交互作用
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
清宫中的西洋医生
清宫里的西洋钟表师
紫禁城内的西洋科学家
Acknowledgment to reviewers—November 2018 to September 2019
外源核苷酸与运动能力研究