APP下载

基于SLAF—seq技术的红心火龙果SNP位点开发及遗传分析

2017-05-30俞超陈煜汪财生陈佳怡金从标

热带作物学报 2017年4期

俞超 陈煜 汪财生 陈佳怡 金从标

摘 要 为分析不同品种红心火龙果的遗传关系,本研究采集国内14种红心火龙果品种,通过生物信息学分析进行实验方案的系统设计,将所提取基因组进行酶切,筛选特异长度的DNA片断,构建SLAF-seq文库后进行高通量测序,将获得的序列进行分析比较后得到多态SLAF标签,在此标签基础上进一步开发特异性SNP位点,最后建立14种红心火龙果品种的进化树。本研究共开发159 560个SLAF标签,样品的平均测序深度为5.26×;共得到120 294个群体SNP,其中高一致性的群体SNP 51 859个。12种红心火龙果聚类结果发现,样品1、2、6、8、10同缘关系相近;样品3、5、7、9同缘关系相近;样品4、14同缘关系相对较近。研究表明应用SLAF-seq技术开发分子标记的效率比ISSR、RAPD、AFLP等常规技术更高。12种红心火龙果的聚类结果从基因组水平揭示不同地区品种之间的遗传分化关系,为火龙果种质的保护和遗传改良提供参考。

关键词 红心火龙果;SLAF-seq;SNP位点;遗传分析

中图分类号 S667.9 文献标识码 A

Abstract To analyze the genetic relationship among different cultivars, 14 red pitaya varieties were collected and sequenced by SLAF-seq technology. The scheme of the experiment was designed based on bio-informatics technology. Genome was extracted and digested by enzyme, specific size of DNA were chosen to construct the SLAF-seq library. After high-throughput sequencing, a great amount of sequences were obtained and used to gain the polymorphism SLAF tags by software alignment, then found the distribution of specific SNP sites. Finally evolutionary tree of 14 red pitaya varieties was constructed. In the end, 159 560 SLAFs were produced, and the average sequencing depth was 5.26×. 51 859 high consistency SNP sites was obtained based on the analysis of total 120 294 SNP. The clustering results of 12 red pitaya varieties showed the sample 1, 2, 6, 8, 10 had a greatly close relationship between each other, the same as the sample 3, 5, 7, 9 and sample 4, 14. This paper provided results that SLAF-seq technology could be applied in developing SNP sites in red pitaya, much more efficiently than markers like SSR, RAPD and AFLP. The clustering results revealed the relationships of population genetic evolution in the genomic level among red pitaya varieties come from different area,and provided reference for the protection of red pitaya's germplasm and genetic improvement.

Key words red pitaya; SLAF-seq; SNP sites; genetic analysis

doi 10.3969/j.issn.1000-2561.2017.04.002

火龍果(Hylocereus undulates Britt. & Rose)是一种原产于墨西哥等中美洲地区的典型热带水果,近几年引入中国内地栽培并逐渐受到消费者青睐,规模化种植前景广阔,有着良好的发展空间。火龙果品种大体上可分为红皮红心、红皮白心、黄皮白心等3种类型[1],红皮红心火龙果的果肉中尤其含有大量花青素,可用于天然色素的提取,具有抗氧化抗衰老作用,经济价值高,对其研究日益增加[2-6]。

2003年,国外TEL-ZUR等[7]首次采用RAPD技术分析两大属火龙果的遗传关系,设计9条引物得到了173个多态标记;此后,AFLP技术同样被认为能较好地区分不同品种火龙果[8-9]。从2012年开始,国内逐渐开展火龙果种质相关的研究,如采用RAPD分子标记技术,从1196条引物中筛选出1条引物能够区分红肉和白肉火龙果[10];ISSR技术可获得约一至两百个多态性分子标记[11-13],对本地火龙果的遗传多样性评价、种质鉴定等研究效果较好。但这些分子标记技术都存在一定的局限性,如RAPD技术易受许多因素影响,实验的稳定性和重复性较差,而ISSR标记对体细胞遗传变异的检测效率较低[14]。因此,进一步大量开发火龙果分子标记需要有更高效的技术支持。近十年,随着高通量测序技术的快速发展,其简便快捷、低成本的特点在遗传研究中具有重要的地位,大规模基因分型结合高通量测序技术为基因挖掘提供有力的技术保障[15]。 SLAF-seq(specific-locus amplified fragment sequencing),该技术利用生物信息学方法,对目标物种的参考基因组进行系统分析,设计标记开发方案,构建SLAF-seq文库,筛选特异性长度片段进行高通量测序,将获得测序深度和质量满足要求的SLAF片段来代表目标物种的全基因组信息,进而根据这些特异性SLAF片段开发出大量分子标记,用于遗传定位、基因表达调控、系统进化等分子生物学研究[16-17]。当前,尚未有利用高通量测序技术开发火龙果大量分子标记的报道,且不同红心火龙果品种的植物学特征及其遗传关系的研究很少,严重影响火龙果的推广和可持续发展。

本研究采集国内14种红心火龙果品种,利用SLAF-seq技术获得大量特异性SNP位点,并分析红心火龙果品种间的遗传关系,对于火龙果种质的保护和遗传改良具有重要的意义。

1 材料与方法

1.1 材料

14种红心火龙果样品材料由宁波绿苑农业开发有限公司的火龙果种植基地提供。

1.2 方法

1.2.1 SLAF-seq技术开发特异性SNP 利用植物复杂基因组提取试剂盒(天根生化科技有限公司)提取火龙果基因组DNA,用1.2%的琼脂糖电泳检测DNA 的完整性。

根据选定的最适酶切方案,对检测合格的各样品基因组DNA分别进行酶切。对得到的酶切片段(SLAF标签)进行3′端加A处理、连接Dual-index[18]测序接头、PCR扩增、纯化、混样、切胶选取目的片段,文库质检合格后用Illumina HiSeqTM2500进行测序。为评估酶切实验的准确性,选用日本晴水稻(Oryza sativa indica)作为对照进行测序。

为保证分析质量,本试验采用读长100 bp×2作为后续的数据评估和分析数据。利用Dual-index 对测序得到的原始数据进行识别,得到各个样品的读长。过滤测序读长的接头后,进行测序质量和数据量的评估。通过对照数据评估酶切效率,以此判断实验过程的准确性和有效性。

测序产生的读长来源于同一限制性内切酶对不同样品作用产生的长度相同的酶切片段,根据序列相似性将各样品的读长进行聚类,聚类到一起的读长来源于一个SLAF片段(SLAF标签)。SNP标记的开发是以每个SLAF标签中深度最高的序列类型作为参考序列,利用bwa[19]将测序reads比对到参考序列上,并使用GATK[20]和samtools[21]两种方法开发SNP,以两种方法得到的SNP标记交集作为最终可靠的SNP标记数据。

1.2.2 遗传进化分析 将开发的SNP标记,根据完整度>0.8,MAF>0.05过滤后获得高一致性的群体SNP,通过MEGA5[22]软件,neighbor-joining[23]算法,做14个样品的进化分析,计算得到14个样品的进化树。

2 结果与分析

2.1 火龙果样品的生物学特征

从基地采集的14种火龙果样品,具备不同的主茎、枝条、刺座、果实特征。主茎特征包括棱数量、生长方式;枝条特征包括枝条数量、边缘形态;刺座特征包括刺座特征、形状、颜色;果实特征包括形状、颜色、苞片形态,详见表1,典型样品形态见图1。

2.2 SLAF-seq技术开发特异性SNP

14種火龙果基因组DNA基本无明显污染,质量满足建库要求(图2)。利用SLAF-seq技术共开发159 560个SLAF标签,样品的平均测序深度为5.26×,统计结果见表2。最后得到120 294个群体SNP,根据完整度>0.8,MAF>0.05过滤,共得到51 859个高一致性的群体SNP,信息统计见表3。

2.3 系统发育树分析

基于51 859个高一致性的群体SNP做14个样品的进化分析,计算得到14个样品的进化树(图3)。从聚类结果来看,主茎(三棱,直立生长)、枝条特征(均为6支,齿形边缘)相同,果实刺座特征略有不同的1、2、6、8、10样品同缘关系相近;主茎(三棱,弯曲生长)、枝条特征(均为8支,波浪形边缘)相同,刺座和果实特征略有不同的3、5、7、9样品同缘关系相近;主茎(四棱,弯曲生长)、枝条特征(均为9支,波浪形边缘)相同,果实刺座特征略有不同的4、14样品同缘关系相对较近。由此可知,火龙果的主茎特征(棱数量、生长方式)和枝条特征(枝条数量、边缘形状)相似的在较近距离内相聚,可做为亲缘关系远近的重要依据。实验结果从基因组水平揭示不同地区的品种之间及同一地区的不同个体之间的遗传分化关系,解释不同地区火龙果的遗传进化地位。

3 讨论

SLAF-seq 技术结合了位点特异性扩增和高通量测序,可以用于全基因组范围的SNP开发和大范围的基因分型, 并能实现候选功能区域的精细定位。Geng等[24]在油菜中开发了1 933个SLAF标记,并找到4个与种子重量高度相关的基因;Xu等[25]利用SLAF-seq技术发现了与黄瓜肉质厚度相关的候补基因;Zhao等[26]利用SLAF-seq技术筛选到蕃茄叶霉病的抗性基因。

火龙果目前尚无参考基因组,利用常规方法开发火龙果基因组的特异分子标记耗时长,难度大,标记数量不多,ISSR技术获得了215个多态标记[11];RAPD技术获得了173个多态标记[7];AFLP技术获得了51个多态标记[9]。而SLAF-seq技术获得的特异DNA序列和分子标记数量都相当庞大。本次研究利用该技术共开发159 560个SLAF标签,得到51 859个高一致性的群体SNP,在14个样品中的完整率均超过91%。可见应用SLAF-seq技术开发分子标记的效率比ISSR、RAPD、AFLP等常规技术更高。今后可利用该技术进一步筛选火龙果品质、抗逆性相关的基因,开拓火龙果种质资源保护、新品种开发等相关研究领域。

从本研究所建立的系统发育树来看,红肉火龙果种质遗传多样性较丰富,火龙果生物学特征中的主茎和枝条特征可以作为分类的主要标准,包括主茎的棱数量、是否直立生长,以及枝条的数量和边缘特征。根据文献[27]和专家初步鉴定,同缘关系相近1、2、6、8、10可能为“地龙”品种,3、5、7、9可能为“柬埔寨红肉”,4、14可能为“长红”,其果实刺座特征的差异可能由是不同产地造成遗传突变;11-13分别可能为“云龙”、“云南红肉”、“长龙”,其遗传距离与其它品种相对较远。本实验所取样品数量有限,并未收集国内所有火龙果品种,今后可逐步探讨已审定火龙果正规品种间的遗传关系,理清归纳不同品种间生物学特征,以保证火龙果产业快速、持续以及有效的发展。

参考文献

[1] 黄凤珠, 陆贵锋, 黄黎芳, 等. 火龙果种质资源收集保存与初步评价[J]. 西南农业学报, 2016, 29(4): 920-924.

[2] Fathordoobady F, Mirhosseini H, Selamat J, et al. Effect of solvent type and ratio on betacyanins and antioxidant activity of extracts from Hylocereus polyrhizus flesh and peel by supercritical fluid extraction and solvent extraction[J]. Food Chemistry, 2016, 202: 70-80.

[3] Ortiz T A, Takahashi L S. Physical and chemical characteristics of pitaya fruits at physiological maturity[J]. Genetic Molecular Research, 2015, 14(4): 22-39.

[4] Suh D H, Lee S, Heo do Y, et al. Metabolite profiling of red and white pitayas (Hylocereus polyrhizus and Hylocereus undatus) for comparing betalain biosynthesis and antioxidant activity[J]. Agriculture Food Chemistry, 2014, 62(34): 64-71.

[5] García-Cruz L, Valle-Guadarrama S, Salinas-Moreno Y, et al. Physical, chemical, and antioxidant activity characterization of pitaya (Stenocereus pruinosus) fruits[J]. Plant Foods for Human Nutrition, 2013, 68(4): 403-410.

[6] Kim H, Choi H K, Moon J Y, et al. Comparative antioxidant and antiproliferative activities of red and white pitayas and their correlation with flavonoid and polyphenol content[J]. Journal of Food Science, 2011, 76(1): C38-45.

[7] Tel-zur N, Abbo S, Bar-zvi D, et al. Clone identification and genetic relationship among vine cacti from the genera Hylocereus and Selenicereus based on RAPD analysis[J]. Scientia Horticulturae, 2004, 100(1): 279-289.

[8] Cisneros A, Tel-Zur N. Genomic analysis in three Hylocereus species and their progeny: Evidence for introgressive hybridization and gene flow[J]. Euphytica, 2013, 194(1): 109-124.

[9] Pagliaccia D, Vidalakis G, Douhan G W, et al. Genetic characterization of pitahaya accessions based on amplified fragment length polymorphism analysis[J]. HortScience, 2015, 50(3): 332-336.

[10] 李加強. 火龙果实生群体主要性状遗传规律探讨及肉色相关的RAPD分子标记筛选[D]. 广州: 华南农业大学, 2012.

[11] 张冰雪, 范付华, 乔 光, 等. 贵州地方火龙果芽变种质DNA指纹图谱及遗传多样性的ISSR分析[J]. 果树学报, 2013, 30(4): 573-577.

[12] Fan Q J, Zheng C, Yan F X, et al. An efficient regeneration of pitaya (Hylocereus undatus) and the genetic fidelity assessment of in vitro-derived plants using ISSR markers[J]. Journal of Horticultural Science & Biotechnology, 2013, 88(5): 631-637.

[13] 陈明贤. 福建省火龙果种质资源ISSR分析及耐盐性研究[D]. 福州: 福建农林大学, 2012.

[14] 陈桂信, 潘东明, 吕柳新, 等. DNA分子标记技术及其在热带亚热带果树上的应用[J]. 江西农业大学学报, 2002, 24(2): 176-182.

[15] Ogura T, Busch W. From phenotypes to causal sequences: using genome wide association studies to dissect the sequence basis for variation of plant development[J]. Current Opinion in Plant Biology, 2015, 23: 98-108.

[16] Sun X W, Liu D Y, Zhang X F, et al. SLAF-seq: An efficient method of large-scale de novo snp discovery and genotyping using highthroughput sequencing[J]. Plos One, 2013, 8(3): e58700.

[17] 陈士强, 秦树文, 黄泽峰, 等. 基于SLAF-seq 技术开发长穗偃麦草染色体特异分子标记[J]. 作物学报, 2013, 39(4): 727-734.

[18] Kozich J J, Westcott S L, Baxter N T, et al. Development of a dual-index sequencing strategy and curation pipeline for analyzing amplicon sequence data on the MiSeqIllumina sequencing platform[J]. Applied and environmental microbiology, 2013, 79(17): 5 112-5 120.

[19] Li H, Durbin R. Fast and accurate short read alignment with Burrows-Wheeler transform[J]. Bioinformatics, 2009, 25(14): 1 754-1 760.

[20] McKenna A, Hanna M, Banks E, et al. The Genome Analysis Toolkit: a MapReduce framework for analyzing next-generation DNA sequencing data[J]. Genome research, 2010, 20(9): 1 297-1 303.

[21] Li H, Handsaker B, Wysoker A, et al. The sequence alignment/map format and SAMtools[J]. Bioinformatics, 2009, 25(16): 2 078-2 079.

[22] Koichiro T, Daniel P, Glen S, et al. Molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J]. Molecular Biology and Evolution, 2011, 28(10): 2 731-2 739.

[23] Saitou N, Nei M. The neighbor-joining method: a new method for reconstructing phylogenetic trees[J]. Molecular Biology and Evolution, 1987, 4(4): 406-425.

[24] Geng X X, Jiang C H, Yang J, et al. Rapid identification of candidate genes for seed weight using the SLAF-Seq method in Brassica napus[J]. PLoS One. 2016; 11(1): 1-14.

[25] Xu X W, Lu L, Zhu B Y, et al. QTL mapping of cucumber fruit flesh thickness by SLAF-seq[J]. Scientific Reports. 2015(5): 15829.

[26] Zhao T T, Jiang J B, Liu G, et al. Mapping and candidate gene screening of tomato Cladosporium fulvum-resistant gene Cf-19, based on high-throughput sequencing technology[J]. BMC Plant Biology, 2016, 16: 51.

[27] 黎 舒. 火龍果不同品系品种植物学形态和生物学特性研究[D]. 南宁: 广西大学, 2014.