APP下载

光亮橡胶树叶绿体基因组测序组装与注释

2021-01-04牛迎凤李国华刘紫艳

经济林研究 2020年4期
关键词:橡胶树叶绿体种质

牛迎凤,李国华,刘紫艳,郑 诚,柳 觐

(云南省热带作物科学研究所,云南 景洪 666100)

橡胶树Hevea brasiliensis是大戟科Euphorbiaceae橡胶树属Hevea重要的热带经济林木[1-2],也是目前用来大规模产业化生产天然橡胶的唯一原料物 种[3],因橡胶树野生种质在巴西分布的最多,其叶片为三出复叶,因此其又被称为巴西橡胶树或三叶橡胶树。天然橡胶是重要的工业原料和战略资源[4],因其具有合成橡胶无法替代的综合化学和物理性 能[5-6],故其在国防等领域不可或缺。近年来,尽管我国天然橡胶产量超过80 万t,但由于国内消费量巨大,我国天然橡胶原料自给率仅占1/4 左右,极不利于国家战略资源安全。而且橡胶树是典型的热带树种,受气候条件制约,我国仅有海南、云南、广东、广西的部分地区可以种植橡胶树,目前种植范围已达到甚至超过国内橡胶树宜植区的极限,仅仅依靠扩大种植面积来提高我国天然橡胶自给率的可能性已不存在,只有培育高产优良品种才是提高国内天然橡胶产量的最为可行的途径。

无论对于植物还是动物而言,种质资源是品种选育的物质基础,充分了解种质资源的遗传背景信息是对其进行育种利用的前提,种质资源的遗传多样性也决定着品种改良的深度和广度[7]。目前我国保存的橡胶树种质资源已有上万份,直接或间接来源于其原生地亚马逊河流域,主要包括3 大类[8],其分别是魏克汉种质、1981′IRRDB种质和近缘野生种质。其中,橡胶树魏克汉种质和1981′IRRDB 种质已在育种中被广泛利用和研究报道,而关于橡胶树近缘野生种质的研究和利用的报道尚不多见。因近缘野生种质遗传背景信息丰富,往往含有抗逆、抗病等有利基因,具有较高的育种利用价值,故在多种作物中这已成为种质资源创新和利用研究的热点[9]。随着基因测序通量的提高和测序成本的降低,对作物近缘野生种的核基因组、线粒体基因组和叶绿体基因组的测序,已成为了解近缘野生种遗传背景、提高近缘野生种利用效率的有效手段。

叶绿体基因组作为植物特有的相对独立的遗传系统,编码着与光合作用等重要生物学过程相关的上百种基因[10-11],对于研究植物近缘野生种的遗传背景而言,解析其叶绿体基因组包含的基因数量、基因功能和基因序列等信息显得尤为关键[12]。截止目前,国内外研究者已完成对油桐[13]、核桃[14]、茶树[15]、杜仲[16]、板栗[17]等重要经济林物种的叶绿体基因组的测序工作,为这些物种种质资源的深度评价和分子育种提供了丰富的原始数据。

橡胶树属包含11 个种,其分别是巴西橡胶H.brasiliensis、矮生小叶橡胶H.camargoana、边沁橡胶H.benthamiana、光亮橡胶H.nitida、小叶橡胶H.microphylla、少花橡胶H.pauciflora、硬叶橡胶H.rigidifolia、色宝橡胶H.spruceana、泽生橡胶H.paludosa、圭亚那橡胶H.guianensis和坎普橡胶H.camporum[18]。其中的光亮橡胶,因为植株矮小、枝条柔软下垂,具有较强的抗风性[19],对于培育橡胶树抗风品种而言,是很有价值的野生近缘种质材料。截止目前,国内外研究者已完成对巴西橡胶[20]、矮生小叶橡胶[21]和边沁橡胶[22]的叶绿体基因组的测序工作,而有关其他8 个近缘野生种的叶绿体基因组的测序工作尚未见诸报道。为给光亮橡胶树的育种和利用提供重要理论参考依据,本研究对光亮橡胶树的叶绿体基因组进行了测序、组装和注释,并依据叶绿体基因组的蛋白编码基因序列,将其与大戟科其他已完成叶绿体基因组测序的物种进行了进化分析,现将研究结果分析报道如下。

1 材料和方法

1.1 研究材料

光亮橡胶树叶样品采自于中国热带农业科学院橡胶研究所的农业部儋州橡胶树种质资源圃中,采集浅绿色嫩叶,以液氮速冻后放入-80 ℃的超低温冰箱中保存以备用。

1.2 研究方法

1.2.1 DNA 的提取

将采集的光亮橡胶树浅绿色嫩叶置于研钵中加入液氮研碎,用生工生物工程(上海)股份有限公司的Rapid Plant Genomic DNA Isolation Kit 提取高质量基因组DNA(包括核基因组DNA、叶绿体基因组DNA 和线粒体基因组DNA),并用Agilent 2100 Bioanalyzer 对所提DNA 的质量进行检测。

1.2.2 测序文库的构建

根据illumina DNA 文库构建标准流程,构建插入片段大小为350 bp 的DNA 双末端测序文库,采用qPCR 方法和Agilent 2100 Bioanalyzer 对DNA 文库进行质量控制。

1.2.3 DNA 的测序

采用illumina HiSeq 2000 平台对质量控制合格的DNA 文库进行测序,测序策略为Pair-End 150,测序数据量为15 G。

1.2.4 叶绿体基因组的拼接和注释

对测序得到的Raw Reads 去除低质量序列、去除接头污染,得到Clean Reads,采用CLC Genomics Workbench v3.6(http://www.clcbio.com) 和DOGMA 软件[23]对叶绿体基因组进行拼接、组装和注释,对重复序列区域进行PCR+常规测序验证。

1.2.5 进化分析

通过NCBI网站(https://www.ncbi.nlm.nih.gov/) 检索,筛选出已完成叶绿体基因组测序的所有大戟科物种,选择其共有的蛋白编码基因序列,采用 jModelTest 2.1.7(http://code.google.com/p/jmodeltest2/) 对所选DNA 序列进行核酸模型测试[24],采用RAxML8.1.5 软件(https://sco.h-its.org/exelixis/web/ software/raxml/index.html)用最大似然法(Maximum Likelihood method,ML 法)构建系统发育树[25],Bootstrap 值设置为1 000。

2 结果与分析

2.1 光亮橡胶树叶绿体基因组的拼接和组装

以超低温保存的光亮橡胶树浅绿色嫩叶为材料,按照试剂盒规定的流程提取了基因组DNA,经Agilent 2100 Bioanalyzer 质量检测发现,DNA未降解、不包含RNA 或蛋白质等杂质,DNA 质量符合构建测序文库的要求。然后采用1.2.2 中所述的方法构建了DNA 测序文库,并采用qPCR 方法和Agilent 2100 Bioanalyzer 完成了测序文库的质量控制,且测序文库质量和拷贝数均符合上机要求。通过DNA 文库的上机测序和测序数据的质量控制,得到了可用于叶绿体基因组拼接的Clean Reads。利用DOGMA 软件对Clean Reads 进行了拼接、组装和注释,得到了完整的光亮橡胶树叶绿体基因组图谱(图1),并上传至美国NCBI 网站(https://www.ncbi.nlm.nih.gov/),序列接收号为MT413435。

图1 光亮橡胶树叶绿体基因组图谱Fig.1 Chloroplast genome mapping of H.nitida

组装和注释结果表明,光亮橡胶树叶绿体基因组为典型的双链环状结构,其大小为161 124 bp, 包含A 碱基51 495 个、T 碱基52 022 个、G 碱基28 915 个、C 碱基28 692 个,GC 含量为35.75%。从 基因组结构来说,该基因组由如下4 个区域组成:1 个大单拷贝区域(Large single copy,LSC),其GC 含量为33.18%,在叶绿体基因组中的位置是第1—89110 bp;1 个小单拷贝区域(Small single copy,SSC),其GC 含量为29.42%,在叶绿体基因组中的位置是第115930—134305 bp;中间由2 个反向重复区域分开(Inverted repeat,IR),其GC 含量为42.20%,在叶绿体基因组中的位置分别是第89111—115929 bp(IRa)和第134306—161124 bp(IRb)。

2.2 光亮橡胶树叶绿体基因组注释

采用上述生物信息学手段对光亮橡胶树叶绿体基因组进行了注释,共注释得到134 个基因,其中86 个为蛋白编码基因(Protein coding genes),4 个为假基因(Pseudo genes),36 个为tRNA 基因(Transfer RNAs),8 个为rRNA 基因(Ribosomal RNAs),除4 个假基因外,其他130 个基因在叶绿体基因组中的位置和序列信息详见表1。

表1 光亮橡胶树叶绿体基因组注释结果†Table 1 Annotation of chloroplast genome of H.nitida

续表1Continuation of Table 1

续表1Continuation of Table 1

续表1Continuation of Table 1

从基因功能来看,86 个蛋白编码基因主要参与光合系统I、光合系统II、细胞色素b/f 复合体、ATP 合成酶、NADH 脱氢酶、核糖体蛋白、RNA聚合酶等生物学过程;从基因大小来看,86 个蛋白编码基因中最大的5 个基因分别是ycf2基因(编码2 303 个氨基酸残基)、ycf1基因(编码1 899 个 氨基酸残基)、rpoC2基因(编码1 395 个氨基酸残基)、rpoB基因(编码1 070 个氨基酸残基)和psaA基因(编码750 个氨基酸残基),最小的5 个基因分别是petL基因(编码31 个氨基酸残基)、petN基因(编码31 个氨基酸残基)、infA基因(编码34 个氨基酸残基)、psbM基因(编码34 个氨基酸残基)和psbI基因(编码36 个氨基酸残基)。

2.3 橡胶树属叶绿体基因组的对比分析

在NCBI 数据库中,分别以“橡胶树属”和“叶绿体基因组”为关键词,对橡胶树属物种叶绿体基因组的测序完成情况进行了检索,结果发现,包括光亮橡胶树在内的橡胶树属的11 个物种中,共有4 个物种完成了叶绿体基因组的测序、组装和注释,这4 个物种分别是光亮橡胶树、边沁橡胶树、小叶矮生橡胶树和橡胶树(栽培种)。除橡胶树叶绿体基因组的测序由泰国学者完成外,其他3 个物种叶绿体基因组的测序工作均由本研究组率先完成和报道。利用生物信息学手段,笔者对橡胶树属4 个物种的叶绿体基因组进行了比对。就其叶绿体基因组的大小而言,最大的是小叶矮生橡胶树(161 291 bp),其次为橡胶树 (161 191 bp),而边沁橡胶树和光亮橡胶树的叶绿体基因组均最小,均为161 124 bp;从其包含的基因数量来说,光亮橡胶树、边沁橡胶树和小叶矮生橡胶树的叶绿体基因组均包含了134 个基因,而橡胶树的叶绿体基因组仅包含了128 个基因,其中有16 个基因位于反向重复区域;从叶绿体基因组结构来说,4 个橡胶树属物种的叶绿体基因组具有相同的结构,均由1 个大单拷贝区域、1 个小单拷贝区域和2 个反向重复区域组成,其结构均是典型的双链环状结构。

2.4 基于叶绿体基因组的进化分析

在NCBI 数据库中,分别以“大戟科”和“叶绿体基因组”为关键词,对大戟科物种叶绿体基因组的测序完成情况进行了检索,结果发现,除橡胶树属4 个物种外,截止目前,还有大戟科的9 个物种的叶绿体基因组测序工作均已完成,这9 个物种分别是木薯Manihot esculenta、油桐Vernicia fordii、东 京 桐Deutzianthus tonkinensis、麻疯树Jatropha curcas、巴豆Croton tiglium、蓖麻Ricinus communis、乳浆大戟Euphorbia esula、甘遂Euphorbia kansui和绿玉树Euphorbia tirucalli。利用上述大戟科的13 个物种的叶绿体基因组中所共有的蛋白编码基因序列,选择桦木科植物白桦Betula platyphylla作为外类群,以其叶绿体基因组中的同源序列进行辅助分析,利用RAxML8.1.5 软件,采用最大似然法构建了拓扑结构的系统发育树,大戟科植物系统发育树如图2 所示。图2 中的数据表示自举值,自举值越大,说明系统发育树的拓扑结构越准确。

基于大戟科的13 种植物叶绿体基因组蛋白编码基因序列的进化分析结果表明,13 个物种在其进化中可明显地分为3 个类群。其中,4 种橡胶树属植物和木薯分为1 类群,麻疯树、巴豆、油桐、东京桐和蓖麻5 个物种分为1 类群,甘遂、乳浆大戟和绿玉树3 个物种分为1 类群。这一分析结果与传统分类学中依据形态特征分类的结果基本一致。

3 结论与讨论

橡胶树作为一种重要的战略资源植物,其基因组层面的遗传信息可为其种质资源评价、关键基因挖掘、野生近缘种利用等提供重要的基础数据。近10年来,马来西亚理科大学化学生物学中心[26-27]、 中国热带农业科学院橡胶研究所[28]、泰国国家科学技术发展局遗传工程和生物技术中心[29]、 中国云南省热带作物科学研究所[30]等国内外研究机构陆续发布了越来越精细的橡胶树基因组图谱,目前已拼装到了染色体水平。但是,作为一种驯化历史仅有一百多年的外来物种,经过数代群体内杂交和筛选后,国内橡胶树育种材料的遗传基础已非常狭窄,从中筛选出突破性品系或品种的可能性极小。因此,能否从近缘野生种质中获得育种所需的有利基因,这是橡胶树育种者近年来关注的焦点,而从基因组层面研究近缘野生种质的遗传背景,则是其育种利用研究的前提。

叶绿体作为植物细胞中必不可少的细胞器,是植物进行光合作用这一生长发育基础性反应[31]的场所,具有将无机物转换成为有机物的重要生物学功能。相比核基因组而言,叶绿体基因组较小;相比线粒体基因组而言,叶绿体基因组结构相对保守。因此,叶绿体基因组测序是近年来研究植物种质资源亲缘关系和物种进化关系的绝佳途径。本研究对具有抗风特性的橡胶树近缘野生种光亮橡胶树的叶绿体基因组进行了测序,并获得了较好的组装和注释结果。

大戟科是被子植物中包含物种数量较多的一个科,也是经济价值比较高的一个科,全世界大戟科植物约有300属、8 000种,很多大戟科植物(如橡胶树、木薯、油桐、麻疯树、蓖麻等)都是重要的工业或能源植物,解析其叶绿体基因组信息对于其遗传背景分析和分子育种而言都非常重要。但是,因叶绿体基因组测序工作涉及到分子生物学、基因组学和生物信息学等多个学科的研究平台和技术,目前已完成叶绿体基因组测序的大戟科物种仅约占其物种总数的0.16%,而绝大多数具有重大经济价值的大戟科植物的叶绿体基因组信息仍然有待解析。

研究中发现,已公布了叶绿体基因组的橡胶树属4 个物种的叶绿体基因组,不仅其结构相同,而且其序列同源性非常高,尤其是光亮橡胶树和边沁橡胶树的叶绿体基因组其大小和所包含的基因数量均相同,且与栽培种橡胶树的叶绿体基因组(161 191 bp)[20]仅有67 bp 的差别,其相似性高达99.96%,说明这几个物种的遗传关系非常密切。这一研究结果表明,就橡胶树育种而言,光亮橡胶树、边沁橡胶树和矮生小叶橡胶树均有较高的潜在利用价值。

一般来说,叶绿体基因组序列在物种进化过程中是极为保守的。但是,研究中发现,在其叶绿体基因组已被报道的橡胶树属3 个近缘野生种中,光亮橡胶树与边沁橡胶树的叶绿体基因组序列几乎完全一致,对于两个不同的物种而言,这种现象并不常见。因此,本研究组重新采集了光亮橡胶树与边沁橡胶树不同植株的叶样,再次进行了高通量测序和组装,并对重复序列区域进行了PCR 扩增和常规测序验证,获得的组装结果与本研究报道的完全一致。因此推测,光亮橡胶树和边沁橡胶树应该是由同一个祖先种进化而来的,仅仅因为其生境不同,导致其在进化过程中逐渐出现了性状上的差别,对此还需要利用核基因组重测序等手段予以进一步验证。

猜你喜欢

橡胶树叶绿体种质
甜菜叶绿体分离及其 DNA提取
华南地区最大农作物种质资源保护库建成
华南地区最大农作物种质资源保护库建成
橡胶树寒害减灾技术研究
中国热科院突破橡胶树死皮康复技术难关
中国热科院突破橡胶树死皮康复技术难关
四川省桑树种质资源保存与应用
人不吃饭行吗
亚麻抗白粉病种质资源的鉴定与筛选
橡胶树开割季在5月已经开始