APP下载

普通油茶叶绿体基因组密码子偏好性分析

2018-09-10王鹏良杨利平吴红英农有良吴双成肖玉菲覃子海王华宇刘海龙

广西植物 2018年2期
关键词:叶绿体

王鹏良 杨利平 吴红英 农有良 吴双成 肖玉菲 覃子海 王华宇 刘海龙

摘 要: 為了利用叶绿体基因工程技术改良普通油茶的重要经济性状,该研究以普通油茶叶绿体全基因组序列为材料,从中筛选出51条长度大于300 bp且以ATG起始的非重复CDS (Coding DNA Sequence)为对象,利用CodonW软件分析其密码子偏好性。结果表明:密码子第三位GC含量为27.55%,ENC范围在35.23~56.67之间,平均值为46.09;RSCU值大于1.00的密码子数目为30个,其中29个第三位碱基以U或A结尾;中性绘图表明GC12与GC3的相关系数为0.143,相关性不显著,回归系数为0.0573;频数分布显示,55%基因的ENC比值集中分布在0~0.1,25%基因的ENC比值分布在0.1~0.2之间;对应分析结果表明,第一向量轴占10.12%的差异,第二向量轴占9.36%的差异,其余两轴分别占7.97%和7.46%,前4轴累计差异为34.91%。中性绘图、ENC-plot和对应性分析均表明普通油茶叶绿体基因密码子偏好受突变作用,更多受选择的影响。最终取高表达优越密码子和高频密码子共有的CUU、AUU、GUU、GUA、UAA、CAA、AAA、GAC、GAA、CCU、ACU、GCU、GCA、UGU、CGU、AGU、UUG、GGU等18个密码子作为最优密码子。该研究结果为利用叶绿体基因工程技术改良普通油茶重要经济性状奠定了基础。

关键词: 普通油茶, 叶绿体, 密码子偏好, ENC, RSCU

中图分类号: Q943.2

文献标识码: A

文章编号: 1000-3142(2018)02-0135-10

Condon preference of chloroplast genome in Camellia oleifera

WANG Pengliang1,3*, YANG Liping2, WU Hongying2, NONG Youliang1, WU Shuangcheng1, XIAO Yufei3, QIN Zihai3, WANG Huayu1,2, LIU Hailong3

( 1. Guangxi Key Laboratory of Beibu Gulf Marine Biodiversity Conservation, Qinzhou University, Qinzhou 535011, Guangxi, China; 2. Qinzhou Key Laboratory of Plant Biotechnology, Qinzhou Forestry Science Insititute, Qinzhou 535099, Guangxi, China; 3. Guangxi Key Laboratory of Special Non-Wood Forest Cultivation and Utilization, Guangxi Zhuang Autonomous Region Forestry Science Institute, Nanning 530002, China )

Abstract: With the rapid development of the industry and increase of planting area of Camellia oleifera, the harvest was still affected by the factors such as the tolerance of disease, insect and drought as well as mating compatibility. Genetic engineering of chloroplast was an effective way to improve the important traits of plant. In order to improve the important traits of C. oleifera, it was necessary to carry out the analysis on codon preference of its chloroplast genome. The whole genome sequence of chloroplast in C. oleifera taken as raw material, 51 CDS who were longer than 300 bps, started with ATG and not repeated were screened for future analysis. The codon preference was conducted by the CodonW software. The results indicated that the GC content of the third base of genetic code was 27.55% and effective number of codons ranged from 35.23 to 56.67 with an average of 46.09 and then 29 codons of 30 whose RSCU were more than 1 ended with A or U. Neutral plot analysis showed the correlation between GC12 and GC3 was not significant and the coefficient of correlation and regression was 0.143 and 0.057 3, respectively. Frequency analysis showed 55% and 25% of the ENC ratio of genes focused on the region of 0-0.1 and 0.1-0.2. Correspondence analysis indicated the first axis accounted for 10.12 variation and the rested three axises accounted for 9.36%, 7.97% and 7.46% and the first four axises accounted for 34.91% in total. All the methods used in this study showed that codon preference was affected by not only mutation and but also selection. Finally the 18 optimal codons including CUU, AUU, GUU, GUA, UAA, CAA, AAA, GAC, GAA, CCU, ACU, GCU, GCA, UGU, CGU, AGU, UUG, GGU were determined. This work provides plenty of information for improving important traits of C. oleifera utilizing the genetic engineering of chloroplast.

Key words: Camellia oleifera, chloroplast, codon preference, effective number of codon, relative synonymous codon usage

普通油茶(Camellia oleifera)是山茶科(Theacae)山茶属(Camellia)一类植物,是我国南方最重要的木本食用植油料物种之一(张恩慧等, 2016)。目前,油茶最具价值的部分为油茶果。茶籽油富含多种对人体健康有益的成分,对于提高人体的健康水平有很大影响,尤其是在人体免疫力和预防高血压等方面,因此是一种非常优质的食用油,被誉为“东方的橄榄油”;同时茶籽油还含有多种有益于皮肤的成分,易于吸收,无刺激性,所以常被用于调制药膏和高级化妆品的用油(庄瑞林, 2007);其果壳由木质素、半纤维素和纤维素组成,可以用来制作糠醛、木糖醇、培养基、活性炭等;茶籽粕可以直接用于制作肥料及提取茶皂素、鞣质(单宁)、黄酮、生物碱等生物活性物质。

当前由于我国人口规模增长和居民收入水平提高,我国食用植物油消费总量快速增长,尽管近年来植物油生产稳步增长,然而消费增速高于生产增速,缺口仍然较大(张雯丽, 2016)。国家主动调整油料物种产业结构,由于油茶油质好、生长快、寿命长、适应性强、不占用耕地等优点,油茶产业得到重视,油茶产业获得快速发展,新品种数量增加,推广面积持续扩大。到目前为止,全国油茶种植面积约为426.67万hm2(罗晨,2016)。

油茶产量持续增长,但油茶生产中还会遇到以下问题:首先,近年来大面积油茶病害的发生,如炭疽病,软腐病和叶肿病(徐丽萍和檀根甲, 2015);其次,大规模虫害的出现,如蚧壳虫,象鼻虫等;第三,由于油茶的抗旱性弱导致低龄油茶植株死亡率高,引起油茶落花、落果,降低产量(左继林等, 2012; 陈永忠等, 2014);最后,油茶的交配亲和性也严重影响了油茶的产量(常维霞和姚小华, 2016; 常维霞等, 2016)。

基因工程技术是改良植物重要性状的有效手段 (王关林和方宏筠, 2014)。叶绿体基因组是理想的转化载体,高表达优势明显,同时能将转化基因的扩散控制在最低程度(Daniell & Chase, 2004)。叶绿体基因组中存在密码子偏好,而且不同物种间密码子偏好差异显著(Morton, 1999; Liu & Xue, 2005)。为了更好地设计叶绿体高效表达载体,进一步利用叶绿体基因工程技术改良油茶重要性状,有效降低油茶产量损失,分析普通油茶叶绿体基因组密码子偏好十分必要。

1 材料与方法

1.1 序列材料

根据已报道的叶绿体基因组的GenBank登录号NC_023084.1(Shi et al, 2013),登陆NCBI数据库(https://www.ncbi.nlm.nih.gov/),搜索并下载完整普通油茶叶绿体基因组序列及其CDS(Coding DNA Sequence),序列总长度为156 971 bp,共包含87条编码蛋白的CDS。由于短序列无法正确计算有效密码子数 (Wright, 1990),为了减少样本误差,本研究选择以ATG为起始密码子的非重复且长度大于300 bp的序列进行分析。

1.2 方法

1.2.1 密码子偏好参数计算 以选取的CDS为研究对象,使用CodonW 1.4.2软件和在线程序CUSP(http://imed.med.ucm.es/EMBOSS/)分析密码子使用偏好参数,即有效密码子数(Effective Number of Codon, ENC)、相对同义密码子使用度(Relative Synonymous Codon Usage, RSCU)、GC、GC1、GC2、GC3、GC3s。其中,GC、GC1、GC2、GC3分別代表了基因CDS序列的GC总含量和密码子的对应位置上的GC含量,GC3s为同义密码子第三位的GC含量。

1.2.2 中性绘图分析 中性绘图是一种可初步判断影响密码子使用偏好因素的方法。首先计算密码子GC1和GC2的平均值GC12,再以计算出的平均值为纵坐标,以GC3为横坐标作散点图,图中每一个点就代表一个基因的位置。由中性绘图可分析密码子的前两位碱基和第三位碱基的关系,从而判断密码子使用偏好由突变或选择造成。

1.2.3 ENC-plot绘图 以GC3为横坐标,ENC为纵坐标,构建二维散点图,并在图中构建出ENC值的标准曲线。每个基因点分布在标准曲线附近,这代表密码子偏好性只是受到了突变作用的影响,如果各基因点集中在预期曲线下方,表明密码子偏好更多受选择影响。

标准曲线的公式如下(Wright, 1990):

ENC=2+GC3+29GC23+(1-GC3)2

1.2.4 对应性分析 对应性分析是一种利用多元统计探究不同基因密码子变异趋势的方法。利用CodonW软件的RSCU对应分析功能,将所有基因分布到59维向量空间,从而反映出密码子使用偏好特点。通过分析基因位置探究基因向量及基因间的值的变异程度,推测导致密码子偏好发生的原因。

1.2.5 最优密码子确定 以ENC偏好性为标准排序,两端各选出10%基因,分别建立高低偏性库,取两库中ΔRSCU>0.08的密码子作为高表达优越密码子(杨惠娟等, 2012; 杨国锋等, 2015)。将高表达优越密码子与高频密码子相比较,确定出最优密码子(刘庆坡和薛庆中, 2004; 续晨等, 2010; 罗洪等, 2015; 胡莎莎等, 2016)。

2 结果与分析

2.1 密码子组成分析

根据密码子使用偏好分析要求,本文筛选到51条CDS,再利用CodonW软件和CUSP程序对筛选出的CDS进行分析。表1结果表明,密码子第一位的GC平均含量为46.86%、第二位为39.28%、第三位为27.55%,第三位的GC含量明显小于前两位的GC含量,而且相差较大,说明普通油茶叶绿体基因密码子偏好于A和U结尾。 ENC范围在35.23~56.67之间,平均值为46.09。ENC值小于35说明密码子偏性强,高于35则说明偏性比较弱的标准(Jiang et al, 2008),说明普通油茶叶绿体基因密码子偏性较弱。

相关分析结果(表2)显示,GC和GC1、GC2、GC3的相关性均达到极显著水平,其相关系数分别为0.829、0.766、0.379。GC1和GC2的相关性也达到了极显著水平,其相关系数为0.445,但GC3与GC1,GC2的相关性均未达到显著相关水平,说明密码子前两位的GC含量比较相似,第三位GC含量和前两位差异较大。ENC与GC3呈显著相关,其相关系数为0.350,说明第三位碱基的组成会对密码子的使用偏性有影响。密码子数目N与GC3、ENC显著相关,表明基因序列长度对GC3和密码子的偏好性有一定的影响。

RSCU分析结果(表3)表明,RSCU值大于1.00的密码子数目为30个。其中,16个第三位碱基为U;13个以A结尾;1个以G结尾。这说明普通油茶叶绿体基因组密码子偏爱以A或U(T)结尾,不偏好以G或C结尾的密码子。

2.2 中性绘图分析

普通油茶叶绿体基因中性绘图分析(图1)显示, GC12的取值范围为0.319 6~0.550 4, GC3的范围为0.191 2~0.371 0。GC12与GC3的相关系数为0.143,相关性未达到显著水平,回归系数为0.057 3,说明GC12和GC3 的相关性微弱。突变对密码子第一位、第二位和对第三位碱基组成的影响不同。各基因都落在对角线的上方,并且没有对角线上或沿着对角线分布。突变不是密码子偏性形成的主要原因。因此,普通油茶叶绿体基因密码子的使用更多地受选择的影响。

2.3 ENC-plot绘图

以GC3为X轴,ENC为Y轴作图(图2),图2中各点为基因分布情况。代表基因的各点基本都落在了标准曲线的下方。为了能更直接地显示出

差异,根据ENCexp-ENCobsENCexp公式,计算ENC比值,再统计ENC比值的分布(表4)。频数分布显示,55%的基因的ENC比值集中分布在0~0.1,25%的基因ENC比值分布在0.1~0.2的区间,结果表明ENCexp与ENCobs有差异。假如ENCexp与ENCobs接近时,表明基因的密码子受突变影响;本文中ENCexp与ENCobs有差异较大,所以普通油茶叶绿体基因组密码子偏好更多受选择的影响(胡莎莎等, 2016)。

2.4 对应性分析

RSCU的对应分析结果表明,第一向量轴占10.12%的差异,第二向量轴占9.36%的差异,其余两轴分别为7.97%和7.46%,前4轴累计差异为34.91%,说明第一轴对普通油茶叶绿体基因组密码子偏好性造成的影响最大。第一轴与GC3的相关性为0.215和ENC的相关性为0.104,均相关不显著。这说明GC3是对普通油茶叶绿体基因组密码子偏好性造成影响的不大,密码子的偏好性受到其他多方面因素的影响。以Axis 1为横坐标,Axis 2为纵坐标,从各基因在第一、第二轴的分布(图3)看出,与遗传结构相关的基因分布相对比较集中,说明两个类基因的密码子使用是比较接近的;而其他类别基因可能是因为密码子使用模式不同,分布比较分散。

2.5 最优密码子分析

以密码子的有效数量ENC为标准对所有基因的CDS序列进行排序,先从排序结果的两端各选取5个基因分别建立高表达基因库和低表达基因库;然后使用CodonW计算两个表达库中的RSCU值,并计算高低库ΔRSCU值(表5);最后确定22个密码子(表中带星号的)为普通油茶叶绿体基因组高表达优越密码子,10个以U结尾、6个以A结尾、5个以C结尾和1个以G结尾。

先将22个高表达优越密码子和表3得出的30个高频密码子相比较,然后选取共有的密码子作为最优密码子,最后确定了18个密码子为普通油茶叶绿体基因组最优密码子,分别为CUU、AUU、GUU、GUA、UAA、CAA、AAA、GAC、GAA、CCU、ACU、GCU、GCA、UGU、CGU、AGU、UUG、GGU,其中有2个密码子以G或C结尾,其余的16个密码子均以A或U结尾。

3 讨论

在20种氨基酸中,除了甲硫氨酸和色氨酸只有单个密码子外,其他18种氨基酸均有多种密码子,即遗传密码子存在简并性。密码子简并性常常表现在第三位密码子上(朱圣庚和徐长发, 2016),因此在普通油茶叶绿体基因组碱基组成中发现,GC1、GC2显著相关,GC3与GC1、GC2相关不显著,且GC3小于GC1和GC2,说明普通油茶叶绿体基因组的碱基组成偏向于A和T,第3位密码子通常以A、T结尾。这与多数植物,如文心兰(李冬梅等, 2012)、甜蕎(罗洪等, 2015)、苦荞(胡莎莎等, 2016)、蝴蝶兰(续晨等, 2010)、蒺藜苜蓿(杨国锋等, 2015)等物种的特点相一致。

突变和选择是密码子偏好形成的主要原因。ENC-plot分析结果表明,部分基因落点位于标准曲线附近,基因的实际ENC值与理论ENC值基本一致,说明这些密码子偏好受到GC含量(突变)的影响较大;而大多数基因的落点离标准曲线较远,实际ENC值与理论ENC值的差异较大,受选择的影响较大。因此,普通油茶叶绿体密码子偏好受到突变的影响,更多的是受到了选择的作用。

中性绘图和对应性分析均支持普通油茶密码偏好受突变和选择共同作用。这与已报道的文心兰(李冬梅等, 2012)、蝴蝶兰(续晨等, 2010)、银白杨(Zhou et al, 2008)、甜荞(罗洪等, 2015)等有相似的结论;本文结果也印证了选择对叶绿体密码子使用起显著影响(Morton, 1998)。

本研究采用由高表达优越密码子和高频密码子中选出两者共有的密码子,可以避免由于单方法存在问题而导致结果出错,最终确定了CUU、AUU、GUU、GUA、UAA、CAA、AAA、GAC、GAA、CCU、ACU、GCU、GCA、UGU、CGU、AGU、UUG、GGU等18个密码子为普通油茶叶绿体基因的最优密码子。在此基础上可以通过对目的基因的密码子进行优化,提高该基因的表达效率,从而为改良普通油茶重要性状奠定坚实基础。

參考文献:

CHANG WX, YAO XH, 2016. Study onself-compatibility of Camellia oleifera clones [J]. For Res, 29(4): 508-514. [常维霞,姚小华, 2016. 油茶无性系自交亲和性分析 [J]. 林业科学研究,29(4): 508-514.]

CHANG WX, YAO XH, LONG W, et al, 2016. Cross-compatibility of four kinds of Camellia species [J]. Bull Bot Res, 36(4): 527-534. [常维霞,姚小华,龙伟,等,2016. 4个油茶物种杂交亲和性分析 [J]. 植物研究,36(4): 527-534.]

CHEN YZ, LUO J, CHEN LS, et al, 2014. Drought injury and countermeasure of Camellia oleifera in Hunan Province [J]. Nonwood For Res, 32(3): 22-29. [陈永忠,罗健,陈隆升,等,2014. 湖南省油茶旱害及防治对策 [J]. 经济林研究,32(3): 22-29.]

DANIELL H, CHASE C, 2004. Molecular biology and biotechnology of plant organelles [M]. Dordrecht, Springer.

HU SS, LUO H, WU Q, et al, 2016. Analysis of codon bias of chloroplast genome of Fagopyrum tataricum [J]. Mol Plant Breed, 14(2): 309-317. [胡莎莎,罗洪,吴琦,等,2016. 苦荞叶绿体基因组密码子偏爱性分析 [J]. 分子植物育种,14(2): 309-317.]

JIANG Y, DENG F, WANG H, et al, 2008. An extensive analysis on the global codon usage pattern of baculoviruses [J]. Arch Virol, 153(12): 2273-2282.

LI DM, L FB, ZHU GF, et al, 2012. Analysis on codon usage of chloroplast genome of Oncidium Gower Ramsey [J]. Guangdong Agric Sci, 10: 61-65. [李冬梅,吕复兵,朱根发,等,2012. 文心兰叶绿体基因组密码子使用的相关分析 [J]. 广东农业科学,10: 61-65.]

LIU Q, XUE Q, 2005. Comparative studies on codon usage pattern of chloroplasts and their host nuclear genes in four plant species [J]. J Gene, 84(1): 55-62.

LIU QP, XUE QZ, 2004. Codon usage in the chloroplast genome of rice (Oryza sativa L. ssp. japonica) [J]. Acta Agronom Sin, 30(12): 1220-1224. [刘庆坡,薛庆中,2004. 粳稻叶绿体基因组的密码子用法 [J]. 作物学报,30(12): 1220-1224.]

LUO C, 2016. The area of Camellia achieved 64 million acres [EB/OL]. WWW. cnfood. cn/n/2016/1219/98628. html. [罗晨, 2016. 全国油茶面积已达6400多万亩 [EB/OL]. WWW. cnfood. cn/n/2016/1219/98628. html.]

LUO H, HU SS, WU Q, et al, 2015. Analysis of buckwheat chloroplast gene codon bias [J]. Genomics Appl Biol, 34(11): 2457-2464. [罗洪,胡莎莎,吴琦,等,2015. 甜荞叶绿体基因密码子偏爱性分析 [J]. 基因组学与应用生物学,34(11): 2457-2464.]

MORTON BR, 1998. Selection on the codon bias of chloroplast and cyanelle genes in different plant and algal lineages [J]. J Mol Evol, 46(4): 449-459.

MORTON BR, 1999. Strand asymmetry and codon usage bias in the chloroplast genome of Euglena gracilis [J]. Proc Nat Acad Sci USA, 96(9): 5123-5128.

SHI C, LIU Y, HUANG H, et al, 2013. Contradiction between plastid gene transcription and function due to complex posttranscriptional splicing: An exemplary study of ycf15 function and evolution in angiosperms [J]. PLoS ONE, 8(3): e59620.

WANG GL, FANG HY, 2014. Plant genetic engineering [M]. 2nd ed. Beijing: Science Press. [王關林,方宏筠, 2014. 植物基因工程 [M]. 第2版. 北京: 科学出版社.]

WRIGHT F, 1990. The ‘effective number of codons used in a gene [J]. Gene, 87(1): 23-29.

XU LP, TAN GJ, 2015. Epidemic of Camellia oleifera diseases and their relations to the ecological conditions [J]. J Anhui Agric Univ, 42(2): 272-275. [徐丽萍,檀根甲, 2015. 油茶主要病害流行与生态条件的关系和生态调控技术 [J]. 安徽农业大学学报,42(2): 272-275.]

XU C, BEN AL, CAI XN, 2010. Analysis of synonymous codon usage in chloroplast genome of Phalaenopsis aphrodite subsp. formosana [J]. Mol Plant Breed, 8(5): 945-950. [续晨,贲爱玲,蔡晓宁,2010. 蝴蝶兰叶绿体基因组密码子使用的相关分析 [J]. 分子植物育种,8(5): 945-950.

YANG GF, SU KL, ZHAO YR, et al, 2015. Analysis of codon usage in the chloroplast genome of Medicago truncatula [J]. Acta Pratacul Sin, 171-179. [杨国锋,苏昆龙,赵怡然,等,2015. 蒺藜苜蓿叶绿体密码子偏好性分析 [J]. 草业学报, 24(12): 171-179.]

YANG HJ, LIU GS, ZHANG ST, et al, 2012. Codon usage bias studies and cluster analysis on chloroplastic genes in tobacco [J]. Acta Tabac Sin, 18(2): 37-43. [杨惠娟,刘国顺,张松涛,等, 2012. 烟草叶绿体密码子的偏好性及聚类分析 [J]. 中国烟草学报,18(2): 37-43.]

ZHANG EH, WANG XY, QIN ZH, et al, 2016. Genetic diversity analysis of Camellia oleifera in Guangxi using SSR markers [J]. Guihaia, 36(7): 806-811. [张恩慧,王晓云,覃子海,等, 2016. 广西普通油茶种质资源遗传多样性的SSR分析 [J]. 广西植物,36(7): 806-811.]

ZHANG WL, 2016. Supply and demand of Chinas oilseeds and edible vegetable oil and their prospects during the 13th five-year plan period [J]. Agric Outlook, (2): 4-8. [张雯丽,2016. 中国油料及食用植物油供需形势及“十三五”展望 [J]. 农业展望,(2): 4-8.]

ZHU SG, XU CF, 2016. Biochemistry [M]. 4th ed. Beijing: Higher Education Press. [朱圣庚,徐长发,2016. 生物化学 [M]. 第4版. 北京: 高等教育出版社.]

ZHUANG RL, 2007. Chinese oil tea [M]. 2nd ed. Beijing: Chinese Forestry Publishing House. [庄瑞林,2007. 中国油茶 [M]. 第2版. 北京: 中国林业出版社.]

ZHOU M, LONG W, LI X, 2008. Analysis of synonymous codon usage in chloroplast genome of Populus alba [J]. J For Res, 19(4): 293-297.

ZUO JL, WANG YJ, GONG C, et al, 2012. Effects of different management measures on the fruit shape growth of high yield Camellia oleifera under during the summer drought period [J]. J Centr Southern Univ For & Technol, 32(4): 15-20. [左继林,王玉娟,龚春,等,2012. 高产油茶夏旱期不同经营措施对其果形生长的影响 [J]. 中南林业科技大学学报,32(4): 15-20.]

猜你喜欢

叶绿体
安吉白茶白化叶和返绿叶叶绿体超微结构和叶绿素及其前体物含量的比较
紫薇金叶品种金幌叶色变化响应高光照的生理特性
甘薯卷叶病毒侵染对叶绿体超微结构的影响
共生
人不吃饭行吗
低氮下外源海藻糖对烤烟叶绿素代谢及叶绿体发育的影响
安吉白茶白化叶和返绿叶叶绿体超微结构和叶绿素及其前体物含量的比较
植物叶绿体盐逆境应答蛋白质组学研究进展
橡胶树β—淀粉酶基因HbBAM1的克隆与表达分析
一种快速提取微藻完整叶绿体及其DNA的方法