APP下载

薏苡转录组中密码子使用偏好性分析

2022-05-16张重菊赵懿琛赵德刚

种子 2022年4期
关键词:碱基拟南芥氨基酸

张重菊, 赵懿琛, 赵德刚,2

(1.贵州大学山地植物资源保护与种质创新省部共建教育部重点实验室/生命科学学院/茶学院, 贵阳 550025;2.贵州省农业科学院, 贵阳 550006)

生物体在生长发育过程中表现出来的特异性性状主要是蛋白质的不同所引起的,蛋白质作为生物体主要成分之一,维持生命体的活动具有举足轻重的作用。一个氨基酸可对应多个密码子,这种现象称为密码子的简并性[1]。密码子的简并性具有非常重要的生物学意义,在面对极端环境时,可以减少生物体内碱基突变带来的危害,进而维持群体的稳定性,编码同一氨基酸的密码子称为同义密码子,理论上生物内同义密码子在无外界环境干扰或碱基突变的情况下使用的频率是相同的[2]。由于环境对物种的选择以及其他因素的干扰,同种物种相同基因对密码子的使用也存在差异[3],即生物体为了适应环境压力,在选择使用密码子时,会优先选择一些有利于自生生长发育的密码子,这些密码子称为最优密码子,即密码子使用存在着偏好性[4]。在物种生存过程中,被优先选择使用的密码子对于物种生存具有举足轻重的作用,如基因表达调控、转录以及翻译过程、GC含量[5-6]。此外,根据密码子的特性,在进行遗传转化工作中,选择适宜的宿主细胞,增加转化效率[7],所以研究密码子偏好性对生物学遗传转化研究具有重大意义。

薏苡(Coixlachrymal-jobiL.)又称为水玉米、晚念珠、六谷迷等,多为一年生或多年生禾本科薏苡属植物。薏苡仁、茎、叶、根中含有极为丰富的营养物质,具有 “天下第一米”、“禾本科植物之王”、 “生命健康之禾”等美誉。薏苡仁含有酚类、黄酮类、多糖、蛋白质、纤维、维生素和油脂等物质[8-9],所以薏苡逐渐成为人们研究的重要农作物之一。目前关于薏苡基因的研究相对其成分分析和药食作用较少,具有较大的研究空间,所以本试验结合薏苡转录组数据对薏苡密码子的偏好性进行分析,选择出在薏苡中发挥重要功能的关键密码子,培育出优良抗病的薏苡。该研究在提取薏苡总RNA后得到转录组数据,根据转录组数据中确定的54 275个基因密码子进行分析,分析中采用了密码子相对使用频率、ENC(Etfective Number of Codons)与GC 3 s关联分析及PR 2-plot偏倚分析等分析方法。此外,为了表明薏苡密码子的使用具有自身特异性,将其密码子与3种单子叶植物(水稻、高粱和玉米)、双子叶植物(拟南芥)、真核生物(酿酒酵母)以及原核生物(大肠杆菌)进行比较,分析薏苡与它们对于同义密码子的使用模式。本研究可为促进薏苡基因遗传转化提供理论基础,也可为培养优质薏苡种质资源给薏苡导入异源基因有一定的参考价值。

1 材料与方法

1.1 材 料

本实验室所采用的植物材料为薏苡,通过Trizol法提取薏苡总RNA,并进行反转录得到cDNA,将cDNA进行测序得到54 275个基因序列。此外,利用Codon Usage Database在线软件的水稻、高粱、玉米、拟南芥、酿酒酵母以及大肠杆菌等生物相关密码子信息,与薏苡进行比较。

1.2 方 法

1.2.1同义密码子相对使用频率分析

RSCU(Relatives Snonymous Codon Usage, RSCU)指编码某一氨基酸所特指的密码子和全部能编码该氨基酸的一切密码子的比值。通常生物体内的密码子是随机被选择应用的,但是事实并非如此,RSCU值可判断是否存在密码子使用偏好,RSCU小于1时,说明该密码子被低频率使用;当RSCU等于1时,说明该密码子被随机使用,而当RSCU大于1时,说明该密码子被高频率使用[10]。

1.2.2GC 12-GC 3关联性分析

采用2016版Office软件中的Excel和GraphPad软件对转录组数据中的GC 12和GC 3分别作纵坐标和横坐标作图进行相关性分析,其中GC 12为G 3和C 3值的平均值。对此进行分析可评价自然选择压力及突变对密码子使用偏好造成的影响[11]。

1.2.3ENC-GC 3 s关联性及ENC比值频数分布分析

ENC(Effective Number of Codons, ENC)是指所有能编码成氨基酸的密码子数量,最大值为61,最小值为20。ENC值越小,偏好性越强,反之则越弱。GC 3是为密码子第三位是G或者C的频率。本文将ENC和GC 3值分别作图进行分析[12]。分布在标准曲线两侧附近表示外界环境对该生物密码子使用影响较小,密码子的使用特征主要由碱基突变所决定[13]。

ENC比值=[(ENC理论值-ENC实际值)/ENC理论值]来统计ENC的频数分布[14],薏苡密码子使用特征的影响因素作进一步的分析[11]。

1.2.4薏苡密码子奇偶偏性分析(PR 2-plot)

以A 3/(T 3+A 3)、G 3/(G 3+C 3分别为横坐标和纵坐标作图,判断密码子第三位A 3、T 3、G 3、C 3对密码子组成的影响。纵横中分线划分该图为4个部分,当G和C(或者A和T)所占比例相近时,基因密码子偏好性完全受突变影响;若其组成比例相差过大时,表明密码子使用偏好性受自然选择和其他因素共同影响[11,15]。

1.2.5薏苡与其他物种的GC含量及密码子使用频率比较

本研究利用Excel软件结合一定的公式对薏苡各基因密码子的使用频率进行计算。并将其与水稻、高粱、玉米、拟南芥、酿酒酵母和大肠杆菌的密码子使用频率进行比较分析,比值≥2或≤0.5表示两物种间密码子使用偏好性差异较大[16]。将薏苡与以上这几种物种的密码子使用频率作热图分析薏苡密码子使用差异性。

2 结果与分析

2.1 RSCU值分析

Codon W软件作为一款密码子分析利器,在对一个物种或者基因的密码子进行分析时,密码子的相对使用统计信息(表1)可以在此软件中获得,这些信息包括密码子的GC含量(GC content)、ENC值、密码子的偏好指数(Codon Bias Index, CBI)等。密码子分析中常使用同义密码子的相对使用频率判断一个密码子是否被常用。

表1 薏苡同义密码子的相对使用度统计Table 1 Relative usage of codons in Coix lachryma-jobi L.

薏苡的RSCU结果如表2所示,以A或U碱基结尾的密码子中,RSCU值中比1大的密码子有16个,如UUG、CUC、CUG等;RSCU为1的密码子仅存在AAU这1个;RSCU比1小的有15个,如UUU、UUA、CUA等,这些密码子大部分具有较高或较低的偏好性,极少密码子没有偏好性,以A或U结尾的密码子当RSCU值中大于1时偏向于使用U作为结尾。此外,以碱基C或G作第三位的密码子的RSCU值中大于1的密码子有10个,如UUG、CUC、CUG等;RSCU等于1的密码子仅有AGC这1个,小于1的有21个,如UUG、CUC、GUC等,这些密码子同样具有很低的偏好性或无偏好性,以碱基G或C为第三位碱基的密码子当RSCU值中大于1时偏向于使用C结尾。薏苡偏好使用的密码子中大多数以A或C作第三位碱基,推测薏苡在进化过程中受到其他因素影响时,发生突变的可能性较大。薏苡在对3个终止密码子的使用中,UAA的使用频率相对于UAG和UGA较小。

表2 薏苡基因编码氨基酸的同义密码子的相对使用频率Table 2 Relative usage frequency of synonymous codons gene encoding amino acids in Coixlachrymal-jobi L.

2.2 GC 12与GC 3关联性分析

分析GC 12和GC 3两者之间的关联性,结果(图1)发现,两者之间的相关性较弱(R2=0.125 3),拟合曲线(Y=0.412X+0.196 2)。大多数位点分布在对角线(CG 12=GC 3)之外,说明该生物密码子受碱基突变和自然选择压力的影响较大。

2.3 ENC与GC 3 s的相关性分析

以各基因ENC值为纵坐标,GC 3值为横坐标作图分析(如图2),从图中可以观察到一部分基因位点分布在标准曲线(Y=27.77+105.8X-109.5X2,R2=0.533 6)周围,同样说明薏苡密码子使用受自身碱基突变压力所影响,另一部分分布在距离标准曲线较远的位置,说明薏苡在进化过程中密码子的使用也会受到外界环境的干扰。

图1 GC 12-GC 3关联分析Fig.1 Association analysis of GC 12-GC 3

图2 PR 2 bias-plot分析Fig.2 Analysis of PR 2 biasplot

2.4 奇偶性偏倚分析(PR 2-plot)

对薏苡基因PR 2偏倚分析如图3所示,薏苡基因位点下半部分略少于上半部分,薏苡左半部分明显多于右半部分,即A和U所占比例相差不大,但是G和C所占比例相差较大。表明在密码子的第三个碱基上C使用最多,U次之,这个结果与密码子相对使用频率分析一致。

ENC比值频数主要分布在-0.05~0.05之间,有9 579个基因,占总基因的36.53%,其次是分布在-0.15~-0.05之间,有15 904个基因,占总基因的29.67%,再者就是0.05~0.15之间的占12.26%,其他的便分布在不同组内。说明ENC期望值与观测值之间具有不同程度的差异且薏苡密码子的ENC比值相对较低,说明薏苡密码子偏好性使用除了受自身碱基突变影响之外,还受到自然选择不同程度的影响。

图3 ENC与GC 3关联分析Fig.3 Analysis of ENC and GC 3 relationship

表3 ENC比值频数分布Table 3 Frequency distribution of ENC ratio

2.5 薏苡密码子与多物种密码子的GC含量及密码子使用频率的比较

本研究从Codon Usage Database数据库中提取得到单子叶植物水稻、高粱和玉米以及双子叶植物拟南芥,真菌酿酒酵母和原核生物大肠杆菌的相关信息,选取以上物种密码子的关键信息与薏苡的密码子偏好性进行比较,结果如表5所示,薏苡与水稻、高粱、玉米这3种植物比,前者与后三者的一部分密码子使用频率比值≥2或≤0.5的分别有4种、1种和4种,与作为典型的双子叶植物拟南芥相比有2种,与真菌酿酒酵母的和原核生物大肠杆菌的分别有5种和6种。薏苡的密码子使用频率与以上几种生物之间存在一定的差异,但是与同为禾本科植物的高粱差异最小,说明两者具有较近的亲缘关系。相比其他物种而言,拟南芥与大肠杆菌或许是薏苡基因异源转化的最佳载体。

表4 薏苡与其他生物密码子偏爱性比较Table 4 Comparison of codon preference between Coix lachryma-jobi L. and other biological codons

表4(续)

表5 不同物种密码子GC含量Table 5 GC content of codon in different species

3 讨 论

碱基序列上3个连续排列的碱基称之为密码子,之前的研究推测一个氨基酸对应着一个密码子,或者是一个氨基酸对应着两个密码子,但是都被一一推翻,最终证实一个或者多个密码子可参与合成一个氨基酸,蛋白质翻译过程中的这种特征称为密码子的简并性[17]。密码子的该特性能够使生物体基因在受到环境变化或者其他因素的影响下发生的碱基突变而增加对环境的适应,从而减少对生物体的伤害。每一种生物对密码子的使用都有自己的独特性,不同生物体之间可能相似或者同类生物之间相差极大。对物种的密码子使用特征进行分析,可为优化生物遗传转化途径作理论基础。

对物种进行偏好使用频率较大的密码子分析,其功能的软件通常采用Codon W,RSCU表示某一氨基酸的特指密码子与能翻译成该氨基酸的全部密码子进行相比,得到的数值称为同义密码子之间的相对使用频率。对薏苡密码子的RSCU值分析发现,薏苡对密码子使用存在一定的偏好性,总共有26个密码子具有偏好性,且多以A或U结尾。

对薏苡各基因密码子进行GC 12与GC 3和ENC与GC 3的关联性分析发现,GC 12与GC 3的关联性强,密码子使用主要受到碱基突变的影响。进一步对ENC与GC 3的关联性分析表明,该生物密码子主要受到自身碱基突变的影响,其次还受到自然选择和其他因素的影响。PR 28-plot图分析基因密码子中的第三位GC发现,图上半部分表示密码子中使用A碱基的频率比使用U碱基的频率大,下半部分则表示使用U碱基的频率比使用A碱基的频率大;竖线右边部分表示使用G碱基的频率比使用C碱基的频率大,竖线右边部分表示使用C碱基的频率比使用G碱基的频率大。薏苡使用的密码子偏好以C和U结尾。

将薏苡密码子的GC含量和使用频率与水稻、高粱、玉米、拟南芥、酿酒酵母以及大肠杆菌进行比较发现,主要决定氨基酸种类的第一、二位碱基所占比例与同为禾本科单子叶植物的水稻、高粱和玉米存在较小的差异,这对将薏苡归类为禾本科单子叶植物提供了有力的证据,同时这与王兰兰[18]对薏苡GA 2ox蛋白同源序列分析的结果中薏苡与高粱具有非常近的亲缘关系一致。进一步分析发现,单子叶植物与双子叶植物之间无论是密码子的GC含量还是使用频率都存在一定的差异。目前,关于烟草、拟南芥等双子叶模式植物的研究很多,但是对于单子叶植物除了水稻之外,还需挖掘更多典型的单子叶植物进行研究,且此类植物在转化上还需进一步的优化。对此可以为薏苡基因遗传异源转化筛选出转化效率更高的受体植物,薏苡与双子叶植物拟南芥的差异最小,所以拟南芥可能是验证薏苡基因功能的最佳受体植物,且在烟草中已证实薏苡GA 2氧化酶基因具有矮化功能[18]。与其他外源表达载体相比,酿酒酵母和大肠杆菌密码子偏好性存在的差异都较小,可见大肠杆菌真核表达体系或者酿酒酵母表达体系都适合作为薏苡基因的异源表达实验载体,但相比于酵母表达体系,大肠杆菌表达体系具有更多范围的用途,大肠杆菌的pET表达载体对于外源蛋白具有表达最高产量、最快速度、最高效率的优选表达载体[19]。目前关于薏苡遗传转化的相关研究报导极少。薏苡茎尖遗传转化已被证实[19],但是转化效率极低,所以对薏苡密码子的使用模式进行分析,了解其密码子的偏好性,通过有目的地修改碱基组成,提高碱基表达水平的同时,有望提高薏苡的转化效率,培育出优良的薏苡种质资源,为我国薏苡产业良好发展奠定一定的理论基础。研究受体系统的密码子偏好性,有利于为验证薏苡基因而寻找适合的转化载体,综合转录后调控、转化等因素,优化密码子组成来提高转化效率[20]。

猜你喜欢

碱基拟南芥氨基酸
饲料氨基酸释放动态对猪氮素利用影响的研究进展
基因“字母表”扩充后的生命
创建新型糖基化酶碱基编辑器
科学解读食物中的蛋白质如何分“优劣”
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
补氨基酸不如吃鸡蛋
拟南芥
口水暴露了身份
一株特立独行的草