APP下载

谷子eIF5A基因家族鉴定与分析

2018-08-16张杰伟秦新月陈亚娟崔进荣魏建华

西南农业学报 2018年7期
关键词:拟南芥谷子磷酸化

张杰伟,秦新月,2,陈亚娟,刘 婧,3,崔进荣,姚 磊*,魏建华*

(1.北京市农林科学院北京农业生物技术研究中心,农业基因资源与生物技术北京市重点实验室,北京 100097;2.北京农学院植物科学技术学院,北京 102206;3.内蒙古师范大学生命科学与技术学院,内蒙古 呼和浩特 010022)

【研究意义】真核翻译起始因子5A(eukaryotic translation initiation factor 5A, eIF5A)是一类普遍存在于真核生物细胞中、分子质量为16~18 kDa的高度保守小分子蛋白质;是迄今为止发现的唯一含有羧腐胺赖氨酸(hypusine)残基的蛋白质[1-2]。Hypusine是由eIF5A蛋白翻译后特定位置的赖氨酸在脱氧羧腐胺赖氨酸合酶(DHS)的和脱氧羧腐胺赖氨酸羟化酶(DOHH)的作用下形成的。eIF5A前体没有活性,每个成熟eIF5A仅含有1个hypusine残基, 该残基是eIF5A 行使生物学功能所必需的[3]。【前人研究进展】1976年,Kemper 等从兔子内质网膜上分离出eIF5A[4],生化分析表明eIF5A主要功能是促进第一步甲硫氨酸的合成,故此认为eIF5A在蛋白翻译起始阶段起重要作用[5]。植物eIF5A的研究起步较晚,2004年,Thompson等从模式植物拟南芥中分离出3个AteIF5A基因[6]。后续的研究表明AteIF5A1参与次生木质部的形成,超量表达AteIF5A1的转基因拟南芥木质部增大[6-7]。AteIF5A2主要在受机械损伤的组织中高水平表达,AteIF5A2能够抑制伏马毒素B1和黑暗引起的细胞凋亡[6, 8]。AteIF5A3主要在细胞分裂很活跃的种子中表达,超量表达AteIF5A3的转基因拟南芥叶子变为并生叶、种子变大、同时能够响应高盐、干旱以及渗透等胁迫信号[6,9]。

由中国科学家主导(深圳华大基因研究院、张家口市农业科学院)的谷子全基因组测序和美国科学家主导的谷子全基因组测序计划的完成[10-11],为后续通过生物信息学挖掘、鉴定和分析谷子功能基因提供重要的基础。【本研究切入点】本研究从谷子基因组数据库出发,重点分析谷子eIF5A基因家族进化关系、编码蛋白的保守结构域和磷酸化位点等,【拟解决的关键问题】为进一步研究谷子eIF5A 蛋白生物学功能以及其磷酸化修饰提供重要信息。

1 材料与方法

1.1 谷子eIF5A基因家族基因组、cDNA和蛋白序列的获得

拟南芥(Arabidopsisthaliana)eIF5A基因及其推导的蛋白序列来自TAIR数据库(http://www.arabidopsis.org);毛果杨(Populustrichocarpa)eIF5A基因及其推导的蛋白序列下载自phytozome 数据库(https://phytozome.jgi.doe.gov/pz/portal.html#!info?alias=Org_Ptrichocarpa);小家鼠(Musmusculus)、美洲黑杨(Populusdavidiana)和小麦(Triticumaestivum)eIF5A蛋白序列来自NCBI数据库(https://www.ncbi.nlm.nih.gov/)。

分别以拟南芥AteIF5A1(AT1G13950)、AteIF5A2 (AT1G26630)、AteIF5A3(AT1G69410)、小麦TaeIF5A1(AAZ95171.1)、TaeIF5A2 (AAZ95172.1)和TaeIF5A3 (AAZ95173.1)蛋白序列为参比序列,利用phytozome 数据库(谷子)中Blast 程序进行BlastP检索,检索结果的全序列E值大于e-60的舍去,再利用美国国家生物技术信息中心提供的在线CDS(conserved domain search)程序(http://www.ncbi.nlm.nih.gov/cdd)预测这些蛋白有无DNA结合寡核苷酸结合结构域,同时具有这两个特征的蛋白序列属于eIF5A基因家族。

1.2 谷子eIF5A基因家族基因结构分析

对鉴定出的谷子eIF5A基因根据其预测编码区序列和基因组序列进行结构分析,利用GSDS(http://gsds.cbi.pku.edu.cn/) 在线软件进行分析[12]。

1.3 植物eIF5A基因家族编码蛋白系统进化树的构建及保守基序分析

利用Clustal X(2.0)[13]软件对鉴定出所有谷子eIF5A蛋白、1个小家鼠eIF5A蛋白、3个拟南芥eIF5A蛋白[6]、4个毛果杨eIF5A蛋白[14]、4个美洲黑杨eIF5A蛋白[9]和3个小麦eIF5A蛋白[15]进行多重序列比对,使用MEGA 6.0[16]软件,采用邻接(neighbor-joining,NJ)算法构建系统进化树,进行1000 次Bootstrap 抽样。应用在线软件MEME(http://meme-suite.org/tools/meme)对上述eIF5A蛋白保守基序进行分析[17]。参数设置如下:基序的最大发现数目是1个,其它参数为程序默认值。

1.4 谷子eIF5A基因家族编码蛋白磷酸化位点预测

利用NetPhos 3.1 Server在线软件[18](http://www.cbs.dtu.dk)对鉴定出所有谷子eIF5A蛋白序列进行磷酸化位点预测,所有参数都选用程序默认值。

2 结果与分析

2.1 谷子eIF5A基因家族的鉴定和命名

分别以3个拟南芥eIF5A蛋白和3个小麦eIF5A蛋白序列为参比序列,利用phytozome 数据库(谷子)提供的Blast P程序进行检索,共得到了4个谷子候选eIF5A基因。利用保守基序在线预测软件MEME进行验证保守结构域(PF01287)的存在,初步确定了4个谷子eIF5A基因。谷子eIF5A基因分布在第2、3和9条染色体上,根据通用植物基因的命名方法,对鉴定到的4条eIF5A基因进行了命名,并统计了它们对应的转录本、别名、染色体定位、基因长度以及对应的推导蛋白长度和内含子个数等,他们推导的蛋白质长度从135个氨基酸到162个氨基酸不等(表1)。谷子eIF5A基因家族成员均含有4个内含子,且内含子的长度远大于外显子的长度(图1)。

2.2 谷子eIF5A基因家族保守结构域分析

利用在线软件MEME对1个MmeIF5A1蛋白序列、3个AteIF5A蛋白序列、4个PtreIF5A蛋白序列、3个TaeIF5A蛋白序列、4个PdeIF5A蛋白序列和4个SieIF5A蛋白序列保守基序进行分析,结果表明谷子eIF5A基因家族蛋白序列中均包含由基序1(相似度为6.5e-747)(图2)。

2.3 谷子eIF5A基因家族蛋白相似性和系统进化分析

利用进化树分析软件MEGA 6.0 对4个谷子eIF5A蛋白、1个小家鼠eIF5A蛋白、3个拟南芥eIF5A蛋白、4个毛果杨eIF5A蛋白、4个美洲黑杨eIF5A蛋白和3个小麦eIF5A蛋白全蛋白序列进行进化分析。结果显示:这19个eIF5A按照同源进化关系可以分为3个亚家族,分别含有11、6和2个成员(图3)。第Ⅰ亚家族由毛果杨、美洲黑杨和谷子共同组成;第Ⅱ亚家族由拟南芥和小麦组成,第Ⅲ亚家族中由小家鼠和谷子组成。谷子eIF5A基因家族分布于第Ⅰ和 Ⅲ亚家族中,其中毛果杨PtreIF5A1~PtreIF5A4、美洲黑杨PdeIF5A1~ PdeIF5A4和谷子SieIF5A2~SieIF5A4聚类于第Ⅰ亚家族;拟南芥AteIF5A1~AteIF5A3和小麦TaeIF5A1~TaeIF5A3聚类于第Ⅱ亚家族;小家鼠MmeIF5A1和谷子SieIF5A1聚类于第Ⅲ亚家族。利用欧洲生物信息研究所在线Clustal Omega程序对4个毛果杨的蛋白序列进行多重序列比对,发现他们的氨基酸相似性在77.04 %~ 88.68 %,其中SieIF5A1 和SieIF5A3氨基酸序列的相似性最低达到 77.04 %,SieIF5A2 和SieIF5A4氨基酸序列的相似性最高达到 88.68 %(表2)。

表1 谷子eIF5A基因家族的基本特征

图1 谷子eIF5A基因家族结构分析Fig.1 Gene structure of eIF5A gene family in S.italica

图2 eIF5A编码蛋白保守基序分布Fig.2 Distribution of conserved motifs in eIF5A proteins

表2 谷子基因组中eIF5A蛋白氨基酸相似性分析

图3 eIF5A蛋白进化树Fig.3 Phylogenetic tree for eIF5A proteins

图4 谷子eIF5A蛋白磷酸化位点预测Fig.4 Phosphorylation site prediction of eIF5A proteins in S.italica

表3 谷子基因组中eIF5A蛋白磷酸化位点分析

2.4 谷子eIF5A基因家族蛋白磷酸化位点预测

利用在线软件NetPhos 3.1 Serverl对4个谷子eIF5A蛋白进行磷酸化位点预测,结果显示SieIF5A1~ SieIF5A 4蛋白中存在着12~19个丝氨酸、苏氨酸及酪氨酸潜在磷酸化位点,预测磷酸化位点主要是以丝氨酸的形式存在,其次是苏氨酸,络氨酸的磷酸化位点最少(表3)。预测SieIF5A1潜在磷酸化位点中存在10个丝氨酸、7个苏氨酸和2个酪氨酸位点。SieIF5A2 潜在磷酸化位点中丝氨酸和苏氨酸位点均为7个,酪氨酸位点仅有1个(图4)。

3 讨 论

本研究鉴定谷子eIF5A基因家族含有4个成员,而已鉴定的拟南芥[6]、毛果杨[14]、美洲黑杨[9]和小麦[15]eIF5A基因家族分别含有3、4、4和3个成员,这说明在植物进化过程中,eIF5A基因可能经历了不断发生谱系的特异扩张和拷贝丢失。谷子eIF5A基因家族的4个成员均含有5个外显子,均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287),这表明eIF5A基因家族的高度保守性,推测eIF5A蛋白在植物诸多生理过程中起着类似作用。不同植物中eIF5A基因家族含有的成员数目存在差异,推测不同植物的各成员在特定组织响应低温、干旱和高盐等信号后精细调节各生理过程。

进化分析表明,谷子eIF5A基因家族分布在第Ⅰ和第Ⅲ亚家族中,谷子SieIF5A2 ~ SieIF5A4、毛果杨PtreIF5A1~PtreIF5A4和美洲黑杨PdeIF5A1~ PdeIF5A4聚类于第Ⅰ亚家族;谷子SieIF5A1和小家鼠MmeIF5A1聚类于第Ⅲ亚家族。目前,eIF5A基因家族各成员确切的功能分析主要集中在拟南芥中。近年,伴随着植物基因组学、生物信息学等新兴学科的兴起,大量的eIF5A基因从不同植物中克隆出来,部分林木eIF5A基因成功克隆并功能也得到初步分析。第I亚家族中毛果杨和美洲黑杨之间的eIF5A基因间是一一对应关系,而谷子eIF5A基因并没有表现出与之相对应的关系,表明尽管是高度保守的基因家族在经过长期进化选择,同属杨属的毛果杨和美洲黑杨eIF5A基因还未发生分离,而与其他植物发生了分离。美洲黑杨PdeIF5A3超量表达转基因拟南芥表现出比转空载体拟南芥对干旱和渗透耐受,且收获的种子比转空载体拟南芥增加30 %~100 %。鉴于谷子SieIF5A3与美洲黑杨PdeIF5A3同源性最高,据此推测:谷子SieIF5A3可能也参与谷子的生长发育及抗逆生理中发挥重要作用。聚类在一起的不同植物的同源基因可能具有不同的生物学功能[19],因此不能简单推测谷子eIF5A基因家族各成员的生物学功能,其各成员确切的生物学功能还需要逐一进行功能验证。

磷酸化分析表明,谷子SieIF5A蛋白存在大量潜在磷酸化位点。目前,植物eIF5A蛋白确切的生物学功能尚未见报道。Lebska等通过多重序列比对发现玉米ZmeIF5A蛋白存在2个潜在的能被CK2蛋白磷酸化的位点,分别将ZmeIF5A以及这两个潜在的丝氨酸磷酸化位点突变(Ser2Ala和Ser4Ala)为丙氨酸并进行体外重组蛋白的表达及纯化,只有ZmeIF5A Ser2Ala重组蛋白不能被玉米CK2蛋白磷酸化。玉米原生质体瞬时转化发现ZmeIF5A和模拟Ser2不磷酸化的Ser2Ala融合EYFP荧光蛋白均匀地分布在细胞核和细胞质中,而模拟Ser2磷酸化的Ser2Asp融合EYFP荧光蛋白仅在细胞核内表达,表明:玉米ZmeIF5A蛋白中Ser2是决定其进出细胞核的关键位点[20]。谷子SieIF5A蛋白中潜在的磷酸化位点(尤其是丝氨酸)还需要通过潜在位点的定点突变、体外磷酸化等试验进一步研究和验证。

4 结 论

谷子基因组中鉴定出4个eIF5A基因家族成员,均含有4个内含子,位于谷子的第2、3和9染色体上。谷子eIF5A蛋白均含有1个保守的DNA结合寡核苷酸结合结构域(PF01287)、均含有大量潜在的磷酸化位点。

猜你喜欢

拟南芥谷子磷酸化
T69E模拟磷酸化修饰对Bcl-2与Nur77相互作用的影响
打谷子
拟南芥栽培关键技术研究
ITSN1蛋白磷酸化的研究进展
晒谷子(外一首)
磷酸化肽富集新方法研究进展
MAPK抑制因子对HSC中Smad2/3磷酸化及Smad4核转位的影响
拟南芥
口水暴露了身份
一株特立独行的草