APP下载

普通烟草Aux/IAA转录因子家族全基因组鉴定分析

2020-01-15王国平周东洁牛永志郑昀晔

中国烟草学报 2019年6期
关键词:生长素类群亚群

王国平,周东洁,牛永志,郑昀晔,2*

1 玉溪中烟种子有限责任公司,玉溪市南祥路14号 653100;

2 云南省烟草农业科学研究院,玉溪市南祥路14号 653100

生长素(auxin)是一类重要的植物激素,在细胞分裂与伸长、器官的发生与形态建成、顶端优势、植物向性、逆境胁迫等诸多方面都起着非常重要的调控作用[1-3],还可以与油菜素内酯、赤霉素、乙烯等激素信号通路相互作用[4-6],影响植物种子萌发、植株生长、花果形成、植株衰老的整个生长发育过程。

生长素水平的时空动态变化可以精确而快速地激活下游一系列信号通路。其中生长素早期响应因子在信号传导中起重要作用,如生长素/吲哚-3-乙酸(Aux/IAA)家族、生长素响应因子(ARF)家族、生长素上调小RNA(SAUR)、氨基环丙基-1-羧酸合成酶(ACS)、谷胱甘肽-S-转移酶(GST)、生长素响应基因GH3[7-8]。Aux/IAA是一种生长素响应基因的转录抑制因子,在生长素浓度较低时,ARF-Aux/IAA异质二聚体的形成抑制了ARF的转录活性;当生长素浓度较高时,Aux/IAA发生降解,ARF从Aux/IAA中释放,调控下游靶基因的表达[9]。典型的Aux/IAA包含四个保守的结构域(结构域I、II、III和IV),在许多预测的蛋白质中可能会缺少一个或几个结构域[10]。结构域I包含保守的亮氨酸重复基序LxLxLx,抑制生长素下游调控基因。结构域II保守的GWPPV基序与F-box蛋白TIR1相互作用,导致Aux/IAA的不稳定性和快速降解[11]。位于C端的结构域III和IV能与其他Aux/IAA或ARF相互作用,形成同源二聚体和异源二聚体,从而调控下游基因表达[12]。

第一个被分离到的Aux/IAA基因是豌豆的PSIAA4/5和PS-IAA6基因[13]。随着众多植物基因组测序的完成,Aux/IAA基因家族已在30多种植物中得到鉴定分析[14],包括拟南芥29个[15]、油菜119个[16]、黄瓜27个[17]、大豆63个[18]、棉花44个[19]、番茄25个[20]、马铃薯26个[21]、玉米34个[22]、小麦84个[23]等。烟草作为模式植物,从中鉴定Aux/IAA家族基因对于研究生长素调控植物生长发育的机制具有重要作用。本研究利用生物信息学方法从烟草参考基因组中鉴定Aux/IAA家族基因,并对其序列特性、进化模式、表达模式和功能注释等进行系统分析,为进一步解析生长素调控机制奠定基础。

1 材料与方法

1.1 Aux/IAA基因家族成员鉴定及序列特征分析

最新的烟草基因组数据是由Edwards K D等人于2017年发布,测序品种为K326[24]。从茄科数据库(https://solgenomics.net/)下载该基因组数据,下载的文件包括GFF文件、蛋白序列文件和核酸序列文件。从Pfam数据库(http://pfam.xfam.org/)下载Aux/IAA基因家族的HMM模型文件(PF02309),利用HMMER3.0软件进行Aux/IAA蛋白序列的初步检索,E值设为1e-5。将初步检索得到的序列上传至pfam网站进行结构域预测,E值设为1e-5,剔除不含Aux/IAA蛋白典型结构域的序列,剩余的即为烟草Aux/IAA基因家族成员,同时根据Pfam结果统计各蛋白序列所包含的结构域类型和个数。利用ExPaSy网站的ProtParam工具(http://web.expasy.org/protparam/)分析蛋白的氨基酸含量、分子量、等电点、脂肪族氨基酸指数和疏水性指数等理化性质。

1.2 连锁群定位和亚细胞定位

从GFF文件提取各蛋白序列的连锁群位置信息。利用在线网站Softberry(http://linux1.softberry.com/)的ProtComp工具进行亚细胞定位预测。

1.3 系统发育树构建

从Uniprot数据库分别下载拟南芥的29个Aux/IAA家族成员[14]和番茄的25个Aux/IAA家族成员[19]。利用MEGA软件进行多序列比对和进化树构建,采用ClustalW比对方式,构建NJ树,参数设置为:检验方法为Bootstrap法,检验次数设为1000次,gap处理选择Pairwise Deletion方式。利用在线工具iTOL(https://itol.embl.de/)对进化树进行可视化。

1.4 序列结构及蛋白结构域分析

将Aux/IAA家族成员的GFF文件提交到在线工具GSDS2.0(http://gsds.cbi.pku.edu.cn/)进行基因结构分析,并进行可视化。将Aux/IAA家族成员的蛋白序列文件提交到在线工具MEME(http://meme-suite.org/tools/meme)进行保守结构域的预测,参数设置为:Motif长度范围为6~100,检索的最大Motif数为10,其他选择默认参数。利用在线工具EvolView(http://www.evolgenius.info/evolview/)对蛋白结构域进行可视化。利用NCBI的CDD工具(https://www.ncbi.nlm.nih.gov/cdd/?term=)鉴定结构域的类型。

1.5 表达模式分析

基因表达数据从EMBL-EBI网站下载,登录号为 E-MTAB-176(http://www.ebi.ac.uk/arrayexpress/experiments/E-MTAB-176/)。烟草表达图谱(TobEA)是由Edwards K D等人于2010年发布,该图谱包含了早期衰老叶、中早期衰老叶、中后期衰老叶、后期衰老叶、成熟叶、茎生叶、幼叶、上部茎、下部茎、成熟根、幼根、种子、未开花蕾、开放花蕾、花朵、幼芽、茎顶端、子叶和花顶端19个样品组织,贯穿从种子到衰老整个生命周期[25]。在SGN Unigenes数据库,通过blastn比对检索Aux/IAA家族成员匹配的Unigene ID,通过检索得到的ID获取对应的基因表达谱数据。将数据整理后利用Cluster3.0软件进行聚类,利用Java TreeView工具可视化热图。

1.6 GO注释分析

利用Blast2GO软件对Aux/IAA蛋白序列进行功能注释,利用在线工具WEGO2.0(http://wego.genomics.org.cn/)对结果进行可视化。

2 结果与分析

2.1 Aux/IAA家族成员鉴定及序列特征分析

基于隐马尔科夫模型序列谱,从烟草基因组数据库中共检索得到84条候选基因序列,通过Pfam数据库对候选序列进行结构域分析,剔除不含Aux/IAA同源异型结构域的序列,最终得到77个烟草Aux/IAA家族基因,按照NtIAA1~NtIAA77的顺序对每个基因依次进行编号(见表1)。通过Pfam数据库进行结构域分析结果显示,在77个基因中,只包含Aux/IAA结构域的有56个基因;同时包含Aux/IAA和ARF结构域的有21个基因,这21个基因同样也属于ARF家族;同时包含Aux/IAA、ARF和B3结构域的有15个基因,这15个基因同样也属于B3超家族;分析Aux/IAA家族成员的理化性质发现,平均氨基酸长度为379,范围在72~1104之间;平均分子量为42191.17 kDa,范围在 8119.66~121828.27 之间;平均等电点为6.74,范围在4.31~9.65之间,其中酸性蛋白(等电点小于7)有51个,碱性蛋白(等电点大于7)有26个;平均脂肪族氨基酸指数为71.95,范围在59.5~92.08之间;平均疏水性指数为-0.559,范围在-0.106~-1.244之间,该家族蛋白全部表现为亲水性。

表1 Aux/IAA 家族蛋白特征Tab.1 Protein characteristics of Aux/IAA gene family

续表1

2.2 Aux/IAA家族连锁群定位和亚细胞定位分析

连锁群定位结果显示(见表1),其中有46个基因定位到连锁群上,有31个基因位于Scafford上。在定位到连锁群上的46个Aux/IAA家族基因中,除了连锁群2、3、6、11和16号外,其他连锁群上均有分布,其中22号连锁群上分布最多,达6个基因,9、17、19和20号连锁群上各分布有4个基因,4和15号连锁群各分布有3个基因,7、8、12、14、18、23号连锁群上各分布有2个基因,1、5、10、21和24号连锁群各分布有1个基因。在定位到Scafford上的31个Aux/IAA家族基因中,其中Scf_0007553和Scf_0003159上各分布有2个基因,其余Scafford上各分布有1个基因。亚细胞定位分析结果显示(见表1),Aux/IAA家族所有基因都定位于细胞核内,这与以往研究结果一致[26]。

2.3 Aux/IAA家族进化分析

选取模式植物拟南芥的Aux/IAA基因29个,选取茄科作物番茄的Aux/IAA基因25个,同本研究获得的77个烟草Aux/IAA基因一同构建系统进化树。参照以往研究结果[27-28],将Aux/IAA家族分为A和B两个类群(图1),A类群又分为4个亚群(A1、A2、A3和A4),B类群又分为6个亚群(B1、B2、B3、B4、B5和B6)。A类群包括65个基因(烟草35个,拟南芥14个,番茄15个),B类群包括66个基因(烟草42个,拟南芥15个,番茄10个)。除了B6外,每个亚群中都分布有拟南芥、番茄和烟草的Aux/IAA基因,说明Aux/IAA分化时间早于物种分化时间。整个系统发育树中共包括46对姐妹对,其中大部分为旁系同源蛋白,有40对(烟草30对,拟南芥9对,番茄1对),直系同源蛋白有6对(5对烟草-番茄,1对拟南芥-番茄),这可能是因为普通烟草是由绒毛烟草和林烟草经过染色体加倍进化而来,因此存在大量相似序列。另外,通过分枝的聚集也可以看出,烟草Aux/IAA基因与番茄更为接近,这是因为烟草和番茄同属于茄科作物,亲缘关系更近。令人惊奇的是,在B6亚群中,21个烟草Aux/IAA基因聚到了一起,而且与其他基因距离较远,进一步对序列结构分析发现,这是因为这21个基因中,除了包含Aux/IAA结构域,还包含了ARF结构域,其中15个基因还包含B3结构域,这一点与其他作物差异较大。

图1 Aux/IAA 家族系统进化树Fig.1 Phylogenetic tree of Aux/IAA gene family

2.4 Aux/IAA家族序列结构及蛋白结构域分析

典型的Aux/IAA基因包含四个结构域(Ⅰ、Ⅱ、Ⅲ和Ⅳ)。本研究结构域分析结果显示(图2),所有烟草Aux/IAA基因都缺失了结构域Ⅰ,有40个基因同时包含了结构域Ⅱ(Motif3)、Ⅲ(Motif2)和Ⅳ(Motif1和Motif6),但其中有10个基因的结构域Ⅳ缺失了一部分(Motif6);有27个基因只包含结构域Ⅲ和Ⅳ,但其中有18个基因的结构域Ⅳ缺失了一部分(Motif6),这27个基因中的大部分属于B6亚群成员(21个);基因NtIAA24、NtIAA30和NtIAA40只包含结构域Ⅱ和Ⅳ,但NtIAA40的结构域Ⅳ缺失了一部分(Motif6);基因NtIAA37和NtIAA41只包含结构域Ⅱ和Ⅲ;基因NtIAA53、NtIAA52、NtIAA45和NtIAA48分别只包含结构域Ⅱ、Ⅲ、Ⅳ;基因NtIAA74没有检测到任何结构域。综合来看,大部分烟草Aux/IAA家族基因(有68个)都包含了结构域Ⅲ和Ⅳ,结构域Ⅲ和Ⅳ可与ARF相互作用,形成同源或异源二聚体,从而抑制生长素响应基因的表达,在功能行使中发挥重要作用。很明显,B6亚群基因(21个)同时也包含了B3结构域(Motif4和Motif5)、ARF结构域(Motif7)以及类型未知的Motif8、Motif9和Motif10,B3基因家族是一个超基因家族,ARF基因家族也是一个生长素早期响应因子,Aux/IAA、B3和ARF家族成员之间通过互作,将众多的信号通路联系在一起。Aux/IAA内含子-外显子结构分析显示,除了B6亚群基因序列较长、外显子数目较多外,其余基因序列相对较短,外显子数目较少,结构较为简单。

图2 Aux/IAA家族蛋白结构域与序列结构Fig.2 Protein domain and sequence structure of Aux/IAA gene family

2.5 Aux/IAA家族表达模式分析

烟草Aux/IAA家族的77个成员中有50个基因,在烟草表达图谱(TobEA)检索到表达数据。基因聚类结果将这50个基因分为X和Y两个类群,其中X类群又分为X1和X2两个亚群,Y类群又分为Y1和Y2两个亚群,X类群基因与系统发育树中的A类群基因基本相同,Y类群基因与系统发育树中的B类群基因基本相同,进一步说明同源性较高的基因之间有着相似的表达模式和生物学功能(图3)。组织聚类结果将这19个组织分为两个类群,其中一个类群包含根、茎、叶和种子等成熟的组织,另一个类群包含花蕾、子叶、幼叶、茎端等幼嫩的组织。

整体上看,不同亚群基因在不同的组织中的表达水平有所差异,同一亚群基因在不同的组织中的表达水平类似。X1亚群基因在不同发育时期的叶片中的表达量较高,X2亚群基因在花尖、幼芽、幼叶、未开放花蕾和开放花蕾等幼嫩组织中的表达量较高,Y1亚群基因在花朵和种子中的表达量较高,Y2亚群基因在根、茎和种子中的表达量较高。虽然不同Aux/IAA家族基因表达存在一定的组织特异性,但在植株生长发育的每个阶段,都有Aux/IAA家族基因的参与。

2.6 Aux/IAA家族GO注释分析

GO注释结果显示(图4),Aux/IAA家族基因在细胞组成、分子功能和生物进程中都发挥了重要作用。在细胞组成方面,主要参与细胞、胞内和细胞器的组成,这关系到生长素可以直接作用于细胞膜或胞内组分,协同调节分裂、伸长和分化等胞内过程,而且作为非细胞自主信号,与其他信号转导途径相互作用,从而影响一些细胞反应;在分子功能方面,主要参与蛋白结合,这间接调控下游基因的表达,从而影响生长素对植物生长发育的调节;在生物进程方面,主要参与了胞内、代谢等生物进程调节,信号转导,內源、胞内、化学等刺激反应,氮、细胞代谢过程等功能,这关系到生长素对植物向性生长、组织分化、器官发生、顶端优势等的调节作用。

图3 Aux/IAA家族基因表达热图Fig.3 Heatmap of gene expression of Aux/IAA gene family

图4 Aux/IAA家族GO注释结果Fig.4 GO annotation results of Aux/IAA gene family

3 讨论

随着越来越多的植物基因组测序的完成,全基因组基因鉴定为基因功能研究提供了一种更高效的方法。Aux/IAA家族基因已在许多植物中得到鉴定[13],以往研究表明,很大一部分Aux/IAA家族基因是由基因复制事件(片段复制、串联复制)进化产生的,而且Aux/IAA家族基因的复制事件似乎与全基因组复制(WGD)相一致。例如:大豆发生了两次全基因组复制事件和一次全基因组三倍化事件,其中90%的Aux/IAA基因以片段复制的形式产生[18]。本研究共得77个普通烟草Aux/IAA家族基因,在已鉴定的30多种植物中,数量仅次于甘蓝型油菜的119个[16]和普通小麦的84个[23]。而普通烟草是异源四倍体,普通小麦是异源六倍体,甘蓝型春油菜是由自然种间杂交后双二倍化进化而来的一种复合种,这三种作物都发生了基因扩张,可能是在进化过程中发生了全基因组复制使连锁群加倍导致的,Aux/IAA基因扩张产生的功能冗余可能是为了适应复杂的自然环境。

Aux/IAA基因一般包括四个典型的结构域(I、II、III和IV),但在大部分植物中都存在一部分Aux/IAA基因缺失了其中某个或数个结构域[10]。例如:拟南芥中有11个(占比38%)[15],木瓜中有8个(占比44%)[29],马铃薯中有5个(占比15%)[21]等。在普通烟草中检测到的77个Aux/IAA基因中,全部缺失了结构域I,有一半多(40个)包含了其余所有结构域,大部分(68个)都包含了结构域Ⅲ和Ⅳ。这些结构域的多样性可能在生长素信号通路中行使不同的功能以适应复杂多变的自然环境。有趣的是,在B6亚群中的21个基因不仅含有Aux/IAA的结构域III和IV,也包含了ARF结构域,其中15个基因还包含了B3结构域。这些基因也属于ARF基因家族或B3超基因家族。B3是一个广泛存在于高等植物基因组中,并能与DNA结合的高度保守结构域,ARF基因家族也是一个生长素早期响应因子。以往研究表明,ARF基因的C端包含一个CTD结构域,该结构域与Aux/IAA的结构域III和IV高度相似。因此,Aux/IAA的结构域III和IV可以与ARF的CTD结构域相互作用,从而调控ARF蛋白的活性[30-31]。

一般认为普通烟草是由S基因组供体林烟草和T基因组供体绒毛烟草两个祖先种,大约在20万年前经过一次种间杂交产生[32],其存在两套异源基因组。因此,本研究进化分析显示,在鉴定的77个普通烟草Aux/IAA家族中存在大量的旁系同源基因。通过系统发育树可以看出,烟草与番茄亲缘关系更近,这是因为他们同属于双子叶纲茄科植物。以往研究表明,SiIAA3连接生长素和乙烯代谢途径,RNA干扰该基因会导致幼苗叶片下垂和叶尖卷曲[33];RNA干扰SiIAA9该基因会导致叶片不规则和单性果实[34];抑制SiIAA15的活性会导致侧根增多、腋芽异常发育、绒毛数量减少、坐果率降低、叶片厚度增大[35]。SiIAA17控制果实的重量[36];SiIAA27与叶绿素合成和独脚金内酯合成有关[37-38]。SiIAA3与烟草的NtIAA20、NtIAA22、NtIAA27和NtIAA48聚到一起;SiIAA9与烟草的NtIAA1、NtIAA14和NtIAA41聚到一起;SiIAA15与烟草的NtIAA17和NtIAA34聚到一起;SiIAA17与烟草的NtIAA37和NtIAA53聚到一起;SiIAA27与烟草的NtIAA3和NtIAA8聚到一起。这些同源基因可能也具有类似的生物学功能。

Aux/IAA蛋白可以与ARF蛋白相互作用形成二聚体,从而影响生长素的调控作用。Aux/IAA蛋白是一种核蛋白,这与本研究的结果一致。理论上讲ARF蛋白也属于核蛋白,但是最新的研究发现大部分ARF蛋白被定位到细胞核,个别ARF蛋白却被定位到叶绿体或线粒体[39]。这可能是由于ARF除了可以与Aux/IAA结合发挥作用,还有其他结合方式,例如:可以与含有TGTCTC AuxREs元件的生长素响应基因结合,可以通过它们的CTDs形成二聚体,再与靶基因结合等[40]。

Aux/IAA参与了胚胎发育、下胚轴生长、向性、花器官发育、侧根伸长等生物过程,大部分拟南芥基因突变都会表现出相似的功能缺陷[41-42]。本研究中虽然不同Aux/IAA家族基因表达存在一定的组织特异性,但在植株生长发育的每个阶段,都有Aux/IAA家族基因的参与。另外,Aux/IAA在植物抗逆性方面也具有很大作用。高粱在盐和干旱胁迫下,SbIAA1受到诱导,其表达量在叶和根部组织中不同,该基因可能对高粱抗盐抗干旱有重要作用[43]。本研究所分析的77种Aux/IAA蛋白均为亲水性蛋白,蛋白质的高亲水性使蛋白质能够代替细胞中的水分子,从而很好的抵御干旱胁迫对植物造成的损伤[44]。

在过去十年里,在生长素感知和信号转导机制方面取得了显著成就。但在生长素信号通路中,Aux/IAA的介导途径仍存在很多空白,Aux/IAA在植物抗逆方面的相关研究也相对较少。相信随着基因组的不断解析以及计算模型的不断发展,越来越多的Aux/IAA信号网络将被发现。烟草作为一种模式植物,通过研究烟草Aux/IAA基因,对于解析Aux/IAA功能及信号通路具有重要意义。

4 结论

本研究从普通烟草基因组中共鉴定了77个Aux/IAA家族基因,均定位于细胞核内,全部为亲水性蛋白,大部分为酸性蛋白。Aux/IAA家族划分为2个类群,10个亚群,Aux/IAA基因分化时间早于物种分化时间;烟草是异源四倍体,Aux/IAA家族存在大量旁系同源姐妹对(40对)。所有的烟草Aux/IAA基因均缺失了结构域Ⅰ,大部分基因都同时包含了结构域Ⅲ和Ⅳ;B6亚组基因同时包含了B3、ARF和Aux/IAA结构域,与其他基因差别较大。不同亚群的基因组织表达特异性不同,同一亚群的基因组织表达特异性一致。Aux/IAA家族基因主要参与细胞组成、蛋白结合、生物进程调节、信号转导、刺激反应、代谢过程等功能。

猜你喜欢

生长素类群亚群
甲状腺切除术后T淋巴细胞亚群的变化与术后感染的相关性
中国农业大学揭示黄瓜局部生长素分布和花器官发生的调控机制
CD11b和CD27定义人类NK细胞新亚群的研究进展
睡莲花开色香全
探究生长素对植物生长的两重性作用
多发性硬化症的单核细胞致病亚群
甘肃民勤连古城国家级自然保护区不同生境土壤动物群落的组成及多样性
薏苡种质资源ISSR分子标记筛选及亲缘关系分析
黄淮麦区263份小麦种质材料的聚类分析
浅谈生长素对植物的作用