APP下载

毛果杨AGO基因家族生物信息学分析

2019-04-15张丽华王婷陈群王晓立韩浩章

安徽农学通报 2019年4期

张丽华 王婷 陈群 王晓立 韩浩章

摘  要:Argonautes(AGOs)蛋白是生物有机体中普遍存在的一类比较保守的蛋白质,在不同物种的RNAi及相关的途径中具有十分重要的功能,也调控着模式植物拟南芥的生长发育过程。该研究利用AGO蛋白的保守域在毛果杨基因组中进行同源比对,鉴定出毛果杨AGO基因家族成员13个,并对其成员进行了理化性质分析、motif结构比对、进化树构建、基因表达分析等。结果表明:毛果杨AGO基因家族成员基因长度为2463~3189bp,编码的蛋白质具有保守的Piwi、PAZ、DUF1785 结构域。PtAGO 基因分布于第1、6、8、9、10、12、14、15、16条染色体上,存在着串联重复序列。AGO 蛋白定位于叶绿体、细胞核和胞质中,偏碱性和亲水性,具有较高的脂溶指数、不稳定性。基因组织表达分析表明,毛果杨PtAGO成员在不同组织中的表达有明显差异,在与木材形成相关的组织、器官中有较高的表达。

关键词:毛果杨;AGO蛋白;基因家族;生物信息

中图分类号 S792.11文献标识码 A文章编号 1007-7731(2019)04-0012-04

Abstract:Argonautes(AGOs) proteins are a class of relatively conserved proteins ubiquitous in biological organisms,and play important roles in RNAi and related pathways of different species,and also regulate the growth and development of model plants Arabidopsis thaliana.In this study,a conserved domain of AGO protein was used to perform homologous alignment in the genome of P. simonii,and 13 members of AGO gene family of P. simonii were identified,and physical and chemical properties,motif alignment,phylogenetic tree construction,Gene expression analysis,etc.The results showed that the AGO gene family members were 2463-3189 bp in length,and the encoded proteins had conserved Piwi,PAZ and DUF1785 domains.The PtAGO gene is distributed on chromosomes 1,6,8,9,10,12,14,15,and 16 with tandem repeats.AGO protein is localized in chloroplast,nucleus and cytoplasm,alkaline and hydrophilic,with high fat solubility index and instability.The analysis of gene tissue expression showed that the expression of PtAGO members in different tissues was significantly different,and it was highly expressed in tissues and organs related to wood formation.

Key words:Populus trichocarpa;AGO protein;Gene family;Bioinformation

AGO(Argonaute)基因普遍存在于各類生物基因组中,不同生物的AGO蛋白结构相对保守,通常有PAZ和PIWI 2个特征域。在小RNA分子介导的RNA沉默途径中,AGO蛋白是沉默复合物的主要成分[1],AGO蛋白可以与这些小RNA介导的不同类型的小非编码RNA结合,特异性结合小RNA互补靶的靶RNA,靶基因被AGO蛋白本身的核酸内切酶活性切割,从而导致靶基因的失活[2]。研究发现,拟南芥AGO基因家族中有10个成员,主要分为3类[3]。在多种植物中,例如拟南芥和水稻,AGO蛋白和小RNA形成调节植物生长和发育的复合物,它在应激反应和防御病毒入侵方面发挥了重要作用[4]。不同物种的AGO蛋白可以通过协同作用控制植物的生长和发育[5]。

目前,对毛果杨Populus trichocarpa AGO基因(PtAGO)功能的研究仍然滞后。本文系统研究了PtAGO蛋白家族域的序列比对,系统发育树和AGO蛋白的理化性质,以此为进一步研究PtAGO基因家族的功能与作用提供理论依据,也为进一步研究PtAGO蛋白在RNAi等相关途径中的分子机制奠定基础。

1 数据来源与分析方法

1.1 数据来源 本研究以毛果杨为实验对象,包括国家生物技术信息中心(NCBI)和毛果杨基因组数据(植物基因组数据站点植物组学)。

1.2 分析方法

1.2.1 Argonaute蛋白基因的搜索与确认 在毛果杨(Populus trichocarpa)基因组中发现每种AGO蛋白的同源序列作为候选蛋白。在获得与候选蛋白质序列类似的AGO基因后,这些基因用作二级查询的序列,继续搜索并多次查找和补充以确定毛果杨中所有替代AGO家族成员。然后在PFAM和SMART蛋白结构域在线分析预测位点上分析所有候选基因的候选蛋白结构域,并且得到的基因是Populus trichocarpa的AGO基因家族的所有成员。

1.2.2 毛果杨Argonaute基因家族的基因网站查询分析 毛果杨(Populus trichocarpa)基因家族成员结构分析:基因名称,位置染色体,基因序列大小,编码序列大小,外显子和内含子数,搜索探针等。

1.2.3 毛果杨Argonaute基因家族物理化学性质和亚细胞定位 主要使用在线软件EXPASY Protparma(expasy网站)来分析AGO基因家族成员的理化特性。使用在线软件Plant-mPLoc预测毛果杨(Populus trichocarpa)AGO基因家族成员的亚细胞定位。

1.2.4 motif结构对比和系统发育树建立 使用TBtools软件对AGO基因家族成员进行基序结构分析;使用MEGA 5.0软件为毛果杨(Populus trichocarpa)和拟南芥(Arabidopsis thaliana)的AGO基因家族成员构建系统发育树。

1.2.5 AGO基因家族器官组织的基因表达 在Affymetrix网站上搜索AGO基因家族成员的探针,并通过BAR数据库(bar.Utoronto)检索成员的组织表达的相对量。运用聚类热图软件 Multiple Experiment Viewer绘制AGO基因家族组织表达热图。

2 结果与分析

2.1 毛果杨AGO基因家族的结构 经过不断的分析验证,最终确定了13个毛果杨AGO基因家族成员(表1)。毛果杨AGO基因的基因序列长相差较大,其中最长的为 POPTR-0001 s22710 g基因,有2.15kbp,然而最小的为 POPTR-0008 s01100 g基因。AGO基因的编码序列差异不大,最长的是POPTR-0012 s03410 g基因,長度为3189bp。而最短的也有2463bp,是 POPTR-0010 s09150 g基因。POPTR-0010 s17100 g、 POPTR-0012 s11920 g、POPTR-0015 s15780 g的外显子数量只有3~4个,而其他 AGO家族成员的外显子数量超过20个,表明这些基因家族成员的不同功能和不同作用模式由结构差异显示。

2.2 AGO基因家族成员的理化特性和亚细胞定位预测 预测并分析了毛果杨AGO蛋白的理化特性和亚细胞定位,如表2所示:毛果杨AGO蛋白的理化特性及亚细胞定位预测。分析结果显示,毛果杨AGO基因家族13位成员的氨基酸序列数量都比较多,有820~1062个氨基酸。毛果杨AGO蛋白的等电点(PI)为8.91~9.45。毛果杨AGO蛋白的分子量在96689.19~117666.56Da,13位成员的分子量之间相差较小,相对比较平衡。毛果杨AGO蛋白的亲水性为-0.33~-0.537。毛果杨AGO蛋白的不稳定指数,除了POPTR~0012 s11920g和 POPTR~0015 s15780 g蛋白稳定指数小于40,其他AGO蛋白稳定性指数均大于40,表现出不稳定性。毛果杨AGO蛋白的脂溶性指数都比较大,平均都在73.53~85.88。亚细胞定位预测(表2):毛果杨AGO蛋白主要分布在叶绿体和细胞核中。这个数据表明,毛果杨蛋白AGO蛋白与其行使的功能的位置保持一致。

2.3 毛果杨和拟南芥AGO蛋白motif分析 对毛果杨的AGO基因家族的13个成员进行蛋白质基序分析。毛果杨AGO基因家族的氨基酸数量都比较大,并且具有类似的motif结构。

2.4 AGO蛋白系统发育树 对毛果杨AGO基因家族的13位成员和拟南芥AGO家族的10位成员的基因编码进行了系统发育树的构建。毛果杨和拟南芥的23个基因家族成员,它们可以分为3个类别,每个类别具有不同的支持率。A类中有9个成员,其中毛果杨AGO基因家族5个成员,拟南芥AGO基因家族4个成员。B组有8名成员,毛果杨有5名AGO基因家族成员,拟南芥AGO基因家族有3名成员;在C类中有6个成员,在拟南芥中有3个AGO基因家族成员。由于每个类都有来自毛果杨和拟南芥的AGO基因,因而可以从中推断出毛果杨的祖先种类含有至少3个AGO基因,这也表明AGO基因起作用在植物发育中具有重要功能的基因家族在进化上是保守的。A类中POPTR-0006s02680g和POPTR-0016s02480g,AGO8和AGO10,POPTR-0014s15760g和AGO6的基因座位;B类中POPTR-0006s12010g和POPTR-0009s00660g,POPTR-0012s03410g和AGO1,POPTR-0008s15860g和POPTR-0010s09150g的基因座分别是高度重复的,并且分别聚集在小分支上。在C类中,可以看出,C类的每1个小的分支上的基因座位都具有较高的重复性,由此可以推断,在毛果杨物种分化后,基因重复事件就开始了。同时,所有AGO蛋白都有3个功能域,即:Piwi、PAZ、DUF1785。

2.5 毛果杨AGO基因表达 在Affy网站检索到了11个AGO基因的探针集,而未检测到POPTR_0010s09150g基因的相应的探针集,POPTR_0006s02680g的探针集虽然检测到了,但是没有相应的数据分析。获得的AGO家族基因在根,叶,幼叶,雌花,雄花,木质部等中的转录表达数据。根据AGO基因在不同组织部位的表达数据制作热图所示:AGO基因家族的几乎所有成员都有不同的表达差异。大多数毛果杨AGO基因在成叶,雌花上的基因表达量很少,大部分毛果杨AGO基因在幼叶上的基因表达量相对较多,远远高于其他组织的表达量。通过仔细观察,可以发现POPTR_0008s01100g基因在雌花和雄花上的基因表达量远远高于其他组织的基因表达量,这就说明,该基因的主要作用部位位于雌花和雄花。

3 讨论与结论

3.1 讨论 植物AGO蛋白功能的鉴定主要在模式植物如拟南芥中进行,取决于它所结合的sRNA是否参与子叶的分化,在植物病毒感染期间发育调节花器官形成,茎尖分生组织和RNAi调节[6]。目前,AGO家族的2个最近成员AGO1和AGO10研究最多,主要涉及茎尖分生组织的维持。而且通过RNAi机制调控LFY(LEAFY)、AP1( APETALA1)和AG(AGAMOUS)基因的表达,它最终影响植物的分生决定,开花转化和花器官的测定,以及 KNOX,AG和AP3对叶和花粉管的分化[7]。AGO1和AGO10还可以通过分别调控miR172和miR165/166以引起成花干细胞的终止[8]。虽然AGO1是miR168的靶基因,但最近的研究表明它通过miR168的协调调节在应激反应和信号传导中起重要作用,而且这种作用机制是保守的。表达分析表明,AGO1广泛存在于各种组织中,而AGO10仅位于分生组织,导管和侧器官原基的近轴末端。此外,水稻中有19个AGO家族基因,主要在繁殖生长阶段表达,特别是在穗期。其中6个基因能够响应激素处理,且大多数基因与DCL(Dicer-like)、DRB(Double-stranded RNA binding)参与RNA沉默的基因,例如 RDR(RNA依赖性 RNA聚合酶),在生长和非生物胁迫中共表达。番茄(Lycopersicum esculentum)中有15个SlAGO基因,其中大部分基因在番茄黄叶病毒感染和非生物胁迫中显著增加[4]。SlAGO1蛋白和miR168在决定植物生长速率,发育阶段变化,叶片上调,果实起始和扩展以及其他发育阶段中起重要作用。虽然AGO蛋白家族成员在模式植物中的作用和作用机制研究取得了很大进展,但对木本植物AGO蛋白家族基因的研究却很少。从PtAGO克隆PeAGO5a和PdAGO5b基因,编码的氨基酸序列含有3个保守结构域DUF1785,PAZ和Piwi。差异表达分析表明,它可能参与杨树插条不定根发育的二次生长,是木本植物的重要特征[9]。最近的研究表明,AGO1和AGO10在不同位点通过miR165/166作用于茎尖分??生组织的分化[10],木质植物形成层的分化已经通过miR165/166确认,并且AGO蛋白家族的成员是否作用于该过程或者哪个家族成员作用于该过程,还需要进一步的研究[11]。同时,该研究的结果表明AGO4b.1在木质部高表达,但在其他组织中不表达。而AGO4可以通过RNA-directed DNA methylation(RdDM)途径与Heterochromatic siRNAs作用调控DNA的甲基化,复合物在细胞质中组装,然后通过细胞核运输到细胞核以发挥其功能。AGO4是否通过调节DNA甲基化途径调节毛果杨木材的形成和发育需要进一步研究。

3.2 结论 本研究获得了PtAGO基因家族的结构特征,13个基因家族成员主要分布在9条染色体上。染色体1,6,8,9,10,12,14,15和16的染色体高度重复,AGO基因的基因位点较高。所有的AGO蛋白都存在3个功能结构域:Piwi、PAZ、DUF1785。同时,根据毛果杨AGO基因在不同的组织部位的表达数据分析,推测出毛果杨AGO基因家族不同成员在不同组织中的基因表达量,从而得到该基因的作用部位主要在根、幼叶和木质部上。

参考文献

[1]Tolia N H,Joshua-Tor L .Slicer and the Argonautes[J].Nature Chemical Biology.2007,3(1):36-43.

[2]Ghildiyal M,Zamore P D.Small silencing RNAs:an expanding universe.[J].Nature Reviews Genetics,2009,10(2):94-108.

[3]許鑫,李丹丹,李双江,等.玉米AGO基因的克隆与表达分析[J].西北植物学报,2014,34(3):449-453.

[4]Mallory A,Vaucheret H.Form,function,and regulation of ARGONAUTE proteins[J].Plant Cell,2010,22(12):3879-3889.

[5]Mallory A,Vaucheret H.Form,Function,and Regulation of ARGONAUTE Proteins[J].The Plant Cell,2010,22(12):3879-3889.

[6]Zhu H L,Hu F Q,Wang R H,et al.Arabidopsis argonaute10 specifcally sequesters miR166/165 to regulate shoot apical meristem development[J].Cell,2011,145(2):242-256.

[7]Kidner C A,Martienssen R A.The role of ARGONAUTE1(AGO1) in meristem formation and identity[J].Dev Biol,2005,280(2):504-517.

[8]Ji L,Liu X,Yan J,et al.ARGONAUTE10 and ARGONAUTE1 regulate the termination of floral stem cells through two microRNAs in Arabidopsis[J].Plos Genetics,2011,7(3):e1001358.

[9]Meng X,Wenfan X,Huixin P,et al.Cloning and Characterization of ARGONAUTE Genes in Populus[J].Scientia Silvae Sinicae,2011,47(3):46-51.

[10]Zhu H,Hu F,Wang R,et al.Arabidopsis Argonaute10 Specifically Sequesters miR166/165 to Regulate Shoot Apical Meristem Development[J].Cell,2011,145(2):0-256.

[11]Lijuan J,Xigang L,Jun Y,et al.ARGONAUTE10 and ARGONAUTE1 Regulate the Termination of Floral Stem Cells through Two MicroRNAs in Arabidopsis[J].PLoS Genetics,2011,7(3):e1001358.

(责编:张宏民)