APP下载

花生WRI1基因家族的全基因组与表达谱分析

2020-07-24孙金波石素华杨利李凤丽王兴军赵术珍

花生学报 2020年1期
关键词:拟南芥结构域基因组

孙金波石素华杨 利李凤丽王兴军*赵术珍*

(1.山东师范大学生命科学学院,山东 济南 250014; 2.山东省农业科学院生物技术研究中心/山东省作物遗传改良与生态生理重点实验室,山东 济南 250100; 3.山东大学生命科学学院,山东 青岛 266237)

花生是世界上重要的油料作物和经济作物,富含脂肪和蛋白质,另外,花生还富含矿物质、维生素、抗氧化剂和改善人体健康的生物活性化合物,如白藜芦醇、生育酚、精氨酸等,被誉为功能性食品[1]。花生生产区主要包括美洲(北部、南部和拉丁美洲)、非洲(东部、南部、西部)和亚洲(东部、东南部、西南部)。中国、印度、尼日利亚和美国是主要的花生种植国。中国(42%)和印度(18%)的产量约占全球总产的60%,其次是尼日利亚(7.7%)、美国(4.3%)和印度尼西亚(1.8%)[1]。花生含油量占种子重量的45%~52%[2],因此进一步提高种子含油量,是花生遗传改良的重点领域之一。

研究表明,一些转录因子可以通过调控油脂合成中关键酶的表达来影响油脂含量,例如WRINKLED1(WRI1)、LEAFYCOTYLEDON1(LEC1)和FUSCA3(FUS3)等[3]。WRI1具有2个AP2保守结构域,属于AP2/EREBP家族转录因子,是植物特有的一类转录因子,含有由60~70个氨基酸组成的AP2/ERF结构域[4-5]。WRI1于1998年首次在拟南芥中发现[6],其拟南芥突变体和过表达植株中,种子含油量分别降低80%或提高20%[7]。PKp-β1和BCCP2是分别参与糖酵解和脂肪酸合成途径的酶,研究发现WRI1在种子中特异性表达增强糖酵解和脂肪酸生物合成基因的mRNA积累,此过程是通过WRI1与PKp-β1和BCCP2启动子特异性结合实现的[8]。

研究人员已相继在拟南芥、油菜、玉米等多种植物中克隆了WRI1基因,其中,在拟南芥中WRI1只有一个成员,而其他植物中WRI1家族成员数目不等[9],在花生中对此基因的研究较少。花生二倍体野生种和四倍体栽培种基因组序列的完成,为花生油脂合成基因的鉴定提供了重要的基因序列资源。本研究利用花生二倍体野生种和四倍体栽培种基因组信息,在全基因组范围内系统分析了花生的WRI1基因家族,并考查了该基因家族在花生不同组织和荚果不同发育时期的表达模式,为花生脂肪酸合成途径的调控研究提供了重要的理论依据。

1 材料与方法

1.1 WRI1基因的筛选鉴定

从Tair(https://www.arabidopsis.org/)网站,查找拟南芥(ArabidopsisthalianaL.)基因组中的WRI1基因,获得其CDS序列。以拟南芥WRI1(At3g4320)基因的蛋白质序列为查询序列,在peanutbase(https://www.peanutbase.org/home)中,利用BLASTP进行同源搜索,利用SMART软件(http://smart.embl-heidelberg.de/)对花生WRI1候选基因的蛋白进行结构域分析,筛选含有两个AP2结构域的蛋白序列,去除冗余蛋白,得到花生WRI1蛋白质的同源序列。利用phytozome数据库(https://phytozome.jgi.doe.gov/pz/portal.html#! search?show=BLAST)查找大豆(GlycinemaxL.)、苜蓿(MedicagotruncatulaL.)、菜豆(Phaseolus vulgarisL.)的WRI1序列。

1.2 同源基因鉴定与结构分析

从peanutbase数据库中查找花生WRI1基因的序列和染色体物理位置等信息。利用gsds网站(http://gsds.cbi.pku.edu.cn/index.php)对WRI1进行基因结构分析并对已获得的WRI1序列进行进化分析。

1.3 理化性质预测、二级结构分析与亚细胞定位

使用ExPaSy提供的在线分析工具Protparam(https://web.expasy.org/protparam/)[10],分析WRI1蛋白质序列的一级结构,包括氨基酸数目、等电点、分子量、疏水性等。二级结构预测采用在线分析工具SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/npsa_ automat.pl?page=/NPSA/npsa_sopma.html)[11]。利用ProtComp(http://linux1.softberry.com /berry.phtml?topic=protcomppl&group=programs&subgroup=proloc) 对WRI1蛋白进行亚细胞定位预测分析。

1.4 保守结构域和进化分析

利用Clustal X对拟南芥、大豆、菜豆、苜蓿和花生WRI1转录因子蛋白序列进行多重序列比对,运用MEGA 6.0[12]软件中的邻接法(NJ,neighborjoining)构建进化树,校验参数Bootstrap设为500。利用在线软件WebLogo 3(http://weblogo.berkeley.edu/logo.cgi/)绘制保守结构域LOGO图[13]。

1.5 基因表达分析

两个花生野生种及22个不同组织的RNA-seq数据已经公布于花生测序网站[14](https://www.peanutbase.org/gene_expression)。对这些信息进行分析,获得花生WRI1基因在不同组织及不同发育时期的表达谱数据。组织主要包括叶、茎、根、根瘤、雌蕊、雄蕊、花瓣、雌蕊柄、幼果、果皮和种子。其中,包括5个不同发育时期的种子、3个不同时期的叶以及分别包括2个不同发育时期的茎、雌蕊柄、幼果和果皮。利用获得的表达谱数据,绘制WRI1家族成员的基因表达谱。图中用颜色深浅表示基因表达的强弱,绿色越深表示基因表达量越低,红色越深表示基因表达量越高。

利用栽培品种花育31不同组织和不同发育时期的种子为材料提取RNA,然后反转录得到cDNA,利用实时定量PCR进行WRI1的表达分析。程序为:50℃ 2 min,95℃ 10 min ,40个循环的95℃ 15 s,60℃ 1 min。利用2-△△Ct法计算基因相对表达量。

2 结果与分析

2.1 花生WRI1家族全基因组鉴定与染色体定位

通过同源基因搜索与利用SMART剔除不含保守结构域的蛋白序列后,在AA基因组鉴定到5个WRI1家族成员,BB基因组鉴定到4个WRI1家族成员,栽培种中鉴定到11个WRI1家族成员。基因结构分析表明,花生WRI1基因家族含有大量的外显子(图1)。染色体定位结果表明,在AA基因组中,A04上有3个、A08和A10各1个WRI1,在BB基因组中,4个WRI1基因分别分布在B04、B05、B09和B10染色体上。栽培种中WRI1在15号染色体中有2个,01、04、05、08、10、11、14、17和20号染色体上各有1个(表1)。

2.2 基因结构分析

利用野生种和栽培种基因组鉴定获得的20个WRI1成员的氨基酸序列构建系统进化树,并进行结构分析。结果表明,外显子数在6~9个之间,其中Araip.SZ63C.1、Aradu.EJI6Q.1和Araip.RB7C2.1最多,为9个,Arahy.I3YYWX.1、Araip.34E5E.1、Arahy.F5Q2PM.1、Aradu.G1CDJ.1、Arahy.F0M2KT.1、Arahy.5MV2CV.1、Araip.L05NW.1、Arahy.HG2532.2和Arahy.UVRI66.2最少,为6个,但外显子数目与聚类并没有明显的关系(图1)。

表1 WRI1基因的染色体定位和蛋白定位Table 1 Chromosome and protein localization of WRI1

图1 WRI1的基因结构Fig.1 The gene structure of WRI1

表3 花生WRI1蛋白的二级结构Table 3 Secondary structure of WRI1 protein in peanut

2.3 WRI1蛋白质的理化性质

通过对野生种和栽培种花生的20个WRI1家族成员理化性质的分析表明,WRI1中氨基酸数目在315~752个,平均分子量为46.8 kDa,其中Aradu.M2I8I.1的氨基酸数目最多,为752个,分子量为81.99 kDa,Araip.34E5E.1的氨基酸数目最少,为315个,分子量为35.94 kDa。WRI1蛋白质的等电点在5.29~9.22之间,其中6个蛋白质的等电点大于7.5,显碱性,9个蛋白质的等电点小于6.5,显酸性;疏水性均为负值,属于亲水性蛋白质。大多数WRI1蛋白的不稳定系数大于40,为不稳定蛋白,但其中Aradu.M2I8I.1和Araip.RB7C2.1不稳定系数小于40,分别为39.76和36.4,为稳定蛋白质(表2)。

通过ProtComp网站对野生种和栽培种花生20个WRI1蛋白进行亚细胞定位预测,发现所有WRI1家族成员均定位在细胞核内(表1)。

根据在线工具SOPMA对二级结构的预测统计发现,20个蛋白质的二级结构以无规则卷曲为主要构成元件,以α-螺旋为次要构成元件,两者在各个WRI1蛋白组成中平均比例分别为55.20%和29.92%,两者之和达到85.12%(表3)。

2.4 WRI1系统发育和保守结构域分析

采用MEGA6软件的邻近法,bootstrap值为500,将花生(20个)、大豆(28个)、菜豆(24个)、苜蓿(26个)、拟南芥(1个)的WRI1蛋白质构建了系统发育树。根据亲缘关系分为A、B、C、D、E、F共6个组,其中A又分为4个亚组,除了E和F,其他组中均有花生WRI1基因的分布,花生WRI1基因在B组中分布最多,为8个。WRI1转录因子家族成员并未因物种差异单独地聚为几类,说明花生与其他物种WRI1成员之间拥有较近的亲缘关系(图2)。

利用ClustalX 软件对20个蛋白质序列进行多序列比对,结果表明其保守结构域主要位于蛋白中间位置,两端较少,其保守结构域由大约150个氨基酸残基组成(图3)。其保守结构域中含有大量的丙氨酸(A)和精氨酸(R),但精氨酸有时会被赖氨酸(K)和组氨酸(H)替换,丙氨酸有时会被甘氨酸(G)和丝氨酸(S)替代(图4)。

2.5 WRI1在不同组织中的表达量分析

利用已公布的花生转录组数据,构建基因表达热图,以推测这些基因的作用。从图5中可以看出,这些基因的表达模式可以分为4类。第1类的Aradu.EJI6Q.1、Araip.SZ63C.1、Aradu.M2I8I.1、Araip.RB7C2.1、Araip.AXK3N.1、Arahy.UU942A.1与Arahy.UVRI66.2主要在种子中表达,第2类的Arahy.J9H0YQ.1和Arahy.5MV2CV.1在各个组织中均有表达,推测该基因为组成型表达,第3类的Aradu.387PF.1、Arahy.F0M2KT.1、Arahy.I3YYWX.1、Arahy.F5Q2PM与Aradu.G1CDJ.1主要在根瘤中表达,第4类的Arahy.N9BW0I.1、Arahy.RWA9J9.1与Arahy.HG2532.2在各组织的表达量均较低。

图2 花生、大豆、拟南芥、菜豆和苜蓿WRI1的进化树分析Fig.2 Phylogenetic analysis of WRI1 in peanut, soybean, Arabidopsis, kidney bean and alfalfa

图3 WRI1蛋白质多序列比对结果 Fig.3 Multiple sequence alignment of WRI1 protein

图4 花生WRI1蛋白家族保守域分析Fig.4 Conservative domain analysis of peanut WRI1 protein family

图5 花生WRI1基因在不同组织器官中的表达谱Fig.5 Expression profile of peanut WRI1 in different tissues and organs

图6 4个不同发育时期的花生荚果Fig.6 Four different stages of peanut pods

为研究不同组织和荚果发育不同时期WRI1基因家族的表达情况,根据中果皮颜色和厚度,将花生荚果发育分为4个时期:白色厚期(S1),白色薄期(S2),棕斑薄期(S3),黑斑薄期(S4)(图6),利用筛选到的20个WRI1基因设计引物进行qRTPCR表达分析,因为Arahy.N9BW0I.1和Arahy.RWA9J9.1、Arahy.I3YYWX.1和Araip.34E5E.1、Arahy.KP68JR.1和Arahy.HG2532.2、Arahy.UVRI66.2和Aradu.EJI6Q.1、Araip.RB7C2.1和Aradu.M2I8I.1、Arahy.F5Q2PM.1和Aradu.G1CDJ.1以及Arahy.F0M2KT.1、Arahy.5MV2CV.1、Aradu.387PF.1和Araip.L05NW.1的序列分别对比后发现其同源性很高较难区分,实验中用同一引物进行检测。定量结果表明,20个WRI1基因表达模式各不相同,但也有共同点。Arahy.UU942A.1、Arahy.N9BW0I.1、Arahy.UVRI66.2、Araip.SZ63C.1、Aradu.M2I8I.1、Araip.RB7C2.1和Araip.AXK3N.1均在种子中有较高的表达量,推测其可能对调控种子中油脂合成具有重要作用,而其他基因在种子中的表达量较低,且在其他组织中均有表达,可能参与其他调控过程。

图7 WRI1在栽培种花生中不同组织的相对表达水平Fig.7 Relative expression levels of WRI1 indifferent tissues in cultivated peanut

3 讨 论

WRI1转录因子主要在油脂积累和胚胎发育中起重要调控作用,利用拟南芥wri1突变体研究发现,突变体中表达水平下降的基因大多参与糖酵解和脂肪酸代谢[15]。本研究通过对花生二倍体野生种和四倍体栽培种的蛋白序列分析,筛选鉴定出20个WRI1家族成员,分布于不同的染色体上。前人研究发现,包括拟南芥WRI1在内的多数WRI1基因具有7个外显子[16],而我们的研究结果显示,花生WRI1的外显子数在6~9个之间,不同家族成员之间外显子数目不完全相同。

通过对花生WRI1基因家族的二级结构分析发现,20个蛋白质的二级结构均以无规则卷曲为主要构成元件,α-螺旋为次要构成元件,大豆和沙棘WRI1的二级结构也是如此[17-18]。WRI1在不同物种间是相对保守的,通过对20个WRI1的保守结构域分析发现,其保守序列具有高度相似性。通过对WRI1的亚细胞定位预测分析发现,本次筛选到的20个成员均定位在细胞核内,这与其他植物中WRI1的亚细胞定位基本一致[17-19]。在进化树中可以发现,多数栽培种花生中WRI1家族成员均能在野生种AA和BB中找到同源基因。

利用已公布的花生转录组数据分析发现,有7个WRI1基因是在种子发育过程中特异表达的,因此推测其可能与油脂合成和胚胎发育等有密切关系。通过qRT-PCR验证发现,Arahy.UU942A.1、Arahy.N9BW0I.1、Araip.SZ63C.1和Araip.AXK3N.1在种子发育过程中均具有较高的表达量,其稳定的高表达可促进油脂的合成和积累,这与随着种子成熟的增加脂肪酸含量逐渐升高的趋势 是 一 致 的[20]。Arahy.J9H0YQ.1、Arahy.KP68JR.1、Arahy.UVRI66.2、Aradu.M2I8I.1和Araip.RB7C2.1呈现出随着种子成熟度的增加,表达量逐渐降低或先升高后降低的趋势。在大豆中的研究结果相似,GmWRI1a主要在种子中表达,且随成熟度的增加表现出先升高后降低的趋势[21],因此推测其可能有相似的功能。大豆中GmWRI1b和GmWRI1c主要在茎和花中表达[21],而Arahy.I3YYWX.1、Arahy.F0M2KT.1和Arahy.F5Q2PM.1在种子中表达量也比较低,其功能可能与大类中的同源基因类似。

猜你喜欢

拟南芥结构域基因组
“植物界大熊猫”完整基因组图谱首次发布
细菌四类胞外感觉结构域的概述
牛参考基因组中发现被忽视基因
拟南芥栽培关键技术研究
科学家找到母爱改变基因组的证据
UBR5突变与淋巴瘤B细胞成熟
血清HBV前基因组RNA的研究进展
拟南芥
口水暴露了身份
DEP结构域的功能研究进展