APP下载

玉米泛素连接酶U-box基因家族的全基因组鉴定及表达分析

2022-04-25曙,张彧,陈卓,金

西南农业学报 2022年3期
关键词:拟南芥元件基因组

陈 曙,张 彧,陈 卓,金 辉

(1. 中国热带农业科学院南亚热带作物研究所,广东 湛江 524091;2. 农业部热带果树生物学重点实验室,广东 湛江 524091)

【研究意义】泛素26S-蛋白酶体途径(UPP)作为生物体内蛋白翻译后的重要修饰途径之一,由泛素活化酶E1、泛素结合酶E2、泛素连接酶E3及26S蛋白酶体组成,共同调控生物体中蛋白的修饰和降解过程,是真核生物生命活动中最重要的调控机制之一。在UPP中,E3泛素连接酶负责对靶蛋白特异性识别,并进行泛素化修饰[1]。U-box基因家族作为泛素连接酶E3大家族中一类,其U-box结构域决定了U-box E3基因的活性。研究表明,该部位发生突变会导致E3连接酶活性变弱或者丧失[2],致使其在维持细胞分裂、信号转导、逆境胁迫、生长发育等多个方面的生物学功能紊乱或者彻底丧失[3-6]。因此鉴定玉米泛素U-box基因家族成员,研究基因功能对深入了解玉米生长发育和逆境胁迫等作用机制具有重要意义。【前人研究进展】U-box泛素连接酶最早在酵母UFD2蛋白中发现,也是最早发现的E3泛素连接酶[7]。U-box结构域由大约70个氨基酸组成,在真核生物中高度保守,在不同的植物基因组中数量差异大,这表明U-box在植物的生长发育过程中具有特异性调控[8]。U-box蛋白与RING蛋白结构具有高度的相似性,两者都具有β-β-a-β折叠结构,氨基酸序列类似,且促进E2结合酶与泛素分子相结合的部位相同。不同之处在于U-box的结构域是通过静电之间的相互作用形成,通过疏水核心基团代替结构金属离子,较RING finger结构域而言更加稳定和保守[9-10]。有别于RING finger结构域中通过金属离子的作用螯合残基,拟南芥PUB蛋白(Arabidopsis thaliana plant U-box, 简称At PUB)AtPUB14是拟南芥中最早鉴定出来含有U-box结构域的蛋白,含有β-β-a-β折叠结构以及锌指结构,其2个疏水结构基团上的残基构成特殊的E3结合位点,并通过氢键之间的相互作用使U-box结构稳定[11]。目前为止,在拟南芥中已发现64个含有U-box结构域的蛋白[12],在水稻中,鉴定出了77个[13],蒺藜苜蓿中有41个[14],番茄中鉴定出了56个[15]。PUB蛋白参与植物生长发育过程以及对环境胁迫的防御作用。研究表明,拟南芥中AtPUB17基因参与了植物细胞凋亡过程,对植物生长发育有着正调控作用[16]。在烟草和油菜中分别存在其同源基因ACRE276和ARC1,其中ACRE276与AtPUB17的功能具有同源性,而ARC1与AtPUB17功能则并不相同,ARC1含有ARM结构,具有E3连接酶活性,对油菜的自交不亲和状态进行负调控作用[17-18]。在干旱胁迫条件下,水稻OsPUB41基因通过介导OsUBC25后被激活,并与OsCLC6相互作用,并发挥负调控作用[19]。马铃薯的PHOR1基因在反义沉默后,植株长势变缓且变得矮小,对外源GA表现不敏感,响应能力受损;而将PHOR1基因过表达后发现,植株变得对外源GA敏感,对GA合成抑制剂的抗性增强[20]。U-box蛋白在植物对抗环境胁迫中也发挥着重要作用。CHIP蛋白作为U-box家族中一类具有辅助分子伴侣和E3活性的蛋白,在植物遭遇高温、强光灯不利因素时能提高植物的抗逆性[21]。植物类病变(lesion mimics)突变体是一类在没有病原物入侵时就能自发产生坏死斑的突变体,这类突变往往使植株增强抗病。水稻SPL11突变体植株在无病原体侵染的情况下发生系统性的自主死亡过程,叶片自发出现病斑,并且植株对一些真菌和细菌性病原体的抗性增强,如稻瘟病菌和白叶枯病菌[22]。玉米是全球主要的经济粮食作物之一,在玉米的生长发育过程中泛素化过程具有重要的意义,其过程顺利进行与否直接影响玉米植株的生长,同时也影响产量和品质[23]。【本研究切入点】目前已完成玉米全基因组的测序工作,为在全基因组范围内对玉米各基因家族进行基因结构分析和功能预测提供了数据支持。但迄今为止,尚未见有对玉米U-box基因家族的研究和报导。【拟解决的关键问题】本研究利用生物信息学方法,通过对玉米全基因组进行分析,鉴定出U-box基因家族中的基因类型、数目以及对基因的结构、理化性质、染色体定位、启动子功能和基因的表达模式进行分析等,以期为后续深入开展U-box基因功能的相关研究提供理论依据。

1 材料与方法

1.1 数据来源

玉米(ZeamaysL.)全基因组数据来源于Maize Genetics And Genomics Database数据库(https://www.maizegdb.org/)及Ensembl Plants基因组数据库(http://plants.ensembl.org/index.html)。拟南芥U-box基因家族基因和蛋白序列下载于拟南芥TAIR数据库(http://www.arabidopsis),水稻U-box基因家族基因序列下载于水稻全基因组数据库(http://rice.plantbiology.msu.edu/)。

1.2 数据处理

1.2.1 玉米U-box基因序列的获取和家族成员鉴定 以目前拟南芥中鉴定出的64个U-box基因家族成员的序列对Ensembl Plants基因组数据库(http://plants.ensembl.org/index.html)进行基因搜索和序列比对,查找出玉米基因组中所有U-box基因的CDS和蛋白序列。所得结果利用SMART(http://smart.emblheidelberg.de/)在线分析软件进一步进行结构分析,剔除无典型U-box结构域的序列,最终得到玉米基因组中所有U-box基因。

1.2.2 玉米U-box家族基因的结构分析 根据已获得的玉米U-box基因的基因序列和CDS序列,利用在线工具GSDS (http://gsds.cbi.pku.edu.cn)分析基因结构,明确内含子和外显子的组成数量。并通过Mapinspect工具标注每个U-box基因在染色体上的位置,了解U-box基因家族中所有U-box基因在基因组中的分布情况。

1.2.3 玉米U-box基因氨基酸序列属性分析 利用ExPASy Proteomics Server(http://www.expasy.org/ proteomics )对所有玉米U-box基因进行蛋白分子量、等电点、不稳定系数等理化性质分析预测。利用Plant-mPLocServer(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/#)在线工具分析U-box蛋白的亚细胞定位。二级结构分析利用SOPMA在线程序(http://npsa-pbil.ibcp.fr/cgi-bin/npsa_automat.pl?page =npsa_sopma.html)。

1.2.4 玉米U-box基因序列比对及系统进化树的构建 利用ClustalW工具对水稻、拟南芥、玉米基因组中所有U-box蛋白序列进行比对,结合序列比对结果,利用MEGA 6软件采用邻接法(neighbor joining,NJ)构建系统发育进化树。参数设置:替换模型设置为“Poisson model”,缺口设置为“Pairwise deletion”,校验参数Bootstrap method 取值为1000。

1.2.5 玉米U-box基因启动子功能分析 获取玉米U-box家族基因上游约1500 bp序列,将序列导入在线工具Plant CARE(http:/ /bioinformatics.Psb.Ugent.be /webtools /plantcare /html/)中,归类基因启动子上的作用元件,预测分析各基因启动子所含基序种类和功能。

1.2.6 玉米U-box家族基因在不同组织中的表达模式分析 通过Ensembl Plants (http:/ /plantsa.ensembl.org /index.html) 网站,根据基因登录号,搜索下载玉米76个U-box基因在胚、胚囊、胚乳、胚珠、子房、根、叶片、穗、花粉等其它共14个不同组织部位的表达情况。利用百迈客在线软件( http:/ /console.Biocloud.net /static /index.html)绘制基因表达热图。

2 结果与分析

2.1 玉米U-box家族基因的获取和理化性质分析

通过BLAST比对以及搜索,剔除无典型U-box结构域的序列,最终从玉米全基因组中共鉴定出76个含有U-box结构域的基因,如图1所示。ZmPUB基因在玉米基因组1~10号染色体上均有覆盖,每条染色体ZmPUB基因数量从2~12个不等,其中1号染色体上最多,为12个,8号染色体上仅含2个。部分U-box基因较为特殊,在染色体上紧密排列形成了基因簇。另外有两个基因在染色体上无法定位,分别为ZmPUB1和ZmPUB2。表1结果显示,玉米U-box基因中分子量最大的蛋白ZmPUB22含有氨基酸残基数目为1353,分子量大小为144.72 kD,最小的U-box蛋白为ZmPUB57,含有94个氨基酸残基,分子量仅10.76 kD。对等电点进行分析发现,最小的U-box蛋白为ZmPUB34,等电点为4.86,显酸性。不稳定指数分析显示,78个ZmPUB基因中,不稳定指数最小的为ZmPUB14,最大的为ZmPUB59,其中不稳定指数小于40蛋白的有13个,蛋白稳定性较好,其余65个ZmPUB蛋白均为不稳定蛋白。

图1 玉米U-box家族基因在染色体上的位置分布Fig.1 The distribution of maize U-box family genes on chromosomes

表1 玉米U-box家族基因理化性质分析

续表1 Continued table 1

续表1 Continued table 1

2.2 玉米U-box基因家族系统进化及基因结构分析

利用上述筛选出的76个ZmPUB蛋白序列,与62个拟南芥PUB蛋白以及77个水稻PUB蛋白组成数据矩阵,利用MEGA 6进行系统进化分析(图2),结果显示玉米、水稻、拟南芥三大U-box基因家族可分为9个亚家族,即PUBⅠ~PUBⅨ。3个作物中各亚家族U-box基因数量差异明显,亚家族Ⅶ中水稻成员数目最多,为32个,占水稻U-box基因总数的41.6%,在亚家族Ⅲ、Ⅳ、Ⅴ和Ⅵ中则数量较少,分别为0、0、2和1。拟南芥在亚家族Ⅶ中数目为17个,占水稻U-box基因总数的27.4%,数量最多,在亚家族Ⅳ中数目为零,数量最少。玉米在各亚家族中的成员数量分布为2~23个,其中在亚家族Ⅱ中为23个,占玉米U-box基因总数的30.3%,在亚家族Ⅳ和Ⅴ中数目最少,均为2个。

图2 玉米、拟南芥以及水稻U-box家族基因系统进化分析Fig.2 Phylogenetic analysis of U-box family genes in maize, arabidopsis and rice

亚家族Ⅳ中仅含有2个玉米U-box基因,分别为ZmPUB41和ZmPUB53,不含有水稻和拟南芥成员。表明玉米在历史进化过程中可能发生了多次家族基因扩增现象,且ZmPUB41和ZmPUB53在经过片段复制后发生了快速变异。利用在线软件GSDS对玉米U-box基因进行结构分析,并绘制基因结构示意(图3),结果显示玉米U-box家族76个成员中共有28个基因无内含子,仅含有1个外显子,占玉米U-box基因总数的36.8%,表明这些基因进化可能源于转座子机制。内含子最多的为ZmPUB39,含有17个,其余基因分别含有内含子数目为1~17个不等。

图3 玉米U-box家族基因结构分析Fig.3 The genetic structure analysis of maize U-box family

2.3 玉米U-box基因启动子功能预测和分析

考虑到玉米U-box基因家族较大,成员数较多,笔者根据系统进化分析结果,从亚家族PUB1~PUB9中每个亚家族选取1~2个成员,总计14个基因作为分析对象,具体基因编号见表2。表2统计结果显示,受检基因所含功能元件主要包括植物激素响应元件、逆境胁迫应答元件、光反应元件和周期性调控相关元件4类。所有基因中所含光反应元件最多,说明玉米U-box基因参与了植株光合作用或相关代谢活动。在植物激素调控方面,主要分为ABA、MeJA、IAA、GA、乙烯、水杨酸6类,各受检基因所含元件数量差异明显。14个受检基因中,部分基因不含乙烯调控元件,其余基因所含数量为1~4个,含量较少,说明各基因在参与乙烯调控中可能不作为主效基因发挥作用。其余基因如ZmPUB35含有ABA调控元件最多,ZmPUB1含有MeJA调控元件最多,ZmPUB41含有IAA和水杨酸调控元件最多,ZmPUB33含有GA调控元件最多。同理在逆境胁迫调控中,对应干旱胁迫、厌氧应答、低温调控中所含元件数量最多的基因分别是ZmPUB2、ZmPUB1和ZmPUB73,在周期性调控相关元件中ZmPUB75所含元件最多,这些现象说明不同亚家族成员间各基因主效功能不一样,表明在玉米进化过程中,U-box家族基因在复制、快速扩增的同时也发生了大量的变异,使玉米U-box家族基因功能更加多样化。

表2 玉米U-box基因启动子功能元件分析

2.4 玉米U-box基因在不同组织的表达分析

利用搜索出的64个玉米U-box基因表达数据(12个基因未能搜索出相关数据),制作基因表达热图(图4)。基因表达聚类分析结果显示,玉米U-box基因在不同组织中表达差异较大,各U-box基因表达差异明显。ZmPUB3、ZmPUB6、ZmPUB7、ZmPUB11、ZmPUB22、ZmPUB29、ZmPUB50、ZmPUB52在种子的发育以及组成器官如胚、胚囊、胚乳、珠心、糊粉层、子房、胚珠中大量表达,表明这些基因可能参与了种子的形成以及萌发等生理活动过程。部分基因如ZmPUB19、ZmPUB21、ZmPUB26、ZmPUB49等在被检测组织中均未见表达,说明未参与上述器官相关生命活动。ZmPUB12、ZmPUB18、ZmPUB30、ZmPUB40、ZmPUB75在花粉中表达量较高,而在其它被检测组织中均未见表达,说明这5个基因功能特异性较强,可能在玉米花粉受精过程中发挥了重要作用。

T1:维管束鞘;T2:胚;T3:胚囊;T4:胚乳;T5:花丝;T6:叶片;T7:珠心;T8:糊粉层;T9:子房;T10:胚珠;T11:花粉;T12:根;T13:雄穗;T14:营养分生组织T1:Vascular sheath;T2:Embryo;T3:Embryo sac;T4:Endosperm;T5:Filigree;T6:Leaf;T7:Nucellus;T8:Aleurone layer;T9:Ovary;T10:Ovule;T11:Pollen;T12:Root;T13: Tassel;T14:Vegetative meristem图4 玉米U-box家族基因在不同组织中的表达分析Fig.4 Expression analysis of maize U-box family genes in different tissues

3 讨 论

U-box基因家族是泛素连接酶E3家族中的主要家族之一,在植物的生长发育及逆境胁迫应答中发挥了重要的作用,包括人类在内,U-box蛋白几乎存在于所有的真核生物中[2]。U-box蛋白最早在酵母中被发现,随后相继在拟南芥、水稻、番茄、柑橘、雷蒙德氏棉、苜蓿等作物中被鉴定报导。随着玉米全基因组测序工作的全面完成,大量的玉米基因家族功能被研究和验证,极大的推进了玉米基础研究领域的发展,生物信息学作为研究植物基因功能、调控模式以及系统进化关系等功能的重要工具被广泛使用。目前玉米E1、E2家族基因已经相继被鉴定出来,而E3家族包括多亚基家族cullin-RING (CRLs)和单亚基家族如HECT(homologous to E6-AP COOH-Terminus) 、RING (really interesting new gene) 、U-box 共4类家族,目前尚未见有对U-box基因家族的系统性报导。本研究从玉米全基因组中鉴定出了76个U-box基因成员,与水稻U-box成员数相似,比拟南芥、苜蓿和番茄中U-box成员数目多,表明不同物种的U-box成员数量存在差异。部分玉米U-box基因染色体上排列紧密,形成了数目较多的基因簇,加强了基因功能的表达。玉米不同U-box亚家族成员间所含氨基酸数目、等电点、分子量、外显子数量以及不稳定指数差异较大,说明其理化性质有较大不同,而同一亚家族间各成员上述各理化指标相似度较高,暗示其理化性质相似。基因内含子/外显子排列特性对基因功能具有重大影响[24]。基因结构及系统进化分析结果显示,同一个亚家族中,处在不同分支的U-box基因在外显子、内含子数目以及蛋白序列长度等方面均有差异,但同属一个分支的旁系同源基因之间如ZmPUB75与ZmPUB18、ZmPUB29与ZmPUB50、ZmPUB4与ZmPUB70及ZmPUB35与ZmPUB67等理化性质及基因结构高度相似。说明玉米泛素连接酶U-box家族基因在进化过程中具有高度保守性,但同时在漫长进化过程中使得基因功能多样化,以适应环境变迁和种群延续。

启动子作为位于基因5′端上游的DNA序列结构,控制着基因转录的起始以及表达程度,继而决定了编码特异性蛋白的功能。玉米U-box基因在植物的各种生命活动如生长发育、逆境胁迫、信号转导以及细胞周期调控等方面起着非常重要的作用[3-6]。进行启动子结构和基序分析对研究基因的功能具有重要的作用。本研究通过对14个玉米U-box基因启动子功能预测分析发现各基因均含有大量光反应元件,说明U-box基因可能参与了植物光合作用调控途径。在所有受检基因中均发现有生长素、脱落酸以及茉莉酸甲酯顺式作用元件,暗示U-box基因可能参与了玉米植株的生长发育、果穗的成熟以及病虫害应激性防御过程。在逆境胁迫方面,干旱响应、厌氧应答和低温调控三类元件在玉米U-box基因中均存在,说明U-box基因在植株应对这些逆境胁迫中均发挥了相应作用。

进行基因组织表达模式分析是了解基因生物学功能的重要方法之一。本研究中,对玉米14个不同组织部位进行基因表达分析发现,不同U-box基因间组织差异性表达明显。基因表达热图显示,部分基因表达不具有特异性,如ZmPUB3、ZmPUB6、ZmPUB7、ZmPUB22、ZmPUB29、ZmPUB50除在花粉中表达量较低外,在其它13个受检组织中均有较高表达量。而部分基因表达特异性强,如ZmPUB12、ZmPUB18、ZmPUB30、ZmPUB40、ZmPUB75仅在花粉中有较高表达量,在其它组织中几乎不表达。这些现象说明玉米U-box家族基因功能具有互补性,揭示了U-box家族在进化过程中,在基因复制扩增的过程中也逐渐产生了新的变异,使得整个基因家族功能更加全面完善。基因在特殊器官中高水平表达意味着其在相关过程中发挥关键作用。研究发现柑橘CcPUB10基因能够调控柑橘叶、花、茎和果的生长发育[25]。苹果MdPUB24在叶片中高度表达,且对外源ABA、NaCl和低温胁迫呈负调控反应[26]。本研究中,部分玉米U-box基因在种子相关器官中大量表达,暗示了其可能参与了种子的形成以及萌发等生理活动过程,但具体作用机制还不清楚,需后续对相关基因的功能进行进一步研究和验证。

4 结 论

本研究依据玉米全基因组数据库,从中鉴定出了76个玉米U-box家族成员,经筛选、鉴定后其蛋白均含有U-box保守结构域。各成员含有内含子数目差异较大,部分基因内含子数量为零。启动子功能预测分析发现,U-box基因可能参与了玉米光合作用、激素应答和逆境胁迫应答反应,且响应程度不同,显示出各成员间基因功能特异性明显。基因表达模式分析结果显示玉米U-box基因表达具有组织特异性。

猜你喜欢

拟南芥元件基因组
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
宏基因组测序辅助诊断原发性肺隐球菌
如何读懂色环电阻
非线性元件的处理
拟南芥
口水暴露了身份
一株特立独行的草
上海风云“东邪”谁属
Protel 99se网络表装载中纠错探索