APP下载

烟草NtAGPase 基因家族的鉴定及功能解析

2020-11-19刘宝玲薛金爱李润植

山西农业科学 2020年11期
关键词:亚基拟南芥结构域

陈 莹,李 腾,高 宇,刘宝玲,薛金爱,李润植

(山西农业大学分子农业与生物能源研究所,山西太谷030801)

烟草是我国乃至世界的主要经济作物之一,综合利用潜力极大。淀粉是烟叶中重要的碳水化合物,也是烟叶干物质的主要成分,其组成和性质直接影响着烟叶的经济价值[1]。研究烟草淀粉合成机制可为烟草定向改良和优良品种选育提供一定的科学基础。

已有研究显示,在植物体内,淀粉的生物合成过程主要受ADP- 葡萄糖焦磷酸化酶(ADP-glucose pyrophosphorylase,AGPase)、淀粉合成酶(Starch synthase,SS)、淀粉分支酶(Starch branching enzyme,SBE)和淀粉去分支酶(Starch debranching enzyme,SDBE)的调控[2]。其中,AGPase 催化葡萄糖 -1- 磷酸(Glu-1-P)与三磷酸腺苷(ATP)作用生成ADPG 和焦磷酸(PPi),是淀粉合成过程中的关键性限速酶[3]。

在细菌内,AGPase 是由glgC 基因编码的同源四聚体,由同一种亚基构成;在高等植物中,AGPase是一个异源四聚体,由2 个大亚基和2 个小亚基组成[4-5],其中,小亚基行使催化功能,大亚基调控小亚基的活性[6]。不同作物AGPase 大小亚基的分子质量不同,大亚基分子质量多为55~60 ku,小亚基的分子质量则是50~55 ku[6]。根据在植物细胞内的分布位置,AGPase 可分为质体型和胞质型[7],大多数植物的AGPase 属于质体型,催化反应主要在质体中进行;然而,在部分禾木科植物中,AGPase 属于胞质型,例如小麦、玉米等[8-9]。此外,不同植物体内AGPase大小亚基基因数目也有差异。例如,在拟南芥中,AGPase 由 4 个大亚基(ApL1~ApL4)和 2 个小亚基(ApS1 和 ApS2)基因组成[10]。马铃薯 StAGPase 基因含有3 个大亚基和1 个小亚基基因[11]。木薯中共鉴定出9 个AGPase 基因家族成员,包含6 个大亚基(LS)和 3 个小亚基(SS)基因[12]。

为了深入研究烟叶碳水化合物生物合成及调控机制,本研究以AGPase 为靶标,从全基因组水平鉴定烟草NtAGPase 基因家族成员,利用生物信息学工具分析各成员的基因结构、系统进化、基因顺式调控元件,以及编码酶蛋白的理化特性、高级结构、亚细胞定位和功能活性域等,研究结果将为利用基因工程进行烟草遗传改良提供理论依据和分子修饰靶标。

1 材料和方法

1.1 烟草NtAGPase 家族成员鉴定

从拟南芥数据库 Tair(https://www.arabidopsis.org/)获得AtAGPase 蛋白序列(包括4 条大亚基序列和2 条小亚基序列)。以AtAGPase 大小亚基氨基酸序列为索引序列,在烟草数据库(https://solgenomics.net/)进行Blast P 分析,对获得的多条NtAGPase大小亚基氨基酸序列进行甄别,去除冗余序列;然后,用 CDD(https://www.ncbi.nlm.nih.gov/Structure/cdd/wrpsb.cgi) 和 SMART(http://smart.embl-heidelberg.de/)在线软件对候选NtAGPase 序列进行蛋白结构域分析,筛选鉴定出烟草NtAGPase 家族成员。

1.2 蛋白理化特性分析

利用ProtParam(http://web.expasy.org/protparam/)分析NtAGPase 编码蛋白的氨基酸组成、蛋白质分子质量、理论等电点、不稳定指数、疏水指数等理化性质;通过 DTU(https://services.healthtech.dtu.dk/)中的在线工具 TMHMM、NetPhos、SignalP 分别预测NtAGPase 的跨膜结构域、磷酸化位点、信号肽位点;利用 Plant-mPLoc(http://www.csbio.sjtu.edu.cn/bioinf/plant-multi/)预测其亚细胞定位;利用Expasy中 ProtScale 工 具(https://web.expasy.org/protscale/)分析其疏水区域。

1.3 高级结构分析

利用 SOPMA(http://metadatabase.org/wiki/SOPMA)预测NtAGPase 蛋白的二级结构;通过Phyer2(http://www.sbg.bio.ic.ac.uk/phyre2/html/page)对 NtAGPase 酶蛋白的三级结构进行同源建模。

1.4 基因结构分析

利用在线软件 GSDS 2.0(http://gsds.cbi.pku.edu.cn/)分析NtAGPase 基因序列内含子、外显子数量,并绘制基因结构图;利用MEME(http://meme-suite.org/tools/meme)分析NtAGPase 基因保守元件,设置最大元件数量为13 个,元件的最佳宽度为6~50。

1.5 启动子区域顺式作用元件预测

在烟草数据库中获得烟草NtAGPase 家族成员的启动子序列(转录起始位点上游1.5 kb),通过PlantCARE(http://bioinformatics.psb.ugent.be/webtool s/plantcare/html/)预测它们的启动子区域顺式作用元件,并通过GSDS 2.0 在线软件进行作图。

1.6 多序列比对及系统进化分析

表1 烟草、拟南芥和马铃薯AGPase 家族成员信息

利用Clustal W 软件对拟南芥和烟草AGPase蛋白序列进行多序列比对,参数选为默认值;利用MEGA 6.0 软件,采用邻接法(Neighbor-Joining,N-J)对烟草NtAGPase 和其他已知物种的AGPase构建系统发育树(表1),其中,校验参数BootStrap设为1 000 次,其他参数均为默认值。

2 结果与分析

2.1 烟草NtAGPase 基因家族成员鉴定

以AtAGPase 大小亚基蛋白序列为探针,通过在烟草数据库中进行Blast P 分析,得到多条烟草NtAGPase 大小亚基蛋白序列;通过CDD 和SMART分析,将同时含有NTP-transferase 和PbH1 结构域的氨基酸序列筛选出来,去除冗余后,共获得3 条NtAGPase 大亚基蛋白序列和1 条NtAGPase 小亚基蛋白序列,分别命名为NtLSU1(XP_016509038.1)、NtLSU2(XP_016491048.1)、NtLSU3(XP_016497751.1)和 NtSSU(NP_001312588.1)。

2.2 NtAGPase 酶蛋白理化特性分析

ProtParam 分析结果显示(表 2),NtLSUs 编码蛋白的长度范围在519(NtLSU3)~529 个氨基酸(NtLSU2),分子质量介于 57.03(NtLSU3)~58.43 ku(NtLSU2)。SSU 编码蛋白的长度为520 个氨基酸,分子质量为57.38 ku。NtLSUs 的等电点均大于7,呈弱碱性;而NtSSU 等电点略小于7,呈弱酸性。NtLSUs 蛋白的不稳定性指数均小于40,属于稳定蛋白;而NtSSU 蛋白的不稳定指数为43.67(大于40),属于不稳定蛋白。NtLSUs 和 NtSSU 的平均亲水值介于 -0.246(NtLSU1)~-0.122(NtLSU3),均属于亲水性蛋白。

分别利用 Plant-mPLoc、ProtScale、DTU 在线软件对NtAGPase 大小亚基蛋白进行亚细胞定位、疏水区域、跨膜结构、磷酸化位点及信号肽的预测,结果表明,NtLSUs 和NtSSU 蛋白均定位于叶绿体上,说明NtLSUs 和NtSSU 分别属于质体型大亚基和质体型小亚基。NtLSUs 和NtSSU 蛋白均无跨膜区,属于亲水性蛋白,这与Protparam 软件预测结果一致。3 个NtLSUs 之间的理化性质基本一致,但是与NtSSU 理化性质不同。

表2 烟草NtAGPase 家族成员蛋白理化特性

2.3 NtAGPase 酶蛋白二级结构预测

SOPMA 软件预测结果显示,NtLSUs 和NtSSU蛋白的二级结构都只含有3 种结构,分别是α- 螺旋、延伸链和无规则卷曲,不包括β- 转角;其中,无规则卷曲的比例最高,范围在46.24%(NtLSU3)~54.25%(NtLSU2);其次是α- 螺旋,比例范围在25.15%(NtLSU2)~33.33%(NtLSU3);延伸链占比最少,比例在 17.31%(NtSSU)~21.97%(NtLSU1)(图 1)。

2.4 NtAGPase 酶蛋白三级结构预测

利用Phyer2 在线工具对烟草NtAGPase 酶蛋白进行了三级结构预测,结果以c1yp3C 膜结构蛋白为模板建模(图2)。

从图2 可以看出,烟草NtAGPase 酶蛋白是一个由不同亚基组成的异源四聚体,其与模板的相似性为84%,而拟南芥AtAGPase 酶蛋白与模板的相似性为82%。也就是说,NtAGPase 酶蛋白结构与AtAGPase 酶蛋白结构极为相似,推测它们在植物体内发挥着类似功能。

2.5 NtAGPase 基因结构和蛋白结构域分析

从NtLSUs 和NtSSU 的基因结构来看(图3),NtAGPase 大小亚基均由外显子、内含子和UTR 组成。NtLSU1 和 NtLSU2 均含有 14 个外显子和 13 个内含子;NtLSU3 含有15 个外显子和14 个内含子。然而,NtSSU 仅含有9 个外显子和8 个内含子,明显少于NtLSUs。

通过MEME 软件预测出烟草NtAGPase 蛋白含有13 个蛋白保守元件(图4)。

2.6 NtAGPase 基因启动子区域顺式作用元件分析

表3 烟草NtAGPase 基因启动子顺式作用元件

NtLSUs 和NtSSU 启动子中均富含TATA-box、CAAT-box和多种光响应元件。其中,NtLSU1 中特有干旱胁迫响应元件(MBS),其在干旱条件下可能发挥一定的作用;NtLSU2 和NtLSU3 中均含有脱落酸响应元件(ABRE)和抗氧化响应元件(ARE)。NtSSU中含有较多与激素相关的反应元件,如乙烯响应元件(ERE)和茉莉酸响应元件(CGTCA-motif)。除NtLSU3 外,其他亚基基因都含有低温胁迫响应元件(LTR),推测烟草NtAGPase 基因在响应低温胁迫过程中行使功能。此外,NtLSUs 和NtSSU 启动子中还含有多种与激素反应相关、逆境反应相关的响应元件,如生长素响应元件(TGA)、赤霉素响应元件(GARE-motif)、水杨酸响应元件(TCA)以及机械表示伤害响应元件(WUN-motif)、胁迫防御响应元件(TC-rich repeats)(表 3)。说明 NtAGPase 催化的酶反应可能参与烟草多种生理活动以及对环境的响应等。

2.7 NtAGPase 酶蛋白多序列比对

利用 Clustal W 软件对 NtLSUs 和 NtSSU 分别进行多序列比对分析。选取拟南芥AtAPL 蛋白作为对照,在烟草NtLSUs 蛋白中发现4 个功能结构域(图 5),分别是 AGPase signature 1、AGPase signature 2、AGPase signature 3 和葡萄糖腺苷转移酶功能区(Glucose-1-phosphate adenylytransferase region)。烟草NtSSU 蛋白也按照同样的方法进行分析,结果显示,烟草NtSSU 蛋白序列与拟南芥AtAPS1 蛋白序列同源性高达87.50%,并且烟草NtSSU 蛋白保守结构域与拟南芥AtAPS1 类似,均包括5 个功能结构域,分别是AGPase signature 1、AGPase signature 2、AGPase signature 3、Glyco-tranf-GTA-type 超家族区域和葡萄糖腺苷转移酶功能区(Glucose-1-phosphate adenylytransferase region)(图 6)。

2.8 系统进化分析

为了研究AGPase 蛋白家族之间的进化关系,本研究使用MEGA 6.0 软件对来自拟南芥、烟草、马铃薯AGPase 蛋白进行了进化分析,生成了一个邻联进化树如图7 所示,根据不同亚基类型,NtAGPase酶蛋白家族明显被分为2 组(大亚基组和小亚基组),其中,NtLSUs(NtLSU1、NtLSU2 和 NtLSU3)、AtAPLs(AtAPL1、AtAPL2、AtAPL3 和 AtAPL4) 和 StLSUs(StLSU1、StLSU2 和StLSU3)被归为大亚基组;NtSSU、AtAPSs(AtAPS1、AtAPS2)和 StSSUs(StSSU1、StSSU2)一起归为小亚基组。

3 结论与讨论

有研究发现,淀粉是烟草中主要的碳水化合物,在成熟的烟叶中淀粉含量高达40%[14],但过多的淀粉会严重影响烟叶的外观和烟草制成品的品质[1]。已有大量研究表明,AGPase 活性大小决定着淀粉的合成速率及合成量。例如,在木薯(Manihot esculenta Crantz)中异位表达大肠杆菌glgC 基因,可使木薯块茎中淀粉含量明显增加[15]。而在马铃薯(Solanum tuberosum)中反义表达StAGPase 会导致马铃薯块茎中淀粉水平显著降低,同时降低直链淀粉与支链淀粉的比率[16]。因此,深入探究烟草NtAGPase基因的调控机制,并通过基因工程手段调节烟叶淀粉含量,对提高烟叶品质具有重要意义。

在高等植物中,AGPase 是一个由大亚基和小亚基构成的异源四聚体,并且在不同的植物中编码AGPase 大小亚基的基因数目不同[10-13]。本研究以拟南芥AtAGPase 蛋白为探针,通过Blast P 和SMART分析得到了编码烟草NtAGPase 酶蛋白的基因序列;通过功能结构域分析,筛选出含有NTP-transferase 和PbH1 结构域的3 个大亚基的编码基因(NtLSU1、NtLSU2、NtLSU3)和 1 个小亚基的编码基因(NtSSU)。

NtAGPase 大小亚基编码蛋白长度和分子质量相近,但在部分理化性质上有所差异。NtLSUs 的理论等电点值均大于7,偏碱性,其不稳定系数均小于40,属于稳定蛋白;而NtSSU 的理论等电点值小于7,偏酸性,其不稳定系数大于40,属于不稳定蛋白。其中,NtAGPase 大小亚基基因的外显子数目差异较大,其中,NtLSUs 含有 14~15 个外显子,NtSSU仅含有9 个外显子,明显少于NtLSUs。这与已有研究结果一致[17]。

本研究对烟草NtAGPase 基因启动子顺式作用元件分析发现,NtAGPase 基因中含有大量的光响应 元 件 , 如 G-Box、AE-Box、GT1-motif、GA-motif等,推测其在光合作用中发挥作用或者受到光信号因子的调控。此外,NtAGPase 基因还含有多种与激素反应、逆境反应相关的响应元件,推测该基因不仅参与植物的生长发育过程,还在多种逆境反应中发挥作用,例如低温胁迫、干旱胁迫等。

本研究对烟草和拟南芥AGPase 大小亚基分别进行多序列比对,结果表明,烟草NtAGPase 家族成员之间同源性为69.48%;而烟草NtLSUs 和NtSSU序列与拟南芥AtAPLs 和AtAPSs 蛋白序列同源性分别为75.54%和87.50%。说明同一物种大小亚基的同源性低于不同物种同一亚基之间的同源性;不同物种同一亚基之间小亚基更加保守,大亚基趋于歧化[18]。此外,本研究还发现,NtAGPase 和AtAGPase大小亚基蛋白序列的差异性主要表现在N 端,推测N 端序列很可能影响着NtAGPase 酶蛋白的功能。系统进化分析结果显示,NtLSUs 和NtSSU 蛋白分别归为大亚基组和小亚基组,这与其他高等植物中AGPase 的分类一致[19-20]。有研究推测,植物体内AGPase 大小亚基基因来源于同一基因,但该基因在进化过程中,由于选择压力或最适活性需求不同而出现分离,从而产生了2 种不同的亚基[13]。此外,烟草NtAGPase 与马铃薯StAGPase 的亲缘关系明显高于其与拟南芥AtAGPase 的亲缘关系,这是因为烟草与马铃薯同属于茄科植物,进化上比较一致。

本研究鉴定获得了4 个烟草NtAGPase 家族成员,包括3 个大亚基和1 个小亚基基因;通过生物信息学技术对其基因结构和编码蛋白结构及理化特性等进行了详细分析,为后续探索烟草NtAGPase 基因功能及烟草淀粉生物合成调控机制等提供了相应的理论基础。

猜你喜欢

亚基拟南芥结构域
细菌四类胞外感觉结构域的概述
97份安徽省种植小麦品种HMW-GS组成及品质分析
胃癌中主要SWI/SNF复合物亚基突变/缺失与临床预后及肿瘤免疫反应的关系
Bx7OE及Dx5+Dy10优质亚基在小麦品质育种中的应用
UBR5突变与淋巴瘤B细胞成熟
蓝隐藻藻蓝蛋白亚基的分离及特性研究
拟南芥
口水暴露了身份
DEP结构域的功能研究进展
水稻DnaJ蛋白的生物信息学分析