APP下载

石榴查尔酮异构酶生物信息学分析

2022-01-08陈川凯迪日耶玉苏普

食品研究与开发 2021年24期
关键词:信号肽黄酮类石榴

陈川,凯迪日耶·玉苏普,2*

(1.喀什大学生命与地理科学学院,新疆 喀什 844006;2.新疆帕米尔高原生物资源与生态重点实验室,新疆 喀什 844006)

黄酮类化合物是一类广泛存在于植物体内的次生代谢产物,研究表明黄酮类化合物参与光合作用、呼吸作用、生长发育以及植物对各种胁迫的防御等多种生理生化过程[1]。此外,黄酮类化合物具有多种药理活性,在人类健康和饮食中也发挥着重要作用[2]。查尔酮异构酶(chalcone isomerase,CHI,EC5.5.1.6.)是类黄酮生物合成关键酶,催化查尔酮转化为黄烷酮而形成不同类型的黄酮类化合物[3]。迄今为止,已经从许多不同的植物中克隆了许多CHI基因,包括大豆、玉米、小麦、苜蓿、花生、胡芦巴、康乃馨和银杏等[4-11]。

石榴是石榴科(Punicaceae)石榴属(Punica L.)植物,是一种古老的果树,原产于伊朗、阿富汗及印度西北部地区[12]。研究表明,石榴具有抗氧化、抗癌、抗炎等特点,可以有效预防和治疗癌症及其他慢性感染性疾病[13-14]。从石榴中已分离出的黄酮类化合物有黄酮、黄酮醇、花色素、黄烷-3-醇类等[15]。目前关于石榴黄酮类化合物的研究主要集中在黄酮类化合物的分离、纯化以及药理作用等研究方面,关于黄酮类化合物合成相关基因的研究较少,石榴CHI基因生物信息学方面的分析鲜有报道,对其生物学功能未深入了解[16-17]。鉴于此,本研究以石榴CHI基因为研究对象,利用生物信息学的方法,对其理化性质、跨膜区段预测、疏水作用力、信号肽预测、翻译后修饰、亚细胞定位、蛋白质二级结构预测和三级结构预测等进行分析,为进一步研究石榴查尔酮异构酶基因提供一定的参考。

1 材料与方法

1.1 石榴CHI序列

从美国国立生物技术信息中心(national center of biotechnology information,NCBI)数据库中查询已注册的石榴CHI(KU058887)的核苷酸序列及氨基酸序列。

1.2 方法

生物信息学分析工具如表1所示。

表1 生物信息学分析工具Table 1 Bioinformatic analysis tools

利用表1中工具分析了石榴CHI的理化性质、亲水性/疏水性、信号肽、跨膜区、亚细胞定位、保守结构域、翻译后修饰、二级结构预测以及三级结构预测。

2 结果与分析

2.1 对石榴CHI理化性质分析

使用Expasy提供的在线Protparam软件对石榴CHI基因所编码蛋白质的理化性质进行分析。结果表明,该基因全长1 075 bp,完整开放阅读框为690 bp,可以编码230个氨基酸。CHI原子总数为3 550,分子总质量为25 kDa,总分子式为C1127H1789N287O340。其中占比最高残基为Glu(10.4%),占比最低残基为Trp(0.9%)。正电荷残基总数为28(Arg+Lys),负电荷残基总数为30(Asp+Glu),理论等电点为5.71,推断它为酸性蛋白质。不稳定系数结果分析表明,石榴CHI不稳定系数(44.60)数值较高,是一种不稳定蛋白质。亲水性分析平均值结果分析表明,石榴CHI亲水性平均值(-0.131)较低,并且脂肪系数(81.43)小于 100,推测为亲水性蛋白。

2.2 石榴CHI亲水性/疏水性分析

氨基酸的极性对蛋白质折叠形成二级结构及以上的结构域和功能域有重要的影响。通过Protscale预测法分析对石榴CHI基因所编码蛋白的亲水性/疏水性,分析结果如图1所示。

图1 石榴CHI的亲水性/疏水性分析(Kety and Doolittle算法)Fig.1 Hydrophlicity/hydrophobicity analysis of CHI in pomegranate(Kety and Doolittle algorithm)

从图1得出波浪线的正值和负值来确定疏水和亲水性,结果表明,CHI基因所编码蛋白质在第56位氨基酸峰值最大,为1.733,表明该区域为高疏水性区域,而在第226位氨基酸峰值最小,为-2.133,表明该区域为高亲水性区域,可以推测该蛋白为亲水蛋白质,这与理化性质分析结果一致。

2.3 石榴CHI跨膜区预测分析

使用在线软件TMHMM预测对石榴CHI基因所编码蛋白质跨膜区预测分析。跨膜结构域预测结果如图2所示。

图2 石榴CHI跨膜区预测(隐马尔可夫模型)Fig.2 Transmembrane structure prediction of CHI in pomegranate(Hidden Markov models)

图2中3种不同的颜色线分别代表不同的位置,结果显示,该蛋白没有跨膜区,即推测石榴CHI蛋白不属于跨膜蛋白,代表着该蛋白在合成类黄酮化合物时以游离形式参与,为游离蛋白,这与亲水性/疏水性分析结果一致。

2.4 石榴CHI信号肽预测分析

信号肽指导蛋白质的跨膜转移以保障产生的蛋白质准确定向运输。使用SignalP4.0在线分析工具基于神经网络算法对石榴CHI基因所编码蛋白质进行信号肽预测分析,预测结果如图3所示。

图3 石榴CHI信号肽预测Fig.3 Signal peptide prediction of CHI in pomegranate

图3中C值代表剪切位点的可能性,用桃红色线表示可能性的大小。若该点属于剪切位点,那么该处的C值明显增高,红色线较长。S值代表序列中氨基酸残基是信号肽的概率,用绿色的先表示概率的大小,若绿色线越高,说明该部分的氨基酸残基很可能就是信号肽。S值高说明此处是信号肽的一部分;S值低说明此处是成熟蛋白质的一部分。Y值是C值和S值结合派生出的值,用蓝色线表示。剪切位点出现在S值最陡的坡和C值明显增大的地方。结果显示,石榴CHI蛋白没有信号肽,这与跨膜区预测的结果一致。

2.5 石榴CHI亚细胞定位分析

亚细胞定位是蛋白质功能研究的重要内容,细胞中mRNA通过转录翻译后形成蛋白质,然后被运送到特定的细胞器发挥作用,只有到达正确的部位才能参与细胞的各种生命活动,如果运输错误很可能影响到细胞活动甚至可能杀伤细胞。PSORT和Cell-PLoc2.0共同对石榴CHI基因所编码蛋白质进行亚细胞定位预测得出结果表明,在PSORT中石榴CHI蛋白存在于线粒体的概率为69.6%,存在于细胞核中概率为13%,存在于细胞质中可能性为8.7%,概率最低存在于液泡和过氧化物酶中,同为4.3%。而在Cell-PLoc2.0中真核生物蛋白质可能同时存在,或两个以上的亚细胞位置之间移动。综合两种预测结果可以推测该蛋白质存在于线粒体中,在核糖体合成后进入线粒体,在线粒体中以游离态发挥作用。

2.6 石榴CHI保守结构域预测分析

利用CDD在线工具分析石榴CHI氨基酸序列的功能结构域,分析结果如图4所示。

图4 石榴CHI保守结构域预测Fig.4 Conserved domain prediction of CHI in pomegranate

不同基因可能有着相同的同源序列,拥有同源序列的基因有可能存在同样的结构域、功能域,有可能有同样的功能,这与基因超家族相同。保守结构域预测就是为了寻找是否存在与目的基因同源的超家族,找到即可推测其功能。结果表明,石榴CHI氨基酸序列在第10位~第229位存在Chalcone-3查尔酮超家族保守结构域。

2.7 石榴CHI磷酸化修饰的预测与分析

利用NetPhos 3.1Sever对石榴CHI基因所编码蛋白质进行磷酸化预测分析,结果如图5所示。

图5 石榴查尔酮异构酶磷酸化修饰预测Fig.5 Phosphorylation prediction of CHI in pomegranate

图5中所标示的红色(Threshold)代表阈值,其阈值设定为0.5,超过阈值的位点易被磷酸化,值越高磷酸化概率越大;结果显示,CHI基因所编码蛋白质共有27个磷酸化位点,其中丝氨酸位点有15个(6、32、85、115、128、156、163、165、167、173、192、198、206、218、225)、苏氨酸位点 11 个(56、72、78、83、94、110、131、133、161、169、215)和酪氨酸 1 个(132)。

2.8 石榴CHI糖基化修饰的预测与分析

利用NetGlycate 1.0 Sever对石榴CHI基因所编码蛋白质进行糖基化预测,结果如图6所示。

图6 石榴查尔酮异构酶糖基化修饰预测Fig.6 Glycosylation prediction of CHI in pomegranate

在图6中,红色横线表示阈值,阈值设置为0.5,超过阈值的部分在此位置有被糖基化的可能。根据石榴CHI氨基酸序列糖基化的预测结果显示,石榴CHI蛋白序列没有被糖基化的位点。糖基化在调节蛋白质的空间结构、细胞质内和核内定位、基质内和跨膜转运、在机制和质膜溶解性等都有非常重要意义。蛋白稳定性分析结果显示该蛋白属不稳定蛋白,而糖基化有增加蛋白稳定性的作用,石榴CHI蛋白没有糖基化位点也从另一方面佐证了CHI蛋白不稳定这一结果。

2.9 石榴CHI的二级结构预测

蛋白质的二级结构指的是这个蛋白多肽链主链原子借助于氢键沿一维方向排列成具有周期性结构的构象。二级结构形成的构件主要有α-螺旋、β-折叠、β-转角、无规卷曲、延伸链等。利用目前常用的Jpred 4和Sopma对石榴CHI基因所编码蛋白质二级结构进行预测分析。石榴CHI的二级结构预测如图7所示。

图7 石榴CHI的二级结构预测Fig.7 Secondary structure prediction of CHI in pomegranate

由图7可知,CHI蛋白质二级结构中,α-螺旋占41.3%,β-折叠占10%,无规则卷曲占26.96%,延伸链占21.74%。Jpred 4和Sopma的预测结果对比表明,两种预测工具的预测结果基本一致。

2.10 石榴CHI的结构预测

2.10.1 石榴CHI的三级结构预测

蛋白质的三级结构是多肽链在二级结构或者超二级结构的基础上,进一步盘曲折叠形成的特定空间结构,蛋白质的结构决定其功能,空间结构预测对蛋白质功能研究有重大意义。利用SWISS-MODEL同源建模法预测石榴CHI的三级结构,结果如图8所示。

图8 石榴CHI三级结构(SWISS-MODEL)Fig.8 Tertiairy structure of CHI in pomegranate(SWISSMODEL)

三级结构预测得到以PDB 4 doi.1.a为模板的预测模型,相似度为65.3%。全局模型质量评估得分为0.87,明显高于其他预测模型。QMEAN得分为0.19,比其他模型更接近于0,明显高于其他模型。

通过进一步预测模型的当地质量估计(local quality estimate),得分基本在0.6以上,说明符合模型的基本要求,结果如图9所示。相似性散点分布图分析结果如图10所示。

图9 石榴CHI当地质量估计Fig.9 Local quality estimate of CHI in pomegranate

图10 石榴CHI相似性散点分布图Fig.10 Similarity scattergram of the predicted model and the homologous protein

该模型以红色五角星的值为判定标准,红五角星的值小于1,表示该模型的结构稳定,是可靠的三级结构。据此可以推断PDB 4 doi.1.a最可能为石榴CHI蛋白的最佳三级结构预测模型。而三级结构预测模型主要由α-螺旋、β-折叠、无规卷曲和延伸链组成,其中α-螺旋占比较多。三级结构预测结果与二级结构预测结果相符合。

2.10.2 模型质量评估

为了进一步验证预测模型的准确性,进行模型质量评估。在Procheck评估中,结果如图11所示。

图11 预测模型拉曼图Fig.11 Ramachandran plot of the predicted model

落在额外允许区域(图中黄色区域)和最佳允许区域(红色区域)的氨基酸残基占整个蛋白质的比例高于90%,可以认为该模型的构象符合立体化学的规则。颜色越深的区域表明构象越合理。拉曼图分析结果表明,石榴CHI蛋白的预测模型中有94.7%的氨基酸残基(177个)位于红色最佳区域,有4.8%的氨基酸残基(9个)位于黄色额外允许区域内,这表明基本上大部分的氨基酸残基都位于允许区域内,所以该模型的构象符合立体化学的规则。

在Verify 3D工具中,平均3 d~1 d分数≥0.2中有93.55%的氨基酸残留,并且低质量部分不明显,基本上都在标准线以上,这表明模型质量合格,结果如图12所示。所以,结合以上观点推断石榴CHI的三级结构模型预测结果稳定可靠。

图12 预测模型3D-1D得分散点图Fig.12 3D-1D Score scattergram of the model

3 结论与讨论

黄酮类化合物的生物合成首先通过苯丙烷途径,苯丙氨酸转化为香豆酰辅酶A、香豆酰辅酶A和丙二酰辅酶A在查尔酮合成酶的作用下合成查尔酮,查尔酮经过查尔酮异构酶(CHI)生成二氢黄酮类,二氢黄酮类是其他黄酮类化合物的前体物质,可通过不同反应途径,生成其他的黄酮类化合物[18-20]。作为抗氧化化合物,黄酮类化合物在植物的生命活动中起着至关重要的作用,例如防紫外、抗病原体、植物着色、生长素转运和花粉育性等[21-22]。黄酮类化合物对人类健康有益,包括预防心血管疾病,肥胖症和糖尿病[23-24]。因此,植物类黄酮合成相关基因的研究引起广泛关注。自1986年从豌豆中分离出第一个CHI基因以来,GenBank已登记了3 000多个CHI核苷酸序列[25]。石榴黄酮类化合物的生理活性,是近年来的研究热点,黄酮类化合物的抗自由基、抗氧化作用越来越受到人们的重视,从石榴中已分离出的黄酮类化合物有黄酮、黄酮醇、花色素、黄烷-3-醇类等[26-27]。研究发现,石榴的果汁、果皮叶、树皮都有发现黄酮类化合物[28]。

本研究以石榴CHI作为研究对象,对其进行生物信息学分析,结果表明:CHI基因全长1 075 bp,完整开放阅读框为690 bp,可以编码230个氨基酸,石榴CHI属于亲水不稳定蛋白,呈酸性,不具有信号肽,CHI不存在跨膜区域,亚细胞定位预测分析表明其最大可能定位在线粒体;有27个可能的磷酸化位点,无糖基化位点;二级结构预测结果表明,以α-螺旋和任意卷曲为主要结构,CHI氨基酸序列具有Chalcone 3查尔酮超家族保守结构域;同源建模法构建其三级结构模型,结果表明该模型与二级结构预测结果相符合,模型质量评估结果较好。本研究阐明了石榴CHI重要的分子特征,丰富了该蛋白的相关研究,为进一步研究其生物学功能提供了一定的理论基础。

猜你喜欢

信号肽黄酮类石榴
信号肽筛选优化提高耐热α-环糊精酶在枯草芽胞杆菌中的表达
石榴红了
板栗壳黄酮类成分的提取工艺研究
石榴籽
紧紧抱在一起的“石榴籽”
MS-DAIL联合MS-FINDER鉴定中药黄酮类化合物
基于外泌蛋白质组的酿酒酵母信号肽元件的分析及鉴定
石榴
全基因组预测褐环乳牛肝菌的分泌蛋白
膜荚黄芪叶黄酮类成分的研究