APP下载

基于组学数据的藜麦油脂储存蛋白的生物信息学分析

2020-12-26时小东肖含磊秦小波

江西农业学报 2020年12期
关键词:分枝油脂储存

时小东,肖含磊,秦小波

(1.成都大学 农业农村部杂粮加工重点实验室,四川 成都 610106;2.四川省自然资源科学研究院,四川 成都 610015)

藜麦(Chenopodiumquinoa)是原产于南美洲安第斯高原的一种粮食作物,是联合国粮农组织认定的唯一的单一植物即可满足人体基本营养需求的食物。同时,由于藜麦具有耐盐碱、海拔适应性强等优势,它已经被引种至我国多个高海拔地区,被认为是具有发展前景的替代作物[1-2]。藜麦籽粒营养丰富,富含高品质蛋白,且氨基酸配比均衡,能够满足人类的必需氨基酸需求,且不含有麸质[3]。此外,藜麦籽粒含有丰富的脂肪酸,其脂肪酸含量高于常见谷物。研究表明,藜麦籽粒的脂肪酸主要为亚油酸、亚麻酸和油酸等不饱和脂肪酸,含量超过80%;其脂肪酸中亚油酸与亚麻酸的比值(LA/ALA)为6.2,符合FAO/WHO的推荐值[4]。随着消费者对膳食脂肪要求的提高,与其他商业化的功能性油脂相比,藜麦具有更大的油料开发潜力。

在植物种子中油脂合成过程十分复杂,涉及多种关键基因和限速酶。在模式植物拟南芥中,油脂合成相关途径已经较为清晰,根据在细胞活动中功能的差异,可将油脂合成相关基因分为9类,涉及叶绿体中脂肪酸的合成、内膜系统的膜脂合成、油脂合成与存储、脂质信号等,确定了与油脂合成相关的基因600多个[5-6]。在油料作物大豆中,通过同源对比的方式鉴定得到与油脂合成相关的基因1100多个,这些基因和涉及通路对植物油脂含量具有重要的影响[7]。与油脂储存蛋白相关的基因在植物油脂合成中发挥着非常重要的作用[8]。研究表明,在拟南芥中油脂储存蛋白涉及基因19个,在大豆中油脂储存相关基因有22个[5,8]。通过对油脂合成中关键基因的修饰和表达调控,能够达到增加植物油脂产量的目的。

随着分子生物学和测序技术的发展,藜麦基因组测序工作已经完成,目前已经获得了高质量的藜麦参考基因组序列信息[9]。这对于藜麦关键基因的挖掘和分析,以及在分子水平上改造油脂从而提高产油量具有重要意义。基于藜麦的组学数据,我们对藜麦的油脂储存蛋白进行了鉴定和分析,并系统地分析了其理化信息、亚细胞定位、二级结构、染色体定位,以及在不同组织中的表达情况,以期为进一步研究藜麦籽粒油脂调控途径和品质改良奠定基础。

1 材料和方法

1.1 数据材料来源

通过NCBI(https://www.ncbi.nlm.nih.gov/)下载藜麦的基因组数据(ASM168347v1);大豆的基因组数据下载于JGI(https://genome.jgi.doe.gov/portal/);拟南芥的基因组数据下载于TARI(https://www.arabidopsis.org/)。根据报道[10]提取拟南芥和大豆油脂储存相关的蛋白序列。

1.2 藜麦油脂储存蛋白的挖掘

以提取的拟南芥和大豆油脂储存基因的蛋白序列作为查询序列信息,利用BLAST软件进行同源搜索[11],筛选参数为E-value<10-5。根据对比结果获得藜麦中油脂储存基因的蛋白序列和基因序列等信息。

1.3 藜麦油脂储存蛋白的基本性质分析

使用ExPaSy(https://web.expasy.org/protparam/)对筛选序列的氨基酸数目、分子量、理论等电点等信息进行预测;使用SOPMA(https://npsa-prabi.ibcp.fr/cgi-bin/)对α-螺旋、延伸链和β-转角等二级结构进行预测。分别利用ProtComp(http://linux1.softberry.com/berry.phtml?group=programs&subgroup=proloc&topic=protcompan)和SignalP 4.1(http://www.cbs.dtu.dk/services/SignalP/)对藜麦油脂储存蛋白进行亚细胞定位和信号肽分析,参数设置值为默认值。

1.4 藜麦油脂储存蛋白的基因结构和进化分析

根据公布的藜麦基因组结构数据文件,对藜麦油脂储存蛋白基因的染色体定位、内含子和外显子结构进行分析和整理。使用ClustalX 2.1对获得的氨基酸序列进行多序列对比;再利用MEGA 7.0中的邻接法(Neighbor-Joining, NJ)进行系统进化树构建,其中的bootstrap值设为1000。

1.5 藜麦油脂储存蛋白基因的表达分析

基于本课题组构建的藜麦根、茎、叶、花和种子的转录组测序数据,用FPKM值表示基因的表达量,对藜麦不同组织中油脂储存蛋白基因的表达水平进行比较。

2 结果与分析

2.1 藜麦油脂储存蛋白的鉴定

基于报道的拟南芥和大豆的油脂储存蛋白序列,通过BLASTp进行对比分析和鉴定,从藜麦的基因组数据中鉴定得到了15条油脂储存蛋白,各蛋白的氨基酸序列差异较大。利用藜麦基因组注释信息将15条藜麦油脂储存蛋白基因分别定位在染色体上,对应基因分布于9条染色体,其中分布于2号染色体和7号染色体的序列较多,各为3条;其次是染色体1号和4号,均有2条油脂储存蛋白基因分布;其余染色体上分布数目各为1条。

2.2 藜麦油脂储存蛋白的一级结构分析

利用生物信息学软件对得到的藜麦油脂储存蛋白序列进行分析,其氨基酸数目为153~675;其中氨基酸数目大于500的蛋白有4个,氨基酸数目小于200的蛋白有6个(表1)。其蛋白质分子量介于16093.50~74842.52 kDa。与大豆中油脂储存蛋白的氨基酸数目(165~1012个)和蛋白质分子量(19197.0~113732.9 kDa)相比,藜麦中跨度相对较小。理论等电点分析表明,15个藜麦油脂储存蛋白的等电点介于5.7~10.1,其中6个蛋白的等电点小于7.0,表现为酸性;9个蛋白的等电点为8.5~10.1,在碱性范围内,说明藜麦种子中的油脂储存蛋白含有较多的碱性氨基酸。

对藜麦油脂储存蛋白不稳定指数的分析结果(表1)表明:Cq9024、Cq9021、Cq47176等8个蛋白的不稳定指数小于40.0,为稳定蛋白;其余7个蛋白的不稳定指数大于40.0,为不稳定蛋白。说明藜麦油脂储存蛋白的稳定性和不稳定性数目相当。

对藜麦油脂储存蛋白的脂肪指数和疏水性进行分析,结果表明:脂肪指数大于100的蛋白数量为2个;13个藜麦油脂储存蛋白的脂肪指数小于100(表1),说明绝大多数藜麦油脂储存蛋白表现为疏水性。

表1 藜麦油脂储存蛋白的一级结构

2.3 藜麦油脂储存蛋白的二级结构预测

研究表明,蛋白质的二级结构是衡量蛋白质稳定性的重要因素,α-螺旋和β-转角结构具有高度的稳定性,为蛋白质的有序结构;而无规则卷曲为蛋白质的无序结构。对15个藜麦油脂储存蛋白的二级结构进行预测,结果表明:藜麦油脂储存蛋白的二级结构以无规则卷曲和α-螺旋为主,β-转角最少,说明藜麦中油脂储存蛋白的二级结构整体表现为稳定(表2)。

对蛋白序列进行信号肽分析,在藜麦油脂储存蛋白中未发现信号肽序列。利用在线工具对15个藜麦油脂存储蛋白进行亚细胞定位分析,发现9个藜麦油脂储存蛋白定位于胞外;定位于内质网和质膜的蛋白数目均为3个(表2),表明藜麦油脂储存蛋白基因可以在不同的细胞结构中发挥功能。

表2 藜麦油脂储存蛋白的二级结构预测和亚细胞定位结果

2.4 藜麦油脂储存蛋白的进化树分析

基于氨基酸序列,对藜麦油脂储存蛋白基因进行系统进化树构建,结果如图1所示。根据进化树的分枝情况,可以将藜麦油脂储存蛋白基因分为6个分枝:第一类分枝含有的基因数目最多(5个),包含Cq19333、Cq41585、Cq12793、Cq47176和Cq58234;其次是第五类分枝,含有3个基因,分别为Cq26888、Cq56385、Cq31514;第二类分枝含有的基因数目最少,仅含有Cq26935;其余分枝的基因数量均为2个,其中第三类分枝包含Cq3546、Cq39827,第四类分枝包括Cq9024、Cq9021,第六类分枝包括Cq1102、Cq37552。与其他分枝相比,第二类分枝较长,表明Cq26935基因发生较早,其可能经历了较为复杂的进化进程。同时,各分枝基因具有相似的基因结构和特征,例如每个分枝基因编码蛋白的亚细胞定位均相同,且具有类似的二级结构。

图1 藜麦油脂储存蛋白基因的系统进化树

2.5 藜麦油脂储存蛋白基因的表达分析

基于藜麦根、茎、叶、花和种子的转录组测序数据,获得了15个油脂储存蛋白基因的FPKM值。结果表明:15个油脂蛋白基因在根、茎、叶和花中的表达聚类在一起;在种子组织中的表达单独聚类(图2)。结合系统进化树来看,藜麦油脂储存蛋白基因的表达情况与进化具有一定的相似性。第一分枝和第三分枝的7个基因表达模式相似,在种子中的表达量均明显上调。其中,Cq47176在种子中特异表达,在其他组织中均无表达;Cq12793和Cq3546在根、茎和叶中无表达,在花和种子中表达,且在种子中的表达量显著高于在花中的表达量,推测这2个基因在重要生物学作用的发挥中具有一定的关联性。

图2 藜麦种子中油脂储存蛋白基因的表达水平

3 讨论

随着测序技术和生物信息学方法的不断发展,分子生物学数据呈现出爆炸式的增长,如何对生物学数据进行深入分析和应用成为当前生物学研究的热点之一。研究表明,藜麦为异源四倍体植物,由祖源的A和B两个二倍体品种杂交而来,其质量性状易表现出双染色体遗传现象[12]。Jarvis等应用基因组测序的方法估计藜麦的重组发生在330万~630万年前,并且其可能分别在高原和沿海环境被独立驯化[9]。本文的系统分析表明,15个藜麦油脂蛋白被分为6个分枝,第一分枝和第二分枝成员最多,第三分枝和第四分枝成员较少。每个分枝的基因均具有相似的结构和定位结构,表明其在功能上存在相似性或功能冗余。第一分枝成员的枝长较长,说明这些基因发生较早,可能在驯化中经历了复杂的进化。

藜麦籽粒中脂肪含量是玉米的两倍,且含有丰富的必需脂肪酸,已经被应用在保健产品、面包营养添加剂、高端化妆品等产品中,因此藜麦是具有潜力价值的作物[13]。石振兴等[14]对国内、玻利维亚、美国、秘鲁等国内外60份藜麦籽粒的品质进行了分析,结果表明其脂肪酸方面的变异范围较小,这可能与藜麦油脂相关基因的多样性较低有关。油脂合成相关基因是一个重要的家族,涉及多种功能基因和途径;油脂储存相关的基因虽然数量较少,却发挥着重要的作用[15]。本研究的同源对比分析得到了15个藜麦油脂储存蛋白基因,分布于9条染色体上。对藜麦油脂储存蛋白序列的分析表明,与大豆油脂储存蛋白相比,15个基因的蛋白序列氨基酸数目、分子量等差异较小,可能与藜麦在进化过程中片段的丢失和保留机制有一定的相关性。

与大豆相似,藜麦油脂储存蛋白的二级结构主要为无规则卷曲和α-螺旋,且主要定位于内质网、胞外和质膜,均无信号肽位点。虽然藜麦和大豆在油脂储存蛋白的氨基酸数目等方面存在差异,但二级结构和亚细胞定位等方面具有相似性,这可能与其功能的发挥具有相关性。同时,13个藜麦油脂储存蛋白的脂肪指数小于100,说明绝大多数藜麦油脂储存蛋白表现为疏水性。理论等电点分析表明,15个藜麦油脂储存蛋白的等电点介于5.7~10.1,其中9个蛋白的等电点为8.5~10.1,在碱性范围内,说明藜麦油脂储存蛋白含有较多的碱性氨基酸,这与前人的研究结果[8]一致。从不稳定指数的分析结果可知,藜麦油脂储存蛋白的稳定性和不稳定性蛋白数目基本一致,由此推测藜麦的一部分油脂储存蛋白可能受外界环境条件的刺激诱导而发生了变化。

植物种子的油脂合成过程比较复杂,涉及的关键基因和调控因子较多,这给研究带来了很大的困难。运用生物信息学的方法,从基因组水平进行整体分析,可为研究藜麦油脂合成提供参考[16]。藜麦基因组测序工作的完成为藜麦的功能基因挖掘、机理分析和品种改良提供了途径。本研究结果可为深入研究藜麦油脂合成的调控和改良等提供参考数据。

猜你喜欢

分枝油脂储存
分枝大苗建园苹果树当年如何修剪
基于地基激光雷达的栾树分形特征分析
肉鸡配用油脂饲料有啥方法
棕榈油支撑油脂板块走强,油强粕弱格局延续
一株吊兰
冬季养羊这样储存草料
兴化市油菜新品种评比试验总结
A taste of Peking duck
危险物品储存和运输安全
松鼠怎样储存食物