参考网


莜麦AnHRGP基因的生物信息学分析

2019-11-28 10:11:11 江苏农业科学 2019年18期

刘文英 田宏先 王润梅 周凤 刘建霞 刘丽珍

摘要:以AnHRGP基因编码的富含羟基脯氨酸糖蛋白(AnHRGP)为研究对象,用生物信息学方法对该蛋白质的一级结构及理化性质、跨膜区、亲疏水性、二级结构及功能位点、三级结构特点等进行分析。应用ExPASy在线分析AnHRGP的氨基酸组成及理化性质,通过SOMPA在线预测AnHRGP的二级结构,应用TMHMM Server v. 2.0对AnHRGP进行跨膜结构分析,采用Phyre2对蛋白质的三级结构进行建模。结果表明,该蛋白基因的开放阅读框(openreadingframe,简称ORF)可以编码202个氨基酸,是一种无信号肽、无跨膜结构、无卷曲螺旋结构、定位于叶绿体和线粒体基质空间的不溶性疏水蛋白。无规则卷曲为AnHRGP中成分最多的二级结构。通过Phyre2工具模拟出了该蛋白质的三级结构模型。

关键词:莜麦;富含羟基脯氨酸糖蛋白;生物信息学方法;基因序列;氨基酸序列;微观分析;立体结构;基因功能

中图分类号: S512.601文献标志码: A

文章编号:1002-1302(2019)18-0075-04

收稿日期:2018-06-09

基金项目:山西省基础研究项目(编号:2015021149);山西省高校科技创新项目(编号:2013142);山西省大同市农业重点研究项目(编号:2017082)。

作者简介:刘文英(1981—),女,山西大同人,博士,副教授,主要从事植物分子生物学研究。E-mail:[email protected]

富含羟基脯氨酸糖蛋白(hydroxyproline-rich glycoprotein,简称HRGP)大约由300个氨基酸残基组成,羟脯氨酸是其蛋白质氨基酸的主要成分,此外其还含有大量的丝氨酸等[1]。富含羟基脯氨酸糖蛋白是一种重要的结构蛋白,在许多植物细胞壁中已被发现,聚集为伸展蛋白的形态[2]。莜麦在我国主要分布于华北、西北等高寒地区[3],这些地区的温度很容易降低到普通植物难以承受的范围,当温度发生剧烈变化或达到一定程度时,周围环境所发生的变化会对莜麦造成强烈的损伤,而由HRGP聚集而成的伸展蛋白的结构特性可为其抵抗逆变功能提供帮助,该蛋白是对植物起保护作用的关键因素,能增强植物抗机械损伤、抗寒、抗病变的能力[4]。

莜麦为禾本科燕麦属植物,具有与燕麦极度相似的生长要求。在莜麦的生长过程中,HRGP发挥着重要作用。HRGP会定位在细胞组织特定位点,从而发挥一定的功能。目前研究显示,小麦和燕麦是HRGP基因表达较为广泛的2类单子叶植物[5]。本研究应用生物信息学方法并对AnHRGP(莜麦HRGP)基因序列进行微观分析,并对AnHRGP肽链中的氨基酸序列及立体结构等进行预测分析,以期为更深层次研究AnHRGP的功能奠定基础。

1 材料与方法

AnHRGP基因序列如图1所示。通过NCBI-ORF、Protparam、SOMPA、Phyre2等在线分析网站(表1),预测分析AnHRGP基因的一级结构及理化性质、亚细胞定位、二级结构、超二级结构及三级结构等。本研究于2017年在山西大同大学生命科学学院实验室完成。具体分析方法:利用NCBI-ORF finder分析AnHRGP基因序列,并得到相应的蛋白质序列,应用Protparam工具分析AnHRGP的氨基酸组成及理化性质[6];利用SignalP 4.1 Server预测该蛋白质是否含有信号肽,进而确定其是否为分泌型蛋白[7];应用TMHMM Server v. 2.0对AnHRGP进行跨膜结构分析,若无跨膜螺旋结构且氨基酸序列总体在膜外则说明该蛋白质为非跨膜蛋白[8];利用PSORT对AnHRGP进行细胞内定位,測定该蛋白质在细胞中的分布[9];通过SOMPA在线预测程序对AnHRGP进行二级结构预测,并确定构成其二级结构的主要元件[10];运用PROSITE进行蛋白质功能位点分析;通过ExPASy COILS程序在线分析预测AnHRGP的卷曲螺旋域,以确定其是否具有卷曲螺旋域[11];通过CD search工具对蛋白质保守结构域进行预测;应用相应的蛋白质三级建模方法对蛋白质进行建模[12]。

2 结果与分析

2.1 AnHRGP的一级结构及理化性质分析

通过NCBI-ORF finder分析AnHRGP基因序列,得到相蛋白质氨基酸序列(图2),共包含13个可能的开放阅读框(openreadingframe,简称ORF),其中表达最为完整的ORF对应的氨基酸序列即为AnHRGP基因序列编码的蛋白质序列。运用Protparam工具分析AnHRGP的氨基酸组成及理化性质得到,AnHRGP由202个氨基酸组成(表2),其中占比例最多的是Pro(19.8%),最少的是Lys(0.5%);蛋白质分子式为C956H1 514N292O262S21,总原子数为3 045,相对分子质量为21 963.60;负电荷氨基酸残基(Asp+Glu)总数为6个,正电荷氨基酸残基(Arg+Lys)总数为25个,理论等电点(pI)为9.85,为碱性;在280 nm波长处,AnHRGP的消光系数为18 085 L/(mol·cm)(假设所有半胱氨酸均来自胱氨酸)或16 960 L/(mol·cm)(假设无半胱氨酸残基存在);不稳定系数为94.75(>40),预测为AnHRGP为不稳定蛋白;脂肪系数为55.15;总平均亲水性为0.307(>0),预测显示,AnHRGP为疏水蛋白。

2.2 AnHRGP的信号肽、跨膜结构域预测及亚细胞定位

SignalP 4.1 server是一个信号肽预测的在线软件,主要用于预测给定氨基酸中是否含有信号肽。用SignalP 4.1 server信号肽预测工具对AnHRGP进行在线预测,结果(图3)显示,原始剪切位点分值(C-score)和被结合剪切位点分值(Y-score)均为0.118,信号肽分值(S-score)为0.190,所有分值都不超过0.2,表明AnHRGP不含信号肽,属于非分泌型蛋白,并且可以推测在细胞内该蛋白不进行跨膜运输。

[5]曲 波,王 丹,周红姿. 植物体内HRGP的研究进展[J]. 生物学通报,2003,38(8):7-8.

[6]孙素荣,张 智,李素丽,等. 新疆黄精凝集素基因的克隆、序列分析和表达[J]. 生物工程学报,2008,24(3):387-394.

[7]李 鑫,侯和胜. 植物类防御素基因的预测和序列分析[J]. 植物生理学通讯,2008,44(2):229-234.

[8]王凤涛,蔺瑞明,徐世昌. 小麦3个NAC转录因子基因克隆与功能分析[J]. 基因组学与应用生物学,2010,29(4):639-645.

[9]Mitaku S,Hirokawa T,Tsuji T. Amphiphilicity index of polar amino acids as an aid in the characterization of amino acid preference at membrane-water interfaces[J]. Bioinformatics,2002,18(4):608-616.

[10]Geourjon C,Deléage G. SOPMA:significant improvements in protein secondary structure prediction by consensus prediction from multiple alignments[J]. Computer Applications in the Biosciences,1995,11(6):681-684.

[11]琚澤亮,赵桂琴,周向睿. 燕麦Actin基因片段的克隆及序列分析[J]. 甘肃农业大学学报,2016,51(3):37-42.

[12]Wang H B,Shi X D,Zhang M F,等. Bioinformatics analysisand homology modeling study of protein disulfide isomerase(mPDI) from Medicagosativa L.[J]. Agricultural Science & Technology,2009,10(5):59-64.