APP下载

半夏凝集素结构预测分析

2015-05-09杨支力李东海

关键词:凝集素残基同源

高 永,杨支力,李东海,徐 涛

(浙江理工大学生命科学学院,杭州 310018)

半夏凝集素结构预测分析

高 永,杨支力,李东海,徐 涛

(浙江理工大学生命科学学院,杭州 310018)

为进一步深入了解半夏凝集素(Pinelliaternataagglutinin)已知蛋白序列的性质,采用生物信息学预测方法,对其结构进行了系统性分析。从NCBI数据库中调取半夏凝集素蛋白序列信息,利用 Expasy、SMART、CBS、SWISS-MODEL、 DNAman6.0等生物软件对凝集素蛋白的一级结构、高级结构性质进行全面分析。半夏凝集素的基本结构信息表明其属于稳定的亲水性蛋白,人工神经网络法预测其二级结构含有16个α螺旋,91个β折叠和150个随机卷曲,同源建模分析显示半夏凝集素蛋白序列与模板岩芋凝集素蛋白A链和B链的同源相似度分别达76.15%和84.55%。高级结构信息显示半夏凝集素N端存在跨膜区域和信号肽区域,并且整个蛋白序列中存在多个N-糖基化位点和蛋白激酶磷酸化位点,功能域预测表明半夏凝集素含有两个B型凝集素功能域,每个功能域均含有保守的甘露糖结合位点,并且这些结合位点多位于半夏凝集素蛋白空间构象的外部。通过对半夏凝集素结构性质的预测为进一步实验验证其生物功能和药用机理提供了有益参考。

半夏凝集素; 结构; 同源建模; 甘露糖特异性结合

0 引 言

半夏为天南星科半夏属植物,其块茎作为中药材已在我国长期使用[1]。半夏在我国分布广泛,四川、湖北、江西等地为道地产区,其除了显著的药用效果以外,还具有抗虫抑菌作用[2-3]。

半夏凝集素作为从半夏块茎中提取的蛋白组分之一,具有显著生物学功能。半夏凝集素基因已被广泛用于转基因表达[4-5],不管是植物转基因还是微生物反应器[6],表达出来的半夏凝集素产物都表现出显著的抗虫、抑菌[7]、专一性结合甘露糖和促进凝血[8]的特性。随着半夏凝集素抑癌作用的发现,当前的重点主要集中在半夏凝集素抗肿瘤的研究上[9-10]。半夏凝集素能体外凝集恶性肿瘤细胞,诱导癌细胞凋亡的现象显示出其在肿瘤治疗上的应用前景,但其更为详尽的作用机制还有待进一步研究。

本实验从研究半夏凝集素基本序列信息入手,对其结构进行了系统全面的预测分析。从NCBI数据库中调取本课题组提交的半夏凝集素蛋白序列信息,用Expasy、SMART、CBS、SWISS-MODEL、DNAman6.0等系列生物信息预测软件分析半夏凝集素一级结构、二级结构、高级结构、功能性结构位点和功能域信息,为实验验证和进一步研究其蛋白性质提供有益参考。

1 试 验

1.1 实验材料与仪器

蛋白分析网络数据库:

NCBI(National Center for Biotechnology Information)

http://www.ncbi.nlm.nih.gov/

PDB(Protein Data Bank)

http://www.rcsb.org/pdb/home/home.do

EMBL(European Molecular,Biology Laboratory)

http://www.ebi.ac.uk/

PIR(Protein Information Resource)

http://pir.georgetown.edu

UniProt

http://www.uniprot.org/

蛋白分析软件:

Expasy系列

http://www.expasy.org/

SMART系列

http://smart.embl-heidelberg.de/

CBS系列

http://genome.cbs.dtu.dk/

SWISS-MODEL

http://swissmodel.expasy.org//SWISS-MODEL.html

1.2 试验方法

1.2.1 半夏凝集素蛋白一级结构分析

从NCBI数据库中调取半夏凝集素蛋白序列(序列号AEZ35184.1)信息,用Expasy Compute pI/Mw tool、Expasy ProtScale、NCBI BlastP、DNAman6.0等工具分别对氨基酸残基的理化性质,蛋白质疏水性和多种凝集素蛋白间的同源关系进行分析。

1.2.2 半夏凝集素蛋白二级结构预测

采用GRO3、GRO4、PHD、DSC、MLRC方法分别对半夏凝集素蛋白序列进行了二级结构预测,比较这些预测方法之间的差异性,从中选择接近真实结果的预测方法。

1.2.3 半夏凝集素蛋白的三级结构同源建模

在Swiss-Model网站上采用自动模式对半夏凝集素的三维空间结构进行同源模建。

1.2.4 半夏凝集素蛋白的其他功能性结构的预测

用CBS TMHMM2.0软件分析蛋白跨膜域,用CBS SignalP 4.1 Server分析蛋白信号肽位点,用CBS TargetP 1.1 Server对蛋白的亚细胞定位进行分析,用Expasy ScanProsite 、CBS DictyOGlyc、CBS NetPhosK 等工具对蛋白的豆蔻酰化、磷酸化、糖基化、甘露糖结合位点等进行预测分析,用SMART软件分析了凝集素蛋白的功能域结构特点。

2 结果与讨论

2.1 半夏凝集素蛋白一级结构分析

蛋白质的一级结构决定了其高级结构。现在借助Expasy Compute pI/Mw tool 和Expasy ProtScale、NCBI BlastP及DNAman6.0对半夏凝集素的氨基酸残基组成和蛋白序列信息进行系统分析。

2.1.1 半夏凝集素蛋白基本理化性质分析

半夏凝集素蛋白检索号为AEZ35184.1(NCBI)或H8Y197(UniProtKB/TrEMBL),应用Expasy Compute pI/Mw tool工具得到以下基本信息。半夏凝集素蛋白序列由257个氨基酸残基组成,分子式为C1252H1968N354O370S8,相对分子质量28 156.0,理论等电点pI为7.73,负电荷残基(Asp+Glu)总数23个,正电荷残基(Arg+Lys)总数24个,不稳定系数较低,只有30.13,据此将其归类为稳定性蛋白。统计数据分别见图1和表1。

图1 氨基酸残基组分

表1 氨基酸残基特性

2.1.2 半夏凝集素的疏水性分析

用Expasy ProtScale中 Hphob./Kyte & Doolittle算法工具分析半夏凝集素疏水性和亲水性,结果如图2所示。横坐标表示氨基酸残基位点,纵坐标中正值代表疏水性,负值代表亲水性。图中第5~22位氨基酸残基存在明显疏水性,其中第9和10位氨基酸残基的疏水性均达到最大,分值为2.944。而第191位的氨基酸残基的疏水性达到最小的-2.167。根据图中蛋白氨基酸残基的相对疏水性趋势,加上空间立体条件和其他因素影响,推断这些疏水性氨基酸残基位于蛋白构象的疏水内核,而一些亲水性氨基酸残基则位于蛋白构象的亲水表面,这将从一定程度上影响半夏凝集素蛋白质在三维空间的折叠。

图2 蛋白序列疏水性预测注:正值代表疏水性,负值代表亲水性。

2.1.3 半夏凝集素序列比对与同源树分析

通过蛋白序列的比对可视化地呈现了相关比对蛋白序列间的差异,在比对结果图中可以清楚看到特定位点上氨基酸残基的变化,这为研究蛋白的同源进化和特殊位点氨基酸残基的突变提供了有益参考。

首先在NCBI中对半夏凝集素蛋白序列(AEZ35184.1)进行了BlastP分析,找到同源性匹配分值较高的凝集素蛋白序列。这里选取滴水珠凝集素(AGV40778.1)、掌叶半夏凝集素(AGV40779.1)、天南星凝集素(AAP50524.1)、东北天南星凝集素(ABY91323.1)、海芋凝集素(ABC69036.1)、岩芋凝集素(ACH41914.1)作为研究对象,将它们与半夏凝集素进行分类学上的属类同源比对。经DNAman6.0软件[11]分析,序列比对结果见图3,从图3可以看到,相同位点上氨基酸残基在不同序列中有所差异。由图4同源进化关系可以看出,三叶半夏凝集素与同是半夏属的掌叶半夏凝集素的同源性为88%,其次与同是天南星科的天南星凝集素、滴水珠凝集素、东北天南星凝集素的同源性依次为86%、84%、80%,而与不是同一植物科的海芋凝集素和岩芋凝集素的比对分值相对低一些,分别为80%和79%。从这个趋势来看,同属的蛋白序列相似度最高,同科的相似度次之,既不同属也不同科的凝集素蛋白序列差异显著。

图3 凝集素蛋白序列比对注:颜色较深部分为序列完全相同部分,其他颜色较浅部分为序列不完全相同部分。

图4 凝集素序列同源进化树

2.2 半夏凝集素蛋白二级结构预测

蛋白质二级结构是蛋白序列以氢键为主要作用力按照一定的方向经盘绕、折叠而形成的空间构象。这些结构形式主要包括α螺旋,β折叠和不规则卷曲等,它们多参与蛋白质功能域的构建。

采用GRO3,GRO4,PHD,DSC,MLRC法分别对半夏凝集素蛋白序列进行二级结构预测[12],预测结果见表2和图5。综合以上几种不同方法得到的预测结果,半夏凝集素的二级结构大致是,在其前端有一段α螺旋区,接着β折叠和随机卷曲依次出现在整个蛋白结构中。

表2 二级结构预测多重比较

图5 二级结构预测多重比较注:A为GRO3法预测结果,B为GRO4法预测结果,C为PHD法预测结果,D为PHD、DSC和MLRC的拟合结果;图中最长竖线代表α螺旋,中长竖线代表β折叠,最短竖线代表随机卷曲。

2.3 半夏凝集素蛋白的三维结构同源建模

将半夏凝集素蛋白序列提交至Swiss Model,在First Approach Mode程序中搜索到具有晶体结构的同源模板岩芋凝集素[13]A链3R0E.1.A(NCBI)和岩芋凝集素B链3R0E.1.B(NCBI),它们与半夏凝集素蛋白序列的同源比例分别为76.15%和84.55%,此得分远高于同源建模相似度应在50%以上的要求。模建结果显示3R0E.1.A的109个氨基酸残基分别对应半夏凝集素蛋白中的N端域V25~G133部分,3R0E.1.B的110个氨基酸残基分别对应半夏凝集素蛋白的C端域N142~S251部分。同源模型构建及Ramachandran plot拉氏模型评价结果见图6。

从预测结果来看,半夏凝集素蛋白N端域和C端域的三维结构很相似,均成三棱柱型,每边有3~4个不等的β折叠。而在N端域和C端域的二聚体拟合结构中,它们成反向平行排列。拉氏模型评价半夏凝集素N端C端的拟合模型,得分为95.43%,即有95.43%的氨基酸残基处在空间结构的合理区域(图中空心球代表处于合理位置的氨基酸残基),只有G26,G33,G92,G105,G121,G153,G181,G185,G205,G237不在合理区域内(图中空心三角形代表处于不合理位置的氨基酸残基),这表明同源模建的半夏凝集素蛋白三维结构合理。

图6 同源模型及模型评价注:(a)为半夏凝集素蛋白N端结构域,模板为3R0E.1.A。(b)为半夏凝集素蛋白C端结构域,模板为3R0E.1.A。(c)为半夏凝集素蛋白N端与C端结构的二聚体拟合,为了区别,N端域用飘带表示,C端域用管状结构表示。(d)为二聚体拟合模型的拉氏评价图,横坐标表示Phi,纵坐标表示Psi,空心球表示氨基酸残基位于空间结构的合理区域,空心三角形表示氨基酸残基位于空间结构的不合理区域。

2.4 半夏凝集素蛋白的功能预测

2.4.1 蛋白跨膜域分析

用CBS TMHMM2.0软件对半夏凝集素蛋白序列进行跨膜域预测分析,结果如图7所示。膜内区域为第1~4位氨基酸残基,跨膜区域为第5~27位氨基酸残基,相应序列为LLLLFLPAILGLVIPRAAAAVGT,膜外区域为第28~257位氨基酸残基。

图7 跨膜结构域预测

2.4.2 蛋白信号肽分析

CBS SignalP 4.1 Server工具预测信号肽及其剪切位点。图8中C值代表蛋白前体中信号肽得分,S值代表成熟蛋白中信号肽得分,Y值是C值和S值的拟合得分。C值最大得分位点为第24位氨基酸残基,分值为0.635;Y值最大得分位点为第24位氨基酸残基,分值为0.767;S值最大得分位点为第5位氨基酸残基,得分0.979,一般认为Y拟合值最高的氨基酸残基之前的部分都属于信号肽区域,因此确定第1~23位氨基酸残基为信号肽残基,剪切位点位于A23位和A24位之间的AA-AV连接处,得分值为0.854。

图8 信号肽预测

2.4.3 蛋白的亚细胞定位

用CBS TargetP 1.1 Server分析半夏凝集素蛋白在亚细胞的定位。结果显示,半夏凝集素蛋白的叶绿体定位得分为0.010,线粒体定位得分为0.076,而胞内分泌途径得分高达0.979,这说明半夏凝集素蛋白形成后多以分泌物形式存在细胞质中,据此推断半夏凝集素蛋白属于分泌型蛋白。

2.4.4 蛋白中典型氨基酸残基的磷酸化分析

蛋白磷酸化和去磷酸化过程参与调控细胞内信号的传导。用CBS NetPhos 2.0 Server分析了蛋白序列中容易发生磷酸化的丝氨酸S,苏氨酸T,酪氨酸Y位点的磷酸化情况。图9标注了显著的磷酸化位点,其中丝氨酸S位点11个,残基位点分别为32,98,100,102,202,220,222,223,224,251,254;苏氨酸T位点2个,残基位点为80,163;酪氨酸Y位点2个,残基位点为107,229。

图9 典型磷酸化位点预测

2.4.5 蛋白豆蔻酰化,蛋白激酶磷酸化、糖基化及甘露糖特异性结合位点的分析

应用多重预测工具对蛋白序列中的特异性位点进行预测,信息总结于表3。从表3可以看出,半夏凝集素蛋白中发生豆蔻酰化和糖基化的位点较少,而发生蛋白激酶磷酸化[14]和特异性结合甘露糖的位点较多,这为半夏凝集素蛋白参与信号传导和专一性结合甘露糖提供了有利条件。

2.4.6 蛋白功能域分析

用SMART工具预测半夏凝集素的功能域,发现半夏凝集素具有典型的B型凝集素结构域特征,能专一地结合甘露糖,这一结果与凝集素蛋白同源序列比对和甘露糖结合位点预测相一致。其他经预测得到的功能域如FIST、IPT、Intergrin-B-tail、G8和DSL(结果见表4)有待进一步的实验验证来确定这些功能域在半夏凝集素蛋白中是否真的存在。

表3 半夏凝集素特异性结合位点预测

表4 蛋白功能域预测

3 结 论

本实验从NCBI数据库中调取半夏凝集素蛋白序列信息,经Expasy、SMART、CBS、SWISS-MODEL等生物信息预测软件对凝集素蛋白的一级结构、二级结构、高级结构性质进行全面分析。

基本结构信息预测表明,半夏凝集素在理化性质上属于稳定的亲水性蛋白,DNAman6.0软件对选取的半夏属和岩芋属蛋白进行序列比对,发现半夏凝集素与掌叶半夏凝集素和天南星凝集素有较高同源性,而与滴水珠凝集素、东北天南星凝集素以及海芋凝集素和岩芋凝集素的同源性依次降低。多种二级结构预测方法显示人工神经网络预测法更接近半夏凝集素的真实折叠情况,该方法预测凝集素二级结构含16个α螺旋,91个β折叠和150个随机卷曲。

实验在对半夏凝集素高级结构进行分析时,采用Swiss Model同源建模法构建出半夏凝集素的空间结构模型。序列比对结果显示,半夏凝集素蛋白与模板岩芋凝集素A链和B链的序列相似度分别为76.15%和84.55%,明显高于同源建模的序列同源性应大于50%的要求。用拉氏法评估构建出的半夏凝集素空间模型,其与模板岩芋凝集素的A链和B链晶体结构的正确匹配率分别为93.51%和93.57%,而半夏凝集素N端和C端的二聚体拟合结构模型的正确匹配率高达95.43%,由此可知构建出的半夏凝集素的模型具有很高的准确性,可以用于后续模拟分子对接和药物靶点虚拟筛选试验。

另外经功能性结构预测软件分析,半夏凝集素N端存在一个含有23个氨基酸残基的跨膜区域,而该区域也是半夏凝集素蛋白的信号肽所在区域。整个蛋白序列中存在多个N-糖基化位点和蛋白激酶磷酸化位点。功能域预测表明半夏凝集素含有两个B型凝集素功能域,每个功能域中都含有甘露糖结合位点,它们多裸露于蛋白空间构象的外部,这为半夏凝集素蛋白与甘露糖或甘露糖复合物的结合提供了有利条件。

本文通过对半夏凝集素的结构性质的系统性预测分析,为进一步实验验证其生物功能和药用机理提供有益参考。

[1] 徐小超,罗永挺,刘 超,等.单子叶甘露糖结合凝集素的结构及生物活性[J].天然产物研究与开发,2007,19(2): 529-534.

[2] You S,Han Z,Zhou X.Progresses of the research on Pinellia protein[J].Sci-Tech Inform Develop Econom,2006,16(16): 165-167.

[3] Hamid R,Masood A,Wani I H,et al.Lectins: proteins with diverse applications[J].Journal of Applied Pharmaceutical Science,2013,3(4): 93-103.

[4] Lin J,Yao J,Zhou X,et al.Expression and purification of a novel mannose-binding lectin from Pinellia ternata[J].Molecular Biotechnology,2003,25(3): 215-221.

[5] Yao J,Pang Y,Qi H,et al.Transgenic tobacco expressing Pinellia ternata agglutinin confers enhanced resistance to aphids[J].Transgenic Research,2003,12(6): 715-722.

[6] Ling L J,Yang Y Z,Bi Y R.Expression and characterization of two domains of Pinellia ternata agglutinin (PTA),a plant agglutinin from Pinellia ternata with antifungal activity[J].World Journal of Microbiology and Biotechnology,2010,26(3): 545-554.

[7] 林 玲.石半夏凝集素基因的克隆及甘露糖特异结合凝集素的抗真菌研究[D].上海: 复旦大学,2007.

[8] Zhou W,Huang Y,Xu S,et al.Prokaryotic expression and bioactivity analysis of N-terminus domain of Pinellia ternata agglutinin using alkaline phosphatase signal peptide[J].Protein Expression and Purification,2013,89(1): 84-91.

[9] Zhou W,Gao Y,Xu S,et al.Purification of a mannose-binding lectin Pinellia ternata agglutinin and its induction of apoptosis in Bel-7404 cells[J].Protein Expression and Purification,2014,93(1): 11-17.

[10] 刘学锋,吕正兵,汪 波,等.pPIC3.5K/Thanatin-(G8S2)-PPA毕赤酵母表达载体的构建和表达[J].浙江理工大学学报,2012,29(6): 847-851.

[11] 张正英.半夏凝集素基因的克隆与氨基酸序列初步分析[J].中草药,2012,43(9): 1818-1823.

[12] 赵 静,彭正松,杨在君,等.半夏属植物凝集素基因片段克隆与序列分析[J].西华师范大学学报,2011,32(1): 7-11.

[13] Shetty K N,Bhat G G,Inamdar S R,et al.Crystal structure of a β-prism II lectin from Remusatia vivipara[J].Glycobiology,2012,22(1): 56-69.

[14] 邓克勤.植物凝集素类受体蛋白激酶 LecRK-b2的生物信息学分析及基因功能研究[D].长沙: 湖南大学,2009.

(责任编辑:许惠儿)

Prediction Analysis ofPinelliaTernataAgglutininStructure

GAOYong,YANGZhi-li,LIDong-hai,XUTao

(School of Life Science,Zhejiang Sci-Tech University,Hangzhou 310018,China)

To further understand the properties of known protein sequence ofPinelliaternataagglutinin,bioinformatics prediction method was used to carry out a systematic analysis of its structure.Protein sequence information ofPinelliaternataagglutininwas retrieved from NCBI database.Expasy,SMART,CBS,SWISS-MODEL,DNAman6.0 and other bioinformatics prediction software were applied to overall analyze primary structure and senior structure of agglutinin protein.Basic structure information ofPinelliaternataagglutininindicates it belongs to stable hydrophilic protein.Artificial neural network method was used to predict its secondary structure contained 16 α-helices,91 β-strands and 150 random coils.Homologous modeling analysis indicates that homologous similarity between protein sequence ofPinelliaternataagglutininandRemusatiaViviparalectin’ Chain A & Chain B reaches 76.15% and 84.55% respectively.The advanced structure information reveals that transmembrane region and signal peptide region exist in N-terminal ofPinelliaternataagglutinin,and multiple N-glycosylation sites and protein kinase phosphorylation sites exist in the whole protein sequence.Functional domain prediction showsPinelliaternataagglutinincontains two B-type lectin domains,and each domain contains conserved mannose binding sites.Most of these protein binding sites are located outside of the space configuration ofPinelliaternataagglutinin.Prediction of structure nature ofPinelliaternataagglutininprovides useful reference for further experimental verification of its biological function and medicinal mechanism.

Pinelliatenataagglutinin; structure; homologous modeling; mannose-specific binding

1673-3851 (2015) 02-0269-07

2014-07-28

国家自然科学基金项目(30772712)

高 永(1986-),男,安徽阜阳人,硕士研究生,主要从事分子遗传学与天然产物化学方面的研究。

徐 涛,E-mail:xutao1998cn@163.com

Q51

A

猜你喜欢

凝集素残基同源
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于“乙癸同源”理论辨治股骨头缺血性坏死
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
大型真菌凝集素的结构、糖特异性以及其在免疫调节中的研究进展*
鱼类凝集素概述
凝集素的结构特征及其生物技术应用进展
以同源词看《诗经》的训释三则
水介导的通讯路径对脂肪酶热稳定性的影响
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
“铤”有“直”义的词源学解释——兼说/直/义的同源词族