APP下载

昆虫几丁质酶的进化与保守性质的比较基因组学研究

2013-12-07黄海云万张勇

河北科技大学学报 2013年4期
关键词:几丁质信号肽进化树

黄海云,张 屹,万张勇

(1.河北科技大学图书馆,河北石家庄 050018;2.河北科技大学理学院,河北石家庄 050018;3.河北科技大学研究生学院,河北石家庄 050018)

昆虫几丁质酶的进化与保守性质的比较基因组学研究

黄海云1,张 屹2,万张勇3

(1.河北科技大学图书馆,河北石家庄 050018;2.河北科技大学理学院,河北石家庄 050018;3.河北科技大学研究生学院,河北石家庄 050018)

昆虫几丁质酶家族属于第18家族糖苷键水解酶,主要参与昆虫蜕皮、细胞增殖和免疫等生理过程。在7个物种基因组数据中通过BLASTP和PSI-BLAST的方法获得131条chitinase和chitinase-like的同源蛋白质,利用隐马尔科夫算法,找到了几丁质蛋白的保守模体区域。通过进化树分析,将所选的蛋白分为9组,与糖苷水解酶18催化结构域和几丁质结合结构域的特性一致。通过PAML软件计算出几丁质酶的正向选择位点,发现了豌豆蚜虫中的A.pisum xp003243674.1为一条新的几丁质酶蛋白。对深入研究昆虫几丁质酶结构与功能很有帮助。

几丁质酶;同源蛋白;进化树;模体;正向选择位点

几丁质(chitin)是N-乙酞胺基葡萄糖(GluNAc)以β-l,4糖苷键组成的线性多聚物,通常又被称为甲壳素或壳多糖。自然界的很多生物,特别是无脊椎动物、藻类或真菌等,其机体主要结构性成分为几丁质,哺乳动物体内没有几丁质[1]。昆虫的外骨骼就是由几丁质骨架构建而成,在昆虫生长发育的各个时期,几丁质的含量和分布都在发生着变化[2]。昆虫几丁质酶主要在表皮和中肠中表达,参与昆虫蜕皮过程中外表皮和围食膜几丁质结构的降解[3]。蜕皮腺中的几丁质酶可以调节昆虫在生长发育中周期性地蜕去旧表皮并合成新表皮,毒腺中的几丁质酶有助于毒腺物质在取食对象的组织中扩散。几丁质酶可以降解几丁质为低分子质量、可溶或不可溶的寡糖[4],通过破坏昆虫的几丁质,或抑制几丁质酶的活性,都可以影响昆虫的生长发育。鉴于几丁质酶在昆虫发育过程中的重要作用,通过扰乱几丁质酶的正常调控,进而破坏几丁质新陈代谢过程来防治害虫,可作为新型生物防治策略,具有极大的发展潜力[5]。几丁质酶在农业生产中有着极为重要的作用,但是对于几丁质酶蛋白的进化与保守功能域的系统研究还未见报道。另一方面,与其他物种几丁质酶家族相比,昆虫几丁质酶家族成员最多,分化也最大。有的研究者认为,这些昆虫几丁质酶家族成员都是由最初的5个几丁质酶祖先基因通过基因复制和功能分化而来的[6-8]。所以,通过对这个家族蛋白质的进化进行理论探讨对于研究其功能是有帮助的。

图1 典型的几丁质酶结构Fig.1 Typical structure of chitinase

昆虫几丁质酶基因结构的普遍特点是含有多个功能区,包括信号肽区、几丁质酶N端催化区、富含苏氨酸和丝氨酸的糖基化位点区和C端富含半胱氨酸的几丁质结合区,其中N端催化区的序列具有保守性,决定着酶的催化活性[9]。昆虫存在典型的几丁质酶结构,如图1所示,而且是具有多催化区和多结合区的结构。根据氨基酸序列的特征,几丁质酶归属第18和第19家族糖苷键水解酶,昆虫几丁质酶属于第18家族糖苷键水解酶。

1 序列的获取

2010年,MEUSEMANN用系统遗传学方法对节肢动物进行了分析[10]。本研究参考该文献对昆虫各个目的代表性物种进行了选择: 膜翅目选择意大利蜜蜂,双翅目选择冈比亚按蚊和黑腹果蝇,鞘翅目选择赤拟谷盗,半翅目选择豌豆蚜虫,鳞翅目选择家蚕,虱目选择人体虱。

把模式生物果蝇中确定的chitinase蛋白质序列作为模板,在多个数据库中查询同源序列。首先,在所选物种蛋白数据库中用BLASTP筛选出同源蛋白;然后,为了防止遗漏,又采用PSI-BLAST搜索1次(阈值设置为e-08);最后,把这2次搜索的结果与文献[7]和文献[11]的数据相结合,就得到131条蛋白质序列。数据的详细情况如表1所示。

表1 几丁质酶在所选物种中的数量

注:昆虫的物种简写说明(括号内为物种简写):Triboliumcastaneum (T.castaneum);Anopheles gambiae (A.gambiae);Drosophila melanogaster (D.melanogaster);Acyrthosiphonpisum (A.pisum);Apismellifera (A.mellifera);Bombyxmori (B.mori);Pediculushumanus (Ph.corporis)。

2 几丁质酶保守区域的研究

基于隐马尔可夫模型,将这131条几丁质酶氨基酸序列用MEME软件来计算Motif图。发现处于分值前3位高的Motif都是属于后部结合区的Motif,其他分值较低的Motif才属于中部催化区的。这说明几丁质酶的后部结合区拥有最大的保守性,而中部催化区的功能保守性远没有后部结合区的保守性大,因而其序列拥有较大的可变性。图2所示的是分值最高的Motif图,这段Motif所对应的氨基酸序列的正则表达式为W[IV][SG][YF][ED][DN][EP]D[ST]?[AIV]G.K[AV]E[FY][AV]K[ES].{0,1}K[GN]L[AG]G[IV][AM][IV][FW][DS][IL][DS][LT]DDFRG?.?C?.{0,8}G?E?.{0,2}K?[YNF]?P?[IL]?L?R?A[IV]?[KN]?。 其中:[]表示一个位置上有多个优势氨基酸;单字母则表示唯一的优势氨基酸;?表示没有显著优势的氨基酸;{}里面的数字是这个位置可能插入符号串的长度。

图2 几丁质酶基因的Motif图Fig.2 Motif figure of chitinase genes

3 几丁质酶正向选择位点的研究

选择PAML[12]来计算进化位点,它的一个重要功能就是检测基因是否受到适应性选择的压力,它用dN表示核苷酸的异义突变率,用dS表示同义突变率,然后取它们的比值dN/dS作为衡量选择压力的参数。如果比值大于1,表示该基因序列承受正选择压力;若比值等于1,则表示该序列处于中性选择压力;如果比值小于1,就表示承受的是纯化作用力。在用PAML软件进行计算时,选择了6个不同的密码子替代模型,分别是0(one)和3(discrete),1(neutral)和2(selection),7(beta)和8(beta&w)。用似然率(likelihood-ratio)检测来比较每组的2个模型。对所搜到的131条序列进行选择压力的计算,在7和8模型中,chitinase基因家族在10A,14P,19N这3个位点受到较弱的正向选择压力,因为它们的pr(w>1)分别为0.913,0.882和0.773,只有当这个概率大于0.950时才表明该位点受到较强的正向选择压力。说明这种蛋白值整体上的适应性进化强度不大,这应该来源于它特别重要且保守的功能。

4 几丁质酶的进化树及9组同源蛋白的结构功能分析

对这131条蛋白质运用MEGA5[13]中的邻接法建立进化树,并用Bootstrap自展法检验5 000次计算各个分支的可信度,得到的进化树如图3所示。

图3 几丁质酶进化树Fig.3 Chitinase evolution tree

结合用SMART在线网站预测的序列结构域和用signaIP网站预测的信号肽,根据进化树的拓扑结构,可把所选的131条昆虫几丁质酶蛋白分为9组。下面对于这9组逐一进行分析。

第1组几丁质酶所含的序列最多,进化树的分化也较大。这些蛋白主要在昆虫的中肠表达,它们N端都含有信号肽,然后是1个糖苷水解酶18结构域;除了果蝇和赤拟谷盗的cht4和cht8,冈比亚按蚊的XP_315351.4,XP_001688641.1,XP_307732.4和XP_316448.2及意大利蜜蜂的XP_397146.3含有1个ChBD2(几丁质结合2域)之外,其余都没有几丁质结合区。

第2组几丁质酶结构域的N端有1个Glyco_18催化结构域,2个几丁质结合区之间含有大量的低复杂性区域,这段序列是丝氨酸和苏氨酸富含区,而且所选每个物种都含有此类序列。其中冈比亚按蚊的XP_316142.4、意大利蜜蜂的 XP_001122144.1、家蚕的BGIBMGA009890-PA只有催化结构,并没有几丁质结合区。

第3组几丁质酶蛋白较为原始,因为它在不同昆虫中有1个基因编码,并且各个目中都存在。其氨基酸序列从N端依次是1个跨膜域或2个跨膜域,2个几丁质酶催化区和1个几丁质结合区。这2个催化区氨基酸序列很相似,功能也很相似。家蚕和人体虱的该组序列没有信号肽,其他物种N端都有信号肽。

第4组只有1个膜结合区域和1个几丁质酶催化区,每个物种都有1条序列在内,大部分没有信号肽,意大利蜜蜂的XP_395707.4比较特殊,它有1个信号肽、1个跨膜域,在它们之间竟有1个B561(细胞色素B-561 /铁还原酶跨膜结构域)结构域,氨基酸位置为56~185,其功能尚待实验研究。

第5组几丁质酶遍布7个物种中,均有1个基因编码,但是冈比亚按蚊除外。冈比亚按蚊的该基因出现复制现象,有5个基因编码,分别为AEE44123.1,AEE44124.1,AEE44125.1,AEE44126.1,AEE44127.1。氨基酸结构分布依次是信号肽(signal peptide)、1个几丁质酶糖苷水解酶18结构、1段低复杂性区域序列,是丝氨酸、苏氨酸、赖氨酸的富含区;还有1个几丁质结合区。该组基因在蛹变为成虫的发育时期起着重要作用。

第6组是分子质量较大的一组,具有多个糖苷水解酶18催化结构域和多个几丁质结合结构域。这组酶的氨基酸序列长度都非常大,通常都达到2 000~3 000个氨基酸,同时功能也十分重要。经研究发现,对于昆虫各个发育时期尤其是卵和幼虫的发育是不可缺少的。

第7组是特殊的几丁质蛋白imaginal disk growth factors(成虫器官生长因子蛋白,IDGFs),昆虫的生长因子蛋白有多个基因编码。该组基因序列的结构为N端1个信号肽,然后是1个几丁质酶催化区,并没有出现几丁质结合区结构。所有昆虫生长因子的催化区域保守序列都有1个谷氨酸残基,但是赤拟谷盗除外,它的谷氨酸残基被替换为氨酚胺。这类几丁质酶蛋白虽然含有催化区,但是却丧失了几丁质酶基因的活性,可能是由于保守序列中天冬氨酸被替换为丙氨酸造成的[14]。生长因子的功能是不可或缺的,它能使新器官形成和细胞增殖,缺少生长因子则会影响昆虫蛹向成虫的发育。然而并不是每个IDGFs都拥有此功能,比如赤拟谷盗中有2个IDGFs,实验证明只有其中1个生长因子的沉默对昆虫有影响[9]。

剩余2个组分别是endo-beta-N-acetylglucosaminidase(ENGASE)和stabilin-1interacting chitinase-like protein (SL-CLP)。ENGASE没有糖苷水解酶18结构域,并非18家族几丁质酶。在所列的7种昆虫中,只有豌豆蚜虫没有SL-CLP及SL-SLP,只有1个催化结构,且没有几丁质结合域。每种昆虫中都含有1个ENGASE。果蝇的cht12、家蚕的BGIBMGA008709-PA,BGIBMGA005691-PA,BGIBMGA006989-PA以及冈比亚按蚊7条基因(旁系同源基因)、人体虱1条基因、豌豆蚜的2条基因都不能归为以上几类,其中BGIBMGA008709-PA的结构域与其他GH18家族的成员相比,在N端存在一个PKD(polycystic kidney disease 1),氨基酸位置为37~124,此结构域在微生物的胶原酶中也有发现。

5 结 语

昆虫几丁质酶家族是一个复杂的多基因家族。所选物种所含几丁质酶都在10个以上,双翅目物种冈比亚按蚊和黑腹果蝇的几丁质酶基因数目明显多于其他物种。在已有文献中,对于昆虫几丁质酶较为系统性的研究是在赤拟谷盗中进行的[15]。在本研究的进化树中,赤拟谷盗的几丁质酶在各个组中都有出现。渐变态昆虫豌豆蚜中亦发现2个cht5的同源基因序列,其中A.pisum xp003243674.1是本研究新发现的。这些数学知识在生产中应用的成果值得进一步研究[16-17]。

/

[1] KRAMER K,MUTHUKRISHNAN S.Comprehensive molecular insect science[J].Oxford Elsevie,2005,1:111-144.

[2] KRAMER K J, MUTHUKRISHNAN S. Insect chitinases: Molecular biology and potential use as biopesticides[J].Insect Biochem Mol Biol,1997,27(11):887-900.

[3] ARAKANE Y, MUTHUKRISHNAN S. Insect chitinase and chitinase-like proteins[J]. Cell Mol Life Sci, 2010,67(2):201-216.

[4] 肖业臣, 罗晓斌, 冯佩富, 等.昆虫几丁质酶的研究进展[J].生物技术, 2003,13(1):38-39.

XIAO Yechen,LUO Xiaobin,FENG Peifu,et al. Research progress of insect chitinase[J]. Biotechnology,2003,13(1):38-39.

[5] KRAMER K J, CORPUZ L, CHOI H K, et al.Sequence of a cDNA and expression of the gene encoding epidermal and qutchitinases of manduca sexta[J].Insect Biochem Mol Bio, 1993,23(6): 691-701.

[6] FUNKHOUSER J D, ARONSON N N. Chitinase family GH18: Evolutionary insights from the genomic history of a diverse protein family[J]. BMC Evol Biol, 2007, 7(1): 96-100.

[7] ZHANG J, ZHANG X, ARAKANE Y, et al. Comparative genomic analysis of chitinase and chitinase-like genes in the african malaria mosquito(Anophelesgambiae)[J].Plos One,2000,6(5):198-199.

[8] ZHU Q S, ARAKANE Y, BANERJEE D,et al. Domain organization and phylogenetic analysis of the chitinase-like family of proteins in three species of insects[J]. Insect Biochem Mol Biol, 2008,38(4):452-466.

[9] de LAVEGA H. Chitinases are a multi-gene family in aedes ,anophe-les and drosophila[J]. Insect Molecular Biology,1998,7(3):233-239.

[10] MEUSEMANN K. Phylogenomic approach to resolve the arthropod tree of life[J]. Mol Biol Evol,2010,27(11):2 451-2 464.

[11] NAKABACHI A. Chitinase-like proteins encoded in the genome of the pea aphid, Acyrthosiphonpisum[J].Insect Molecular Biology,2010,19(sup):175-185.

[12] YANG Z H. PAML 4: Phylogenetic analysis by maximum likelihood[J]. Molecular Biology and Evolution, 2007, 24: 1 586-1 591.

[13] TAMURA K, PETERSON D, PETERSON N, et al. MEGA5: Molecular evolutionary genetics analysis using maximum likelihood, evolutionary distance, and maximum parsimony methods[J]. Molecular Biology and Evolution, 2011, 28: 2 731-2 739.

[14] ZHU Q,ARAKANEY, BEEMAN R W, et al. Characterization of recombinant chitinase-like proteins of drosophila melanogaster and triboliumcastaneum[J].Insect Biochem Mol Biol, 2008,38(4):467-477.

[15] ZHU Q S,ARAKANE Y, BANERJEE D,et al.Domain organization and phylogenetic analysis of the chitinase-like family of proteins in three species of insects[J].Insect Biochem Mol Biol,2008,38:452-466.

[16] 郝莉红,王志腾,陈 洪.基于matlabsimulink对半主动悬架的Fuzzy-PID控制仿真研究[J].河北工业科技,2013,30(1):42-46.

HAO Lihong,WANG Zhiteng,CHEN Hong.Simulation of Fuzzy-PID control of semi-active suspension based on matlabsimulink[J].Hebei Journal of Industrial Science and Technology,2013,30(1):42-46.

[17] 祁 伟,刘文芳,吕翠改,等.基于小波变换的静态图像数字水印研究[J].河北工业科技,2012,29(6):398-400.

QI Wei,LIU Wenfang,LYU Cuigai,et al.Research on digital watermark of static image nased on wavelet transform[J].Hebei Journal of Industrial Science and Technology,2012,29(6):398-400.

向本期载文的审稿专家致谢

本期《河北科技大学学报》共发表论文20篇。这些论文的发表是与有关专家的认真审读、细查资料、推敲分析、中肯评价分不开的。对此,本编辑部特向这些专家表示敬意,对他们的辛勤劳动表示感谢。本期载文的审稿专家名单如下(按姓名的汉语拼音顺序排列):

安立超 蔡建平 陈建波 陈 霞 崔海亭 樊超然 高炳军 高 凯

高 蒙 顾祝全 郭 奋 郭 欣 韩振宇 姜 瑛 李 兵 李 春

李 媛 刘成国 刘连山 刘润静 刘素贞 刘正捷 米据生 汪殿龙

王国栋 王 军 王少刚 王晓君 叶 丹 岳彦芳 翟学良 张福强

张焕祯 张明智 张 宁 赵冬梅 郑小琪 种道彤

(本刊编辑部)

Evolution and consensus exploration of insects' chitinase by comparative genomics

HUANG Haiyun1, ZHANG Yi2, WAN Zhangyong3

(1.Library, Hebei University of Science and Technology, Shijiazhuang Hebei 050018,China;2.School of Science, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China; 3.School of Graduate, Hebei University of Science and Technology, Shijiazhuang Hebei 050018, China)

Insects' chitinase family belongs to the 18th family glycosidic bond hydrolytic enzyme, mainly involved in the physiological processes of molting, cell proliferation and immunization. In this paper, from the seven species' genome data, 131 homologous chitinase and chitinase-like proteins are obtained by BLASTP and PSI-BLAST. The consensus motif sequences is extracted by HMM algorithm. Evolution tree analysis classifies these 131 proteins into 9 groups, which are consistent with the characteristics of glycoside hydrolase 18 ( Glyco_18) catalytic domain and chitin binding domain. Moreover, by PAML software, the positive selection sites for chitinase are calculated and a new chitinase A.pisum xp003243674.1 is found. This paper will be helpful in further research of chitinase structure and function.

chitinase; homologous proteins; evolution tree; motif; positive selection sites

1008-1542(2013)04-0350-05

10.7535/hbkd.2013yx04008

Q781

A

2013-03-01;

2013-04-15;责任编辑:张士莹

国家自然科学基金(11171088);河北省自然科学基金(A2011208002)

黄海云(1969-),女,内蒙古通辽人,馆员,主要从事生物信息学方面的研究。

张 屹副教授。E-mail:zhaqi1972@163.com

猜你喜欢

几丁质信号肽进化树
海洋细菌来源几丁质酶的研究进展
基于心理旋转的小学生物进化树教学实验报告
常见的进化树错误概念及其辨析*
产几丁质酶的无色杆菌ZWW8的发酵产酶及酶学性质研究
微生物几丁质酶的研究进展及应用现状
运用计算机软件预测木质部寄生属信号肽
福州2009—2014年甲型H1N1流感病毒株HA基因进化分析
艾草白粉病的病原菌鉴定
烟草野火病菌Pseudomonas syringae pv. tabaci yuexi-1信号肽预测及分析
内源信号肽DSE4介导头孢菌素C酰化酶在毕赤酵母中的分泌表达