APP下载

鳌肢动物Wnt基因家族的全基因组与进化分析

2020-07-15梁园周雁

关键词:蝎子结构域基因组

梁园,周雁,2*

鳌肢动物基因家族的全基因组与进化分析

梁园1,周雁1,2*

1. 复旦大学生命科学学院遗传工程国家重点实验室, 上海 200438 2. 中国国家人类基因组中心上海市疾病与健康基因组学重点实验室, 上海 201203

Wnt蛋白是由基因家族编码的一类富含半胱氨酸的分泌性蛋白,在多种生物过程中扮演了至关重要的角色,如胚胎发育过程中细胞形态的分化,组织的再生,体细胞稳态维持以及免疫应答的调节。基于其功能的多样性和重要性,基因家族在多种后生动物中已经被广泛研究。但是,在节肢动物门中的螯肢动物中,仍然缺乏关于基因及蛋白的系统研究。在本研究中,从8种已有基因组或转录组资源的螯肢动物对基因家族进行了生物信息学鉴定和分析,共鉴定出87个基因家族成员。对蛋白序列结构的分析结果显示螯肢动物的Wnt蛋白包含高度保守的Wnt结构域、信号肽、跨膜区域或低复杂度区域;对基因在基因组上的位置分析表明螯肢动物的Wnt基因在基因组上的分布情况主要有两种模式,包括基因簇和基因簇,此外还有一些在基因的方向和数量上有差异的物种特异性的分布;系统发育树的构建结果显示螯肢动物中的,和亚家族有扩增现象,而和亚家族发生了丢失。本研究作为螯肢动物中第一个基因家族的全基因组研究,有望丰富螯肢动物基因组学的研究内容,为基因家族在节肢动物乃至后生动物中的和进化和功能的进一步研究提供有力的基础。

螯肢动物;基因家族; 全基因组; 进化

基因编码了一类分泌性的糖蛋白配体,长度通常在350到400个氨基酸之间,以具有23~24个保守的半胱氨酸为特征[1-4]。分子激发的信号通路参与了多种生物过程的调节,在生物体的发育过程中起着至关重要的作用,包括细胞形态的分化、体细胞形态和功能稳态的维持、胚轴形成,组织的再生和免疫应答调节[5,6]。

基因家族的起源非常古老,且具有多样性。利用已有的基因组信息对基因家族的系统发育分析结果显示,在刺胞动物和两侧对称动物的共同祖先中可能存在13个亚家族[7,8]。其中,在腔肠动物门的海葵()中发现了12个Wnt亚家族[9]。此外,在哺乳动物中还发现了基因的扩增现象,例如在人类的基因组中共鉴定出了19个基因,包括了12个亚家族[10]。然而,在节肢动物中,基因的数量存在着物种间的差异。在昆虫类的果蝇和蜜蜂的基因组中分别发现了7个基因亚家族[11],然而在甲壳纲动物蚤状溞()中则鉴定出了12个基因亚家族[12]。另外,根据基因在基因组上分布的位置关系,研究者发现基因在基因组上存在一定程度的连锁分布现象,形成了具有共线性的基因簇。在刺胞动物和两侧对称动物的共同祖先中可能有2个具有共线性的基因簇,其中一个基因簇由,-1,-6和-10连锁分布形成,另一个由和组成的另一个基因簇,但目前尚不清楚在节肢动物中是否仍然存在这一基因簇[7,11,13]。

迄今为止,在节肢动物门的螯肢动物中,仍然缺乏关于基因的全基因组的分析研究。不过,近期发表的拼接质量较高的螯肢动物的基因组数据为全面研究螯肢动物中的基因的特征提供了资源。在本研究中,我们采用生物信息学方法对螯肢动物的基因序列进行了鉴定和分析,并进一步比较了其数量、结构、基因组分布和系统发育关系,以期为基因家族在节肢动物乃至后生动物中的和进化过程和功能的进一步研究提供有力的基础。

1 材料与方法

1.1 螯肢动物基因组序列获取

我们收集了公开数据库中的7种螯肢动物的基因组和1种的转录组,包括蝎子类(),蜘蛛类(),蜱螨类(,,),鲎类(,)和海蜘蛛类(sp.)。所收集的7种螯肢动物的基因组都拼接到了scaffold或染色体水平。海蜘蛛sp.的原始RNA测序数据从NCBI SRA数据库下载得到,检索号为SRR8745912。

1.2 螯肢动物Wnt基因家族的核酸序列和氨基酸序列的获取

利用NCBI数据库中代表性的节肢动物的基因的氨基酸序列为搜索序列,来搜索螯肢动物基因组和转录组中的的基因家族成员[11,14,15],首先使用BlastP和TBlastN算法[16]搜索螯肢动物预测基因的蛋白序列和基因组序列,e值阈值选择10-5。然后将获得的序列与Pfam数据库进行比较,检测是否存在Wnt保守结构域。接下来使用PF00110这一Wnt保守结构域的隐马尔可夫文件,利用HMMER程序包[17]的HMMsearch程序在螯肢动物的预测基因中搜索是否存在其它基因。第三,使用ClustalW[18]对每个物种已搜索到的基因进行聚类,使用HMMbuild程序构建物种特异的Wnt隐马尔可夫文件,然后再一次用HMMsearch对螯肢动物的预测基因进行搜索,以获得物种特异的基因家族候选序列。鉴定得到的Wnt蛋白序列在SMART中进行比对,以鉴定信号肽和其它保守结构。鉴定出的Wnt蛋白结构域使用IBS 1.0.3软件绘制[19]。

1.3 Wnt蛋白多序列比对和系统发育分析

选择鉴定得到的2种鲎、1种蝎子、1种蜘蛛、1种螨虫、1种蜱虫、1种海蜘蛛,以及已知的1种蜜蜂、1种甲虫、1种蚜虫、1种蜈蚣、1种水蚤和1种家鼠的基因用于进行系统发育分析。首先用Clustal W[18]的BLOSUM打分矩阵进行多序列比对,然后使用PhyML 3.0[20]采用最大似然法构建系统发育树,使用SH-aLRT方法对分支的支持度进行评估。

2 结果与分析

2.1 螯肢动物Wnt基因家族的鉴定

我们在8种螯肢动物中共鉴定得到87个基因家族成员。其中,在中华鲎和美洲鲎中分别发现了15个和18个基因,在蝎子中发现了13个基因,在蜘蛛中发现了12个基因,在二斑叶螨、肩突硬蜱和天鹅绒螨虫中分别鉴定到了8、7、6个基因,在海蜘蛛中发现了8个基因。每个基因都在之后的系统发育分析中进一步进行了亚家族分类。在蝎子,蜘蛛和海蜘蛛中,鉴定到的基因的氨基酸序列均由300至400个氨基酸构成。在二斑叶螨、肩突硬蜱、和天鹅绒螨虫中,大多数鉴定得到的基因的氨基酸序列长度在300至400之间,除了在每个物种中分别鉴定出了各2个相对较短的Wnt氨基酸序列以及一个较长的Wnt16序列。在中华鲎和美洲鲎的基因组中,Wnt氨基酸序列的长度出现了更高的变异度,包含了两条较长的TtWnt1和TtWnt5c以及若干较短的Wnt蛋白序列。

2.2 螯肢动物的Wnt基因氨基酸序列的保守结构域分析

进一步对螯肢动物的基因的氨基酸序列特征和结构域进行分析,结果显示,在包括鲎、蝎子、蜘蛛和海蜘蛛在内的物种中的Wnt氨基酸序列都含有高度保守的Wnt结构域(见图1a),位于序列的C末端附近,在这些Wnt氨基酸序列的N末端还发现了多种结构序列,包括长度为20~30个氨基酸的信号肽序列、跨膜区序列或低复杂度区域。然而在3个蜱螨类物种中鉴定到的一部分基因的氨基酸序列的N末端则缺少了这些结构域(见图1b)。此外,我们对在蝎子、蜘蛛和海蜘蛛中鉴定到的长度在300至400 aa之间的基因的氨基酸序列做了多序列比对,结果显示这些序列中存在21个保守的半胱氨酸残基,呈分散分布于序列当中,这与在其它后生生物中鉴定到的基因家族的氨基酸序列的特征是一致的,这些半胱氨酸残基可能有助于这些Wnt蛋白质的正确折叠。

图 1 螯肢动物Wnt基因结构

2.3 螯肢动物的Wnt基因在基因组上的连锁分布

为了进一步探索螯肢动物基因的进化现象,我们比较了其中6个物种的基因在基因组上的分布(见图2)。结果发现除了美洲鲎以外,其它螯肢动物都保留了进化上保守的基因簇中的一部分,各自伴随着谱系特异性重排或丢失现象。中华鲎基因组中的和基因位于其3号染色体上,蝎子和蜘蛛基因组中的和基因分别位于各一条scaffold上。此外,在蝎子的另一条scaffold上还发现了的连锁分布,在肩突硬蜱的基因组中的一条scaffold上发现了相邻的基因簇。有趣的是,我们在中华鲎、美洲鲎、蝎子和蜘蛛的基因组中还发现了和基因簇,分别位于中华鲎的2条染色体上和美洲鲎的3条scaffolds上。除此之外,我们还发现了除了这两个基因簇以外的新的基因簇。在美洲鲎基因组中,有一串相邻分布的基因簇,位于1条scaffold上。在蝎子中,发现了相邻分布的的和基因簇。在蜘蛛基因组中,和被发现相邻分布于1条scaffold上。

图 2 螯肢动物Wnt基因的连锁分布

2.4 螯肢动物Wnt基因的系统发育树构建及分析

为了进一步阐明螯肢动物的基因的系统发育关系,我们利用7个螯肢动物以及其它节肢动物(包括蜈蚣、水蚤、蜜蜂、蚜虫、以及甲虫)的基因的氨基酸序列,采用最大似然法构建了基因家族的系统发生树,采用小鼠的基因序列作为外类群。系统发育树显示,螯肢动物的家族可分为11个不同的亚家族(见图3)。如在其它节肢动物中所发现的,这些螯肢动物的基因组发生了亚家族的缺失。有趣的是,螯肢动物的基因组中还另外缺失了亚家族。同时,我们仅在蝎子和肩突硬蜱中鉴定到了亚家族序列。与其它类节肢动物基因组大多拥有单拷贝的基因所不同,螯肢动物的,和亚家族基因表现出具有多拷贝的扩增现象(见图3),这可能暗示了在螯肢动物进化过程的早期出现了基因组的扩增现象。对于每个物种而言,在中华鲎、美洲鲎,蝎子和蜘蛛中分别鉴定出9、10、9、10个亚家族。在海蜘蛛基因组中,鉴定到了8个亚家族。值得注意的是,在螨虫和蜱虫中共鉴定出6个和7个亚家族,与其它螯肢动物相比,表现出了和的丢失现象,这可能与其进化速率是有关的。此外,从系统发育树上,我们发现和亚家族作为姐妹类群聚成一支,且具有分数较高的的支持度,这表明这两个亚家族可能是由于串联重复进化而来的。我们还发现,,和亚家族的基因都分为了支持度较高的两个分支(螯肢动物分支和非螯肢动物分支),这表明这些基因亚家族在螯肢动物和其它节肢动物之间的进化距离更远。

图 3 Wnt基因家族系统发生树

3 讨 论

在本研究中,我们用生物信息学方法全面鉴定了8种螯肢动物的基因家族,这可以为进一步理解基因在后生动物进化过程中的进化模式提供基础。尽管在基因组的测序和拼接过程中会有一定的错误,但是这8个高深度、高覆盖度、高拼接水平的基因组和转录组资源为我们提供了从全基因组和转录组水平鉴定基因的条件。从结构分析结果来看,在蝎子、蜘蛛和海蜘蛛中,大多数Wnt氨基酸序列都包含可识别的信号肽区域,而其它物种中的一些序列则显然缺乏该基序。考虑到信号肽的生物信息学预测算法仍是有限的,这些序列仍然有包含现有预测软件无法识别的信号肽的可能性,需要进一步的细胞生物学实验来确定这些缺乏信号肽的序列是否为非分泌型Wnt蛋白。从基因组的分布情况来看,在蝎子中我们发现了2个位于不同scaffold上的-簇,同时分别在两种鲎的不同scaffold和染色体上的发现了2个和3个-簇,这可能暗示了在鲎的祖先中曾发生了全基因组复制事件。从系统发育分析结果来看,螯肢动物的基因家族包括了11个亚家族,丢失了和亚家族,这表明螯肢动物的共同祖先可能已缺失了这两个亚家族。其它亚家族的丢失是在螯肢动物的进化过程中发生的。此外,在螨虫和蜱虫中鉴定出了数量较少的6个和7个亚家族,这可能是因为它们在整个进化过程中具有更快的进化速度从而导致了大量的基因丢失。相反,,和亚家族在鲎和蝎子中具有多个基因的拷贝,表现出了较大程度的扩张,而在其它节肢动物(如昆虫和甲壳类动物)中则表现为单拷贝。对这些螯肢动物中扩张的亚家族的具体功能研究正在进行当中。

4 结 论

在本研究中,我们对螯肢动物中的基因家族做了全基因组的生物信息学鉴定和分析,从螯肢动物的8个物种中共鉴定出了87个基因。我们进一步分析了这些基因的基因结构,发现这些基因包含高度保守的结构域、信号肽、跨膜区域或低复杂度区域。对这些基因在基因组上的分布研究发现,在螯肢动物中的基因簇主要存在两种连锁分布模式(--或-W),并且还有一些谱系特异性的基因簇。螯肢动物中的基因家族的系统发育分析结果显示了、和的扩张以及和的缺失,这些发现为进一步研究螯肢动物中的基因家族的功能提供了基础。

[1] Cadigan KM, Nusse R. Wnt signaling: a common theme in animal development [J]. Genes & development, 1997,11(24):3286-305

[2] Miller JR. The Wnts [J]. Genome Biology, 2001,3(1):1-15

[3] Clevers H, Nusse R. Wnt/β-Catenin Signaling and Disease [J]. Cell, 2012,149(6):1192-205

[4] Amerongen VR. Alternative Wnt Pathways and Receptors [J]. Cold Spring Harbor Perspectives in Biology, 2012,4(10):715-22

[5] Karner C, Wharton KA, Carroll TJ. Apical–basal polarity, Wnt signaling and vertebrate organogenesis [J]. Seminars in cell & developmental biology, 2006,17(2):214-22

[6] Gordon MD, Dionne MS, Schneider DS,WntD is a feedback inhibitor of Dorsal/NF-κB in Drosophila development and immunity [J]. Nature, 2005,437(7059):746

[7] Cho SJ, Vallès Y, Giani Jr VC,. Evolutionary dynamics of the wnt gene family: a lophotrochozoan perspective [J]. Molecular biology and evolution, 2010,27(7):1645-1658

[8] Bolognesi R, Farzana L, Fischer TD,Multiple Wnt genes are required for segmentation in the short-germ embryo of Tribolium castaneum [J]. Current Biology, 2008,18(20):1624-1629

[9] Kusserow A, Pang K, Sturm C,. Unexpected complexity of the Wnt gene family in a sea anemone [J]. Nature, 2005,433(7022):156

[10] Garriock RJ, Warkman AS, Meadows SM,Census of vertebrate Wnt genes: isolation and developmental expression of Xenopus Wnt2, Wnt3, Wnt9a, Wnt9b, Wnt10a, and Wnt16 [J]. Developmental dynamics: an official publication of the American Association of Anatomists, 2007,236(5):1249-1258

[11] Bolognesi R, Beermann A, Farzana L,. Tribolium Wnts: evidence for a larger repertoire in insects with overlapping expression patterns that suggest multiple redundant functions in embryogenesis [J]. Development genes and evolution, 2008,218(3-4):193-202

[12] Janssen R, Le Gouar M, Pechmann M,. Conservation, loss, and redeployment of Wnt ligands in protostomes: implications for understanding the evolution of segment formation [J]. BMC evolutionary biology, 2010,10(1):374

[13] Sullivan JC, Ryan JF, Mullikin JC,. Conserved and novel Wnt clusters in the basal eumetazoan[J]. Development genes and evolution, 2007,217(3):235-239

[14] Damen WG. Parasegmental organization of the spider embryo implies that the parasegment is an evolutionary conserved entity in arthropod embryogenesis [J]. Development, 2002,129(5):1239-1250

[15] Hayden L, Arthur W. The centipede Strigamia maritima possesses a large complement of Wnt genes with diverse expression patterns [J]. Evolution & development, 2014,16(3):127-138

[16] Altschul SF, Gish W, Miller W,Basic local alignment search tool [J]. Journal of molecular biology, 1990,215(3):403-410

[17] Eddy SR. Accelerated profile HMM searches [J]. PLoS computational biology, 2011,7(10):e1002195

[18] Larkin MA, Blackshields G, Brown N,. Clustal W and Clustal X version 2.0 [J]. bioinformatics, 2007,23(21):2947-2948

[19] Liu W, Xie Y, Ma J,. IBS: an illustrator for the presentation and visualization of biological sequences [J]. Bioinformatics, 2015,31(20):3359-3361

[20] Guindon S, Dufayard JF, Lefort V,. New algorithms and methods to estimate maximum-likelihood phylogenies: assessing the performance of PhyML 3.0 [J]. Systematic biology, 2010,59(3):307-321

Genome-wide and Evolution Analysis ofGene Family in Chelicerata

LIANG Yuan1, ZHOU Yan1,2*

1.200438,2. Shanghai-MOST Key Laboratory of Health and Disease Genomics, Chinese National Human Genome Center at Shanghai, Shanghai 201203, China

The secreted, cysteine-rich Wnt proteins plays an essential role in a diversity of biological processes, encompassing embryo development, the differentiation and maintenance of cell morphology, tissue regeneration and regulation in immune response. On the basis of its functional diversity and importance, the Wnt gene family has been extensively investigated in a variety of metazoans. However, for Chelicerata in arthropods, limited information is available about the systematic identification and analysis of the Wnt gene family. In the present study, the Wnt gene family were characterized in eight Chelicerata, with extensive genomic or transcriptomic resources. Totally 87 Wnt members were identified in Chelicerata. Investigation of functional domains showed that Wnt proteins contain a highly conserved Wnt domain, a signal peptide, a transmembrane region, or a low complexity region. The genomic organization analysis found that there are two major patterns (Wnt9-Wnt6-Wnt1 or Wn5-Wnt7) existing in Chelicerata species, with lineage specific clusters including variation of the orientation and number of the genes. The phylogenetic reconstruction suggested expansion of Wnt5, Wnt7 and Wnt11 and loss of Wnt3 and Wnt10 in Chelicerates. To our best knowledge, this study would provide an insight into the first genome-wide study of the Wnt gene family in Chelicerata, and furthermore, could provide preliminary implications for further understanding of Wnts in Chelicerata.

Chelicerata;gene family; genome-wide; evolution

Q1

A

1000-2324(2020)03-0432-06

10.3969/j.issn.1000-2324.2020.03.008

2019-03-05

2019-05-12

国家重点研发项目(2017YFC0907503);上海市科学技术研究委员会(17DZ2270800);中国科学院(KFJ-STS-QYZD-126)

梁园(1994-),女,研究生,主要从事螯肢动物基因组研究工作. E-mail:yliang17@fudan.edu.cn

Author for correspondence. E-mail:Yan Zhou, zhouy@fudan.edu.cn

猜你喜欢

蝎子结构域基因组
“植物界大熊猫”完整基因组图谱首次发布
细菌四类胞外感觉结构域的概述
牛参考基因组中发现被忽视基因
科学家找到母爱改变基因组的证据
UBR5突变与淋巴瘤B细胞成熟
血清HBV前基因组RNA的研究进展
黄色的小蝎子
蝎子
蝎子
蝎子