APP下载

中国瘰螈皮肤转录组测序及活性多肽分析

2022-10-27梁广男刘雅莉段志贵

安徽农业大学学报 2022年1期
关键词:多肽测序氨基酸

唐 兴,梁广男,刘雅莉,段志贵

(1. 衡阳师范学院生命科学与环境学院,衡阳 421008;2. 衡阳师范学院南岳山区生物资源保护与利用湖南省重点实验室,衡阳 421008;3. 东华理工大学江西省质谱科学与仪器重点实验室,南昌 330013;4. 湖南师范大学动物多肽药物创制国家地方联合工程实验室,长沙 410081)

两栖类动物是防御性较弱的生物,为了保护自己免受掠食者侵害,它们已经进化出一种特殊的防御机制,即由皮肤毒液腺表面分泌毒液来进行防御。在古代医药中,两栖动物被认为具有药用价值,其皮肤提取物早在几个世纪前就作为传统药材,例如,作为中药可调节身体内部功能和生殖能力,在古埃及药物中用于治疗疼痛和腹泻[1-3]。现代医药研究发现,两栖动物皮肤分泌物的多肽组分结构多样、功能各异,因此研究两栖类皮肤分泌活性肽的结构和生物学功能对于开发新型药物具有重要意义。

蛙和蟾蜍(两栖类无尾目)的皮肤分泌物中已有大量药物候选分子被鉴定[1,4],而蝾螈(两栖类有尾目)的皮肤分泌肽报道数量非常有限[5-7]。究其原因,这些蝾螈皮肤多肽都是先通过提取皮肤分泌液,然后再用液相色谱分离获得纯度较高的多肽分子,最后通过Edman 降解(或结合RACE 技术)测定其全长序列。本实验室也尝试过将蝾螈皮肤分泌液进行分离纯化,但仅极少数多肽获得微量的高纯度样品,大多数多肽难以达到Edman 降解测序需要的纯度和最低限量。

转录组测序已经广泛应用于多种生物体的高通量测序中[8-11],其中也包括一些能够分泌毒液的动物,如银环蛇(Bungarus multicinctus)、海南捕鸟蛛(Cyriopagopus hainanus)、东亚钳蝎(Mesobuthus martensii)、大理石芋螺(Conus marmoreus)和毒蛙(Oophaga sylvatica)[12-16]。转录组测序技术主要有3 种,其中包括Solexa 测序技术、454 测序技术和SOLiD 测序技术,但目前以Illumina 公司的Solexa 测序技术为主。该方法具有高通量、测序效率高、耗时短等优势。

中国瘰螈(Paramesotriton chinensis)在分类上隶属两栖纲(Amphibia)、有尾目(Caudata)、蝾螈科(salamandridae)、瘰螈属(Paramesotriton)。关于中国瘰螈分布以及行为习性的研究已有论文发表[17-18],但是尚无其皮肤组织蛋白质和活性多肽成分的研究报道。本研究以中国瘰螈皮肤组织为材料,采用转录组测序技术,获得原始数据后组装成unigene,并进行功能富集分类,以识别编码的蛋白质和活性多肽成分。

1 材料与方法

1.1 中国瘰螈皮肤组织总RNA 提取和检测

中国瘰螈(雌性)成体1 只购买于某养殖场(图1),属于人工繁殖的后代。用双蒸水清洗蝾螈皮肤3 次,灭菌滤纸擦干。用RNA 酶灭活处理的镊子撕下蝾螈皮肤,再迅速加入到已用液氮预冷的研钵中研磨,然后利用Trizol 试剂盒提取总RNA。取适量RNA 样品,采用Agilent 2100 Bioanalyzer 进行毛细管电泳以鉴定RNA 样品浓度和纯度。

图1 中国瘰螈Figure 1 Paramesotriton chinensis

1.2 cDNA 文库的构建及测序

提取的总RNA 用DNase I 消化DNA,通过带有Oligo(dT)的磁珠富集mRNA。加入片段化试剂,在恒温混匀仪中适温将mRNA 打断成短片段,以打断后的mRNA 为模板、用随机六碱基引物进行反转录合成cDNA 第一条链。合成双链 cDNA 后,再经过PCR 试剂盒纯化回收、粘性末端修复、3’末端加上碱基“A”并连接测序接头,然后进行琼脂糖凝胶电泳。片段大小选择后进行 PCR 扩增。构建好的cDNA 文库用Agilent 2100 Bioanalyzer 和ABI StepOnePlus Real-Time PCR System 质检,合格后使用Illumina HiSeq 4000 进行测序。

1.3 测序数据处理

从测序原始reads 中去掉低质量、接头污染、未知碱基N含量过高的reads,过滤后数据即为clean reads。使用组装软件 Trinity 将具有一定长度重叠序列连成更长的Contig,然后通过快速聚类软件Tgicl 将来自同一转录本的不同Contig 进一步进行组装处理,最后得到Unigene 序列。

1.4 基因注释和生物信息学分析

使用 Blast[19]对unigene 进行NT、NR、COG、KEGG 以及 SwissProt 注释;采用 Blast2GO[20]以及NR注释结果进行GO注释,通过 InterProScan5[21]进行InterPro 注释。

编码皮肤活性多肽cDNA 序列翻译成前体肽序列后,通过信号肽在线分析软件SignalP-5.0 Server(http://www.cbs.dtu.dk/services/SignalP/)鉴定信号肽序列,再利用MEGA 软件将皮肤活性多肽与同源多肽的氨基酸序列进行对比。

2 结果与分析

2.1 RNA 质检数据

采用Agilent Bioanalyzer 进行毛细管电泳测定中国瘰螈皮肤组织总RNA 的浓度和纯度,鉴定其浓度为540 ng·μL-1,RNA 总量为10.8 μg,RNA 完整值(RNA integrity number,RIN)为7.7,rRNA的28S/18S 为1.0。在本试验中,RNA 样品的鉴定结果能够满足建库测序要求。

2.2 测序数据

构建好的cDNA 文库通过Illumina HiSeq 4000 进行测序,测序的原始reads 数目为49.00 M,过滤后clean reads 数目为44.76 M。将clean reads 组装成contig,再聚类去冗余和组装得到74 371 个unigene,其总长度、平均长度、N50 以及GC 含量分别为 56 739 303 bp、762 bp、1 387 bp 和 46.12%。

2.3 Unigene 功能注释

将unigene 在七大功能数据库 (NR、NT、GO、COG、KEGG、Swissprot 和Interpro) 中进行注释,注释结果见表1。共注释到33 627个非冗余unigene,占unigene 总数的45.22%;其中NR 注释的unigene最多,为30 734 个(占注释unigene 总数的91.40%)。

表1 中国瘰螈皮肤组织转录组unigene 的功能注释统计Table 1 Summary of functional annotation result for unigenes from transcriptome of P. chinensis skin tissue

我们统计了unigene 注释结果的物种分布(图2),其中5 137个unigene注释结果来自两栖类物种,约占注释总数的15%;注释结果最多的两个物种是热带爪蟾(Xenopus tropicalis)和非洲爪蟾(X.laevis),注释数目分别是3 619 个和1 156 个,分别约占注释结果为两栖类物种的70%和23%(图3)。而且,也发现一些注释结果来自蝾螈物种,注释数目最多的为墨西哥钝口螈(Ambystoma mexicanum)、红腹蝾螈(Cynops pyrrhogaster)、绿红东美螈(Notophthalmus viridescens) 和 欧 非 肋 突 螈(Pleurodeles waltl),它们的注释数目共约占注释结果为两栖类物种的5%。

图2 中国瘰螈皮肤组织转录组unigene 注释结果的物种分布Figure 2 Distribution of annotated species for unigenes from transcriptome of P. chinensis skin tissue

图3 中国瘰螈皮肤组织转录组unigene注释结果为两栖类的物种分布Figure 3 Distribution of annotated amphibian species for uni genes from transcriptome of P. chinensis skin tissue

根据COG 和GO 注释结果,我们分别统计了各自的功能分类。COG 数据库(全称是cluster of orthologous group)是直系同源蛋白注释的数据库,即来自同一个祖先蛋白的同源蛋白被归为一类,并认为它们有相同或相关的功能。本研究共鉴定出20 406 个COG 注释项,可分为25 个COG 类别(图4)。其中,“一般功能基因”(3 591 个,占比为17.60%(3 591/20 406)下同))的COG 注释项最多;其次是“复制、重组和修复”(2 030 个,占比为9.95%)、“翻译、核糖体结构与生物发生”(1 799 个,占比为8.82%)、“转录”(1 656 个,占比为8.12%)、“细胞周期控制、细胞分裂、染色体分裂”(1 298 个,占比为6.36%);而COG 注释项最少的类别是“核结构”(8 个,占比为0.04%)以及“胞外结构”(25个,占比为0.12%)。

图4 中国瘰螈皮肤组织转录组unigene 的COG 功能分类Figure 4 Functional distribution of COG annotation for unigenes from transcriptome of P. chinensis skin tissue

基因本体论(gene ontology,GO)为所有物种的基因(或产物)提供了一个国际标准化的基因功能分类系统(图5),它们被分为3 类:生物过程(biological process)、细胞成分(cellular component)和分子功能(molecular function)[22]。本研究一共获得75 914 个GO 注释项,其中37 525 个GO 注释项涉及生物过程(49.43%),27 256 个GO 注释项涉及细胞成分(35.90%)和11 133 个GO 注释项涉及分子功能(14.67%)。

图5 中国瘰螈皮肤组织转录组unigene 的GO 功能分类Figure 5 Functional distribution of GO annotation for unigenes from transcriptome of P. chinensis skin tissue

2.4 中国瘰螈皮肤活性多肽的识别

通过对中国瘰螈皮肤进行RNA 测序研究,我们识别了胆囊收缩素、防御素、伤口愈合肽、神经肽Y 家族、蛋白激酶抑制剂、胸腺素等皮肤活性多肽,均发现它们在其他两栖动物中存在高度序列相似性的同源多肽。而且,这些皮肤活性多肽大多数与蝾螈皮肤的免疫或防御功能有关。

2.4.1 胆囊收缩素 胆囊收缩素具有肠激素和神经递质的作用。另外,胆囊收缩素还具有抗炎症反应和免疫调节作用,如增强中性粒细胞和巨噬细胞的吞噬和杀菌能力[23]。从红瘰疣螈(Tylototriton verrucosus)的皮肤分泌液中,发现一个胆囊收缩素CCK-TV[5],其成熟肽氨基酸序列为DYMGWMDFNH2。本试验中识别的中国瘰螈皮肤胆囊收缩素(PC-CCK)与CCK-TV 的前体肽序列仅两个氨基酸残基不同,而它们的成熟肽序列完全一样。

2.4.2 防御素 抗菌肽是动物先天免疫系统的一个组成部分。防御素作为抗菌肽的主要家族,因此它在蝾螈先天免疫系统中发挥着重要作用[24]。中国瘰螈皮肤防御素(PC-defensin)与福鼎蝾螈(C.fudingensis)皮肤防御素CFBD 的成熟肽长度均为41 个氨基酸残基,它们的序列仅有一个氨基酸残基不同,序列相似性高达98%。它们均含有6 个半胱氨酸残基,能形成3 个二硫键(配对方式 C1-C5、C2 -C4、C3-C6),属于β-防御素(图6)。前人的研究结果证明,CFBD 具有较强的抗菌活性,它对金黄色葡萄球菌、枯草杆菌、白色念珠菌和大肠杆菌均有抑制作用[6]。

图6 PC-defensin 和CFBD 前体序列比对Figure 6 The alignment of precursor sequences from PC-defensin and CFBD

2.4.3 伤口愈合肽 蝾螈拥有很强大的伤口愈合能力,是唯一能够再生残缺和损伤身体部位(包括四肢)的脊椎动物[25]。哺乳动物伤口表面的上皮再生过程通常需要2~3 d,而蝾螈在同样的过程中只需要10 h,因此蝾螈皮肤伤口能够很快地愈合。

Cathelicidin类抗菌肽在脊椎动物中是一类保守抗菌肽家族,其前体肽经过内源性酶处理后,释放具有抑制微生物活力的生物活性肽,它一般位于前体肽的 C 末端。本研究识别的中国瘰螈皮肤PC-cathelicidin 以及红瘰疣螈皮肤的促伤口愈合活性肽tylotoin(其序列为QTRKCVRQNNKRVCK),均与抗菌肽cathelicidin 家族具有高度同源性[7]。这两种多肽的前体肽序列均含有3 个部分(信号肽、中间肽和成熟肽)(图7),其序列相似性为80.0%。其中,它们的信号肽长度均含有20 个氨基酸残基,仅第8 位的氨基酸残基不同,其序列相似性最高(95.0%);而中间肽的氨基酸残基长度相差2 个氨基酸残基,序列相似性比信号肽序列略低(80.5%);而成熟肽的氨基酸残基长度也不同(tylotoin 为15个氨基酸残基,而中国瘰螈皮肤cathelicidin 为16个氨基酸残基),均含有一对二硫键,但是其相似性最低(56.3%)。前人的研究结果表明,在小鼠全层皮肤创伤模型中,tylotoin 与表皮生长因子EGF 具有相似地促进伤口愈合的能力(EC50为 11.14 μg·mL-1)。Tylotoin 直接促进角质形成细胞、血管内皮细胞和成纤维细胞的运动和增殖,从而加速创面的再上皮化和肉芽组织的形成。Tylotoin 还促进了转化生长因子1(TGF-β1)和白细胞介素6(IL-6)的释放,这在伤口愈合反应中是必不可少的[7]。

图7 PC-cathelicidin 和tylotoin 前体序列比对Figure 7 The alignment of precursor sequences from PCcathelicidin and tylotoin

角质形成细胞是维持皮肤完整性的重要细胞,是第一批对损伤作出反应的细胞。皮肤周围神经中的神经肽如降钙素基因相关肽(calcitonin gene related peptide, CGRP)有助于角质形成细胞的增殖,因此也属于伤口愈合肽。降钙素基因相关肽可以通过参与皮肤炎症和伤口愈合过程而具有保护作用。来自双色叶蛙(Phyllomedusa bicolor)皮肤分泌物中的多肽pbCGRP,具有SCDTSTCATQRLADFLSR SGGIGSPDFVPTDVSANSF 序列(C 末端氨基酸残基酰胺化)[26]。中国瘰螈皮肤PC-CGRP 与pbCGRP的成熟肽具有较高的同源性(序列相似性为67.6%)。它们的成熟肽长度均为37 个氨基酸残基,且它们在C2 和C7 之间形成一对二硫键(图8)。

图8 PC-CGRP 和pbCGRP 成熟肽序列比对Figure 8 The alignment of mature sequences from PC-CGRP and pbCGRP

2.4.4 神经肽 Y 家族 胰多肽(pancreatic polypeptide,PP)和酪神经肽(neuropeptide tyrosine,NPY)均属于神经肽Y 家族,它们均具有36 个氨基酸残基且其C 末端的Y 或F 残基发生酰胺化,其三级空间结构特征也相同。神经肽Y涉及进食行为、垂体和胃肠道的调节[1]。

本次研究在中国瘰螈皮肤转录组中识别了两种神经肽Y,即PC-PP 和PC-NPY。其中,中国瘰螈皮肤胰多肽PC-PP 与蛙胰多肽PP(在美洲牛蛙Lithobates catesbeianus和木蛙L. sylvaticus中均有发现)的成熟肽序列具有72.2%的序列相似性,而它们的C 末端氨基酸残基均有酰胺化修饰(图9);而中国瘰螈皮肤酪神经肽PC-NPY 的成熟肽序列( YPSKPNSPGEDAPAEDMAKYYSALRHYINLIT RQRY)与墨西哥钝口螈的酪神经肽NPY 序列完全一致。

图9 PC-PP 和PP 成熟肽序列比对Figure 9 The alignment of mature sequences from PC-PP and PP

2.4.5 蛋白激酶抑制剂 从转录组数据中还识别到一种cAMP 依赖的蛋白激酶抑制剂(PC-PKIA),它与两种爪蟾—热带爪蟾(X. tropicalis)和非洲爪蟾(X. laevis)的PKIA 具有较高的序列相似性(均为71.8%)(图10);这两种爪蟾PKIA 在蛋白质数据库 UniProtKB 中编号分别为 F6YL71 和A0A1L8G8I6。目前,从两栖动物皮肤中鉴定出许多蛋白酶抑制剂,它们在两栖动物皮肤中可能是负调控皮肤蛋白酶活性以避免皮肤肽的过早降解或释放,或者是类似于抗菌肽的表面抗感染剂而抑制入侵细菌产生的胞外蛋白酶[1]。

图10 PKIA 成熟肽序列比对Figure 10 The alignment of mature sequences of PKIAs

2.4.6 胸腺肽 胸腺肽具促血管生成、愈合创伤、抑制炎症以及等多种生物活性功能,因此它在动物免疫系统中起到重要作用[27]。从中国瘰螈皮肤转录组数据中识别到一个胸腺肽PC-thymosin,与云南棘蛙(Nanorana yunnanensis)的胸腺肽(UniProtKB编号为A5HEW9)和中国大鲵(Andrias davidianu)的胸腺肽β-4的序列相似性分别为 86.67%和88.89%(图11)。胸腺肽基因在两栖动物中的不同器官表达也有巨大差异。前人的研究结果表明,中国大鲵胸腺肽β-4基因在在肺中表达水平最高,而在皮肤中表达水平较低[28]。

图11 胸腺肽成熟肽序列比对Figure 11 The alignment of mature sequences of thymosins

3 讨论与结论

蝾螈皮肤毒液是一种含有复杂成分的混合物,主要包括生物碱、类固醇、生物胺等小分子化合物和多肽、蛋白质等。这些小分子化合物的活性和结构已被鉴定,其中生物碱在蝾螈皮肤防御中起重要作用,它既有抑菌作用,也对脊椎动物有毒性作用,因此具有防御天敌和抗感染双重功能[29]。此外,蝾螈皮肤毒液也含有活性多肽,但由于采用传统的分离和测序方法难以获得多肽全序列,因此已报道的蝾螈皮肤活性多肽数量非常有限[5-7]。

本研究首次对中国瘰螈皮肤组织进行了转录组测序,并从转录组数据中识别了几类皮肤活性多肽。它们大多与免疫或防御活性相关,比较分析发现它们与其他两栖动物种类的同源多肽有较高的序列相似性。

相对于基因组测序[30],采用的转录组测序具有更高性价比和分析效率,可以高效地获得蛋白质和多肽转录本信息。本研究识别了多种中国瘰螈皮肤活性多肽,将为下一步合成或表达这些多肽并进行相关功能研究提供基础数据。此外,蝾螈皮肤的活性多肽与小分子化合物之间的可能相互作用,是未来研究两栖类皮肤功能的一个重要方向。

猜你喜欢

多肽测序氨基酸
饲料氨基酸释放动态对猪氮素利用影响的研究进展
生根提苗就用碧邦有机多肽氮水溶肥
新一代高通量二代测序技术诊断耐药结核病的临床意义
宏基因组测序辅助诊断原发性肺隐球菌
生物测序走在前
科学解读食物中的蛋白质如何分“优劣”
中晟全肽:为全球研发“救命良药”加速
基因测序技术研究进展
补氨基酸不如吃鸡蛋
核酸适配体在多肽研究中的应用