APP下载

小串链霉菌XG40全基因组测序及序列分析

2023-11-11赖宝春戴瑞卿曾天宝陈淑妹姚锦爱

热带作物学报 2023年9期

赖宝春 戴瑞卿 曾天宝 陈淑妹 姚锦爱

关键词:小串链霉菌;全因组测序;次级代谢合成基因簇;比较基因组分析

中图分类号:S476 文献标识码:A

链霉菌属是一类好氧的革兰氏阳性放线菌,具有高度分枝的基内菌丝和气生菌丝,可代谢合成丰富的次级代谢产物,是最重要的抗生素产生菌,同时也是重要的促生及生防制剂,在农业领域应用越来越广泛[1-4]。虽然链霉菌属基因组具有丰富的次级代谢产物基因簇,但其基因组的GC含量较高(66%~74%),染色体结构复杂,往往会发生部分基因沉默的现象,新型活性物质的发现存在一定的难度[1, 5]。利用全基因组测序分析可以准确地预测链霉菌次级代谢基因簇的数量和类型、编码基因的大小、位置、功能和骨架结构,以及代谢调控方式等,有助于新型代谢产物的快速挖掘[6-7]。当前已有696 个链霉菌的基因组公布(http://www.bacterio.net/streptomyces. html)。随着测序技术的成熟,越来越多的链霉菌基因组被测序并应用于生物防治研究。张博阳等[1]对具有良好促生防病效果的桑氏链霉菌(Streptomyces.sampsonii)KJ40 进行全基因组测序和分析,明确了其次级代谢产物合成途径,预测到与促生防病相关的功能基因。王莎等[6]通过比较基因组学和泛基因组学对植物内生链霉菌SAT1 的全基因组序列进行分析,预测出与SAT1 抑菌活性相关的2个次级代谢产物合成基因簇。覃可等[8]通过解析生防链霉菌(Streptomyces sp.)FT05W 的全基因組序列,挖掘出与抗菌活性的7 个几丁质酶基因,为烟草拮抗链霉菌分子生物防治研究奠定基础。

小串链霉菌(S. catenulae)能够产生氨基酸、抗生素FR-900130[9]、纤维抑制素[10-12]及(S)-乙炔甘氨酸[13]等多种次级代谢产物,具有抗菌生物活性;还可以生物合成银纳米粒子,有很好的稳定性、生物相容性、抗炎活性和抗菌活性[14]。小串链霉菌还能通过反硝化作用,将硝酸盐还原为亚硝酸盐,催化ɑ-生育酚氧化为ɑ-生育醌,这是首次发现的生育酚微生物转化[15]。研究还发现小串链霉菌对大蜡螟幼虫有致死作用,其提取液会导致大蜡螟的蛹期变长,降低化蛹率和成虫羽化率,30 mg/1.5 mL 条件下大蜡螟幼虫的死亡率达86.7%,是潜在生物杀虫剂[16]。小串链霉菌能提高花生植株对重金属的耐受能力,增加根系定殖率,提高固氮酶的活性,促进植株生长,提高作物产量[17]。此外,小串链霉菌具有根际促生和生防作用,含有小串链霉菌制成的复合微生物菌肥不仅可用于防治小麦全蚀病,还可以促进植株生长[18]。小串链霉菌XG40 是本研究室从草莓根际土壤中分离得到的拮抗菌,其抗菌谱广,对蜜柚黑斑病菌、番茄叶霉病菌、香蕉枯萎病菌等14种植物病原菌均具有较好拮抗作用;对蜜柚果实黑斑病具有良好的防治效果,具有良好的开发价值和应用前景[19-20]。小串链霉菌能产生抗菌、抗虫、促生、抗重金属等多种活性物质,是生物防治方面利用价值较高的一种放线菌资源,目前国内外尚未发现应用全基因组挖掘小串链霉菌生物活性物质的相关研究报道。

为深入了解小串链霉菌XG40 次级代谢产物合成潜力和抑菌机制,本研究通过第三代PacBio全基因组测序分析,对小串链霉菌XG40 的基因组序列进行基因预测和功能注释、次级代谢产物合成基因簇分析以及比较基因组学研究,为深入挖掘其生防潜力,开发可用于农业生物防治的次级代谢产物提供理论依据。

1 材料与方法

1.1 材料

1.1.1 供试菌种 小串链霉菌XG40 由本研究室从草莓根际土壤样品中分离、鉴定并保存。

1.1.2 供试培养基 高氏一号琼脂培养基:可溶性淀粉20 g,硝酸钾(KNO)1 g,氯化钠(NaCl)0.5 g , 硫酸镁( MgSO ) 0.5 g , 磷酸氢二钾(K2HPO)0.5 g,硫酸亚铁(FeSO)0.01 g,琼脂粉13 g,蒸馏水1000 mL,pH 7.2~7.4,用于菌株活化培养;高氏一号液体培养基:可溶性淀粉20 g,硝酸钾(KNO)1 g,氯化钠(NaCl)0.5 g,硫酸镁(MgSO)0.5 g,磷酸氢二钾(K2HPO)0.5 g,硫酸亚铁(FeSO)0.01 g,蒸馏水1000 mL,pH 7.2~7.4,用于发酵液培养;马铃薯液体(PDB)培养基:去皮马铃薯200 g,葡萄糖20 g,水1000 mL,pH 7.0,用于发酵液培养;马铃薯琼脂(PDA)培养基:去皮马铃薯200 g,葡萄糖20 g,琼脂20 g,水1000 mL,pH 7.0,用于拮抗实验。

1.1.3 仪器和试剂 可溶性淀粉、硝酸钾、氯化钠、硫酸镁、磷酸氢二钾、硫酸亚铁、葡萄糖、Tris、EDTA、琼脂粉等均为国产分析纯。仪器设备包括智诚ZWY-240 恒温摇床、上海卢湘仪TGL-20M 离心机、QIAGEN Genomic-tip DNA 提取试剂盒、BG-GDSAVTO520 凝胶成像系统、赛默飞世Thermo NANODROP2000 超微量分光光度计、Invitrogen QubitTM3Flurometer 荧光计、天能Tanon EPS600 电泳仪。

1.2 方法

1.2.1 菌株培养与基因组DNA 提取 XG40菌株接种至高氏一号固体平板上,28 ℃恒温培养6 d,转接至摇瓶培养基,28 ℃,180 r/min 培养5 d,取发酵液经8000 r/min 离心10 min,收集菌体,用于基因组DNA 提取。采用QIAGEN Genomic-tip DNA 提取试剂盒抽提基因组DNA,利用0.75%琼脂糖凝胶电泳检测DNA 的完整性,使用Nanodrop 和Qubit 测定DNA 的浓度和纯度。

1.2.2 基因组的测序、组装和注释 本次测序委托北京百迈客生物科技有限公司完成。将检测合格的DNA 样品进行凝胶回收和DNA 文库构建。依次用Illumina noveseq-6000 和Pacbio 测序平台完成二代和三代基因组测序。首先使用Hifiasm软件进行组装,然后根据二代测序数据,采用Pilon v1.22 软件对三代数测序据进行纠错,再通过Circlator v1.5.5 软件进行环化和调整起始位点,最终得到准确度更高的基因组序列。编码基因采用Prodigal v2.6.3 软件进行预测;rRNA 基因用Infernal v1.1.3 软件预测;tRNA 用tRNAscan-SEv2.0 软件预测;其他非编码RNA(nc-RNA)用Infernal v1.1.3 软件进行预测;CRISPR 用CRT v1.2软件进行预测;基因岛用IslandPath-DIMOB v0.2软件进行预测;前噬菌体用PhiSpy v2.3 软件进行预测;基因簇用antiSMASH v5.0.0 软件进行预测;启动子用PromPredict v1 软件进行预测;旁系同源基因用BLASTP v2.2.29 软件进行预测。根据预测的基因组编码蛋白序列信息,通过NR(非冗余蛋白质数据库)、GO(基因本体数据库)、KEGG(京都基因和基因组百科全书)、eggNOG(直系同源基因簇的数据库)、Pfam 数据库、Swiss-Prot数据库、TrEMBL 数据库对基因组进行功能注释。

1.2.3 次级代谢产物合成基因簇分析 次级代谢产物的编码基因通常在基因组中成簇存在,本研究采用antiSMASH 软件对小串链霉菌XG40 菌株中次级代谢产物合成基因簇进行分析,并预测可能合成的代谢产物。

1.2.4 比较基因组学分析 将小串链霉菌XG40的基因组序列与其他已经测序完成的链霉菌基因组序列进行比较分析,包括天蓝色链霉菌(S.coelicolor)A3(2),吸水链霉菌菌(S. hygroscopicussubsp. hygroscopicus)OsiSh-2、NBRC 12859,陆源链霉菌(S. himastatinicus)ATCC 53653,伊朗链霉菌(S. iranensis)DSM 41954,黑孢链霉菌(S.melanosporofaciens)DSM 40318,雷帕链霉菌(S.rapamycinicus ) DSM 41530, 稀疏链霉菌( S.sparsogenes ) DSM 40356 , 根霉链霉菌( S.rhizosphaericus)DSM 41760、0250,马来西亚链霉菌(S. malaysiensis)F913、DSM 14702,利迪链霉菌(S. lydicus)ATCC 31975,白色链霉菌(S.albus)DSM 40763,紫黑链霉菌(S. violaceusniger)NRRL F-8817 和抗氧化链霉菌(S. antioxidans)MUSC 1641 等16 株菌株。16 株链霉菌的基因组序列及注释信息下载自GenBank 数据库。统计16株菌基因组的基本特征,采用Geneious 软件中的Mauve 插件进行基因组共线性分析,程序采用默认参数运行。

2 结果与分析

2.1 小串链霉菌XG40全基因组概况

第三代全基因组测序结果显示,XG40 基因组由3 个contigs 组成,包含1 个染色体DNA 和2个质粒DNA。完整的XG40 基因组序列全长9 772 324 bp,GC 含量为70.58%,编码8074 个基因,正链4171 个,负链3903 个,编码基因占整个基因组的96.41%,平均长度为1062 bp。进一步的基因组结构分析发现,XG40 基因组可能编码18 个rRNA、77 个tRNA、153 个ncRNA、4个CRISPR、4 个基因岛、1 个前噬菌体、46 个基因簇和2 个启动子。基因组圈图见图1。

2.2 小串链霉菌XG40全基因组注释分析

利用eggNOG、GO、KEGG、Nr、Swiss-Prot、TrEMBL 和Pfam 数据库,对XG40 全基因组中8074 个基因进行蛋白功能注释,在所有数据库中共有7872 个功能基因被注释,占比为97.50%,统计结果见表1。进一步对eggNOG、GO 和KEGG数据库中注释的功能基因进行分析,以获取XG40中与拮抗物质合成相关的次级代谢产物合成通路的基因信息。

2.2.1 eggNOG 注释结果 将XG40 注释基因的序列和eggNOG 数据库进行BLAST 比对,完成同源基因注释分类,共有6033 个基因得到注释(图2),其中参与转录(transcription)、氨基酸转运与代谢(amino acid transport and metabolism)、碳水化合物转运和代谢(carbohydratetransport and metabolism) 、能量产生与传递(energy production and conversion)、次级代谢物生物合成(secondary metabolites biosynthesis)、信号转导机制(signal transduction mechanisms)以及复制、重组和修复(replication, recombinationand repair)的基因占较大比例,分别为9.76%、7.38%、6.61%、6.08%、4.97%、4.87%和4.78%。其他功能属性的注釋基因数量比例相对较少。值得注意的是,次级代谢产物合成相关基因达300个,如此多的次级代谢产物合成基因极有可能是该菌株能够产生多种次级代谢产物的原因。

2.2.2 KEGG 注释结果 XG40 全基因组的KEGG 数据库分析结果显示,总共有2679 个基因获得功能注释(图3)。在这些功能注释基因中,主要归属于代谢(metabolism)、氨基酸的生物合成(biosynthesis of amino acids)、ABC 转运(ABC transporters)。其中,与代谢相关的注释基因数量最多,可能与XG40 拮抗物质生成代谢通路相关。

2.3 小串链霉菌XG40 次级代谢产物合成基因簇预测与分析

2.3.1 小串链霉菌XG40 次级代谢产物基因簇的预测 次级代谢产物是抗菌剂和其他生物活性化合物的重要来源,其编码基因通常在基因组中成簇存在, 编码具有多种功能的复合酶。软件antiSMASH v5.0.0 是鉴定与分析基因組序列中生物合成基因簇(BGC)的最广泛使用工具。基于特定于某些类型的基因簇的基因的隐式隐马尔可夫模型,antiSMASH 能够准确识别编码所有已知广泛化学类别的次级代谢产物的基因簇。本研究采用antiSMASH 软件对小串链霉菌XG40 中所有的次级代谢产物合成基因簇进行分析,共预测得到46 个可能的次级代谢产物生物合成基因簇(表2),表明小串链霉菌XG40 菌株具有合成这些代谢产物的潜力和基因元件,但具体能否合成这些次级代谢产物还与其培养条件等因素有关。放线菌的产生的抗虫剂、抗菌剂、抗癌剂等大部分功能性化合物由聚酮合成酶(PKS)和非核糖体肽合成酶(NRPS)2 种代谢途径合成。小串链霉菌XG40 基因组中包含PKS 和NRPS 的基因簇共有24 个,占总基因簇数量的52.17%,其中,T1PKS6 个,T2PKS 1 个,NRPS 6 个,NRPS-T1PKS 5个,T1PKS-NRPS-like 3 个,NRPS-T2PKS 1 个,NRPS-like 1 个,PKS-like 1 个。其他基因簇22个,其中铁载体siderophore 3 个,萜烯terpene 6个,γ-丁内酯butyrolactone 6 个,镧肽lanthipeptide2 个,黑色素melanin 1 个,四氢嘧啶ectoine 1 个,β-莱克酮betalactone 1 个,芳基聚烯烃arylpolyene1 个,吲哚indole 1 个。

2.3.2 小串链霉菌XG40 的尼日利亚菌素和褐黄癌菌素V 基因簇分析 XG40 基因组编码的46 个基因簇中,有7 个基因簇与已知基因簇(Cluster 1、Cluster 9、Cluster 14、Cluster 22、Cluster 25、Cluster38、Cluster 46)的相似性为100%;有4 个基因簇与已知基因簇(Cluster16、Cluster32、Cluster33、Cluster34)的相似性在80%以上,表明XG40 具有产生这些次级代谢产物的潜力。有29 个基因簇的相似性在1%~76%之间,说明这些基因簇具有产生已知结构代谢物或其结构类似物的潜力。其余6 个基因簇没有匹配到相似的基因簇,表明这些基因簇为未知基因簇,可能不具有产生新代谢物的潜能。

本研究发现,与已知基因簇相似较高的11 个基因簇中,尼日利亚菌素(nigericin)[21-22]、褐黄癌菌素V(gilvocarcin V)[23-24]具有抗菌活性。本研究中尼日利亚菌素和由褐黄癌菌素V 合成基因簇均是由PKS 代谢途径合成。尼日利亚菌素和褐黄癌菌素V 的结构如图4 所示。利用antiSMASH 在线软件对XG40 基因组的次级代谢产物合成基因簇进行分析,从而确定XG40 中尼日利亚菌素和褐黄癌菌素V 基因簇相关信息(图5)。Cluster 25 与紫黑链霉菌(S. violaceusniger)Tu 4113 的尼日利亚霉素合成基因簇(BGC0000114)的相似性达100%。将2 菌株中的尼日利亚菌素各个基因进行比对,发现Cluster 25 中的基因与nigAI~XI、nigBI~BII、nigCI~CII 和nigD~E 等17个合成尼日利亚菌素的关键编码基因的相似度为68%~93%(表3),说明XG40 可能合成尼日利亚霉素。Cluster33 与灰黄链霉菌S. griseoflavus Tu4000 的褐黄癌菌素V 合成基因簇(BGC0001956)的相似性为88%;将2 菌株中的褐黄癌菌素V 各个基因进行比对,发现Cluster 33 中的基因与gilA~K、gilOI~IV、gilM、gilP、gilQ、gilR、gilT、gilU、gilV、gilGT、gilMT 等24 个合成褐黄癌菌素V 的关键编码基因的相似度为68%~93%(表4),说明该基因簇可能负责合成褐黄癌菌素V。

2.4 比较基因组学分析

对XG40 基因组与16 株不同链霉菌参考菌株的基因组完成图进行比较分析,发现XG40 与参考菌株基因组大小相近,GC 含量均高于70%,如表5 所示。其中,XG40 与陆源链霉菌ATCC53653、黑孢链霉菌DSM 40318、根霉链霉菌DSM41760、稀疏链霉菌DSM 40356 和马来西亚链霉菌DSM14702 等4 株参考菌株在基因组大小、GC含量、基因编码密度等方面非常相似,表明小串链霉菌XG40 具有链霉菌的典型特征。不同菌株在CDS 数目、rRNA 基因数目、假基因数目方面存在一些差异,表明菌株处在不同进化阶段,进化过程中丢失或新获得了一些不同的基因。

对16 株链霉菌的全基因组序列进行ANI 分析,结果表明,XG40 与16 株链霉菌的ANI 值均在80%以上,与根霉链霉菌DSM 41760、马来西亚链霉菌DSM 14702、黑孢链霉菌DSM 40318和陆源链霉菌ATCC 53653 的ANI 值较高,均在85%以上,分别为85.70%、85.58%、85.54%和85.06%。采用Geneious 软件对XG40 和4 株ANI值较高的链霉菌进行全基因组比对分析(图6),5 株链霉菌基因组之间存在共线性,XG40 与根霉链霉菌DSM 41760 基因组之间有35 个局部共线区(locally collinear blocks, LCBs),与马来西亚链霉菌DSM 14702、黑孢链霉菌DSM 40318 和陆源链霉菌ATCC 53653 基因组之间各有46、47、49 个局部共线区。XG40 与4 株菌的基因组之间存在较多的插入和缺失、倒位、易位等基因组重排事件,其中,XG40 相对于其他4 株菌的基因组存在3 个较大的DNA 片段(分别为0.9 Mb、0.85 Mb、0.5 Mb)插入和易位,分析发现,三原霉素、尼日利亚菌素和褐黄癌菌素V 等生物合成基因簇分别位于3 个DNA 片段上,因此推断此插入和易位可能是因为XG40 存在合成三原霉素、尼日利亚菌素和褐黄癌菌素V 的关键编码基因,从而介导其生物合成。

3 讨论

由于全基因组测序技术取得的长足发展,测序时间大大缩短且测序成本不断下降,研究者可以快速经济地完成微生物全基因组测序和生物学功能注释[25-26]。本研究通过第三代PacBio 全基因組测序分析,结果表明,小串链霉菌XG40 基因组全长9 772 324 bp,GC 含量为70.58%,编码8074 个基因,与模式菌株天蓝色链霉菌(A3)2及其他拮抗链霉菌相近,表明小串链霉菌XG40具有链霉菌的典型特征。本研究对小串链霉菌XG40 进行全基因组测序分析,有助于从分子水平了解其生物学功能和次级代谢产物的合成潜力,为解析其高效的防病机制奠定基础。

链霉菌能够产生具有生物活性的次级代谢产物和酶,在生物防治方面具有良好的应用潜力。通过全基因组测序等高通量测序手段,解析链霉菌属次级代谢产物合成途径已经成为一种趋势[1, 8]。本研究中小串链霉菌XG40 基因组中有8074 个基因,eggNOG 数据库中有6033 个蛋白序列得到注释,其中有300 个基因参与次级代谢产物合成、转运和代谢,占注释到总基因的4.97%。通过antiSMASH 软件预测到XG40 基因组有46 个次级代谢产物生物合成基因簇。基因簇类型有T1PKS、T2PKS、NRPS、NRPS-T1PKS、NRPS-T2PKS、铁载体、萜烯、γ-丁内酯、镧肽、黑色素、四氢嘧啶、β-莱克酮、芳基聚烯烃和吲哚等。放线菌产生的抗虫剂、抗菌剂、抗癌剂等大部分功能性化合物由PKS 和NRPS 两种代谢途径合成[27-28]。本研究发现的具有抗菌活性的尼日利亚菌素和褐黄癌菌素V 合成基因簇均是由PKS 代谢途径合成。通过比对尼日利亚菌素基因簇中各个基因片段发现,小串链霉菌XG40 的尼日利亚霉素基因簇的基因与紫黑链霉菌Tu 4113 中对应的基因均具有较高的相似性,具有合成尼日利亚霉素的潜力。研究表明紫黑链霉菌(S. violaceusniger)YCED9 产生的尼日利亚菌素可以抑制腐霉菌、镰孢菌和核盘菌等病原真菌的生长[21]。吸水链霉菌(S.hygroscopicus)BRM10 产生的尼日利亚菌素可以抑制金黄色葡萄球菌、蜡样芽孢杆菌、大肠杆菌和铜绿假单胞菌等细菌的生长[29]。此外,徐婷[30]利用生物信息学分析和LC/MS 研究表明吸水链霉菌(S. hygroscopicus)OsiSh-2 能产生尼日利亚菌素,其对稻瘟病菌有一定的抑制效果。通过比对褐黄癌菌素V 中各个基因片段发现,除gilS、gilN、gilL 基因外,小串链霉菌XG40 的褐黄癌菌素V 基因簇的其他基因与灰黄链霉菌Tu4000 中对应的基因相似性均较高,具有一定的合成褐黄癌菌素V 能力。研究发现,褐黄癌菌素V对金黄色葡萄球菌、枯草杆菌、肺炎链球菌、粪链球菌及变形杆菌等革兰氏阳性细菌均有较强的抑制活性[23-24]。小串链霉菌XG40 基因组中这些与抗菌相关活性物质合成基因簇的发现,为小串链霉菌XG40 的生防作用机制提供了新的思路。该菌株具备一定的合成尼日利亚菌素和褐黄癌菌素V 等抗菌物质的能力,后续将探讨小串链霉菌XG40 中尼日利亚菌素和褐黄癌菌素V 等次级代谢产物的结构鉴定以及生防机制研究。

为挖掘小串链霉菌XG40 与其他链霉菌的特性及共性,本研究对小串链霉菌XG40 和其他16株链霉菌进行比较分析,结果表明,小串链霉菌XG40 基因组的基本特征与其他链霉菌属菌株非常相似,符合链霉菌的基本特征。小串链霉菌XG40 与根霉链霉菌DSM 41760、马来西亚链霉菌DSM 14702、黑孢链霉菌DSM 40318 和陆源链霉菌ATCC 53653 基因组进行共线性比较分析发现,5 株链霉菌基因组之间存在局部共线区,同时存在较多的插入和缺失、倒位、易位等基因组重排事件,基因组之间具有保守性,又具有独特性。本研究发现17 株链霉菌中特有基因数目较多,表明菌株处在不同进化阶段,进化过程中丢失或新获得了一些不同的基因,该属在长期进化的过程中具有较高程度的水平基因转移现象。本研究为深入了解链霉菌次级代谢合成途径提供了参考信息,为进一步挖掘小串链霉菌XG40 的生防潜力提供有力依据。