APP下载

基于高通量测序的真核微藻多样性质控分析

2019-12-03伦,吴景,李楠,孙明,杜静,王

水产科学 2019年6期
关键词:微藻数据量藻类

宋 伦,吴 景,李 楠,孙 明,杜 静,王 鹏

( 1.哈尔滨工业大学 环境学院,城市水资源与水环境国家重点实验室,黑龙江 哈尔滨 150090; 2.辽宁省海洋水产科学研究院,辽宁省海洋生物资源与生态学重点实验室,辽宁 大连 116023 )

海洋微藻是海洋生态系统中物质循环和能量流动的基础,是生命和非生命系统联系的关键环节,同时也是赤潮、褐潮暴发的致灾种[1-2]。由于微藻采样和显微镜精度限制,传统的形态学鉴定对微藻多样性的挖掘存在较大局限性。褐潮的暴发引起了诸多学者对微微型藻类多样性的关注,早期的分子鉴定技术虽可增加目标种类的鉴定准确度,但对物种多样性的种类挖掘尚显逊色。高通量测序技术具有简单快速、测序通量高、错误率低和成本低等特点,为微藻的多样性检测提供了新手段。18S rDNA是真核生物中具有信息和功能两种作用的核糖体编码基因[3],由保守区和9个可变区交替排列组成[4],可作为物种鉴定的分子标记。国内外以18S rDNA作为分子标记使用高通量测序技术分析藻类多样性的研究已有报道。

2000年,国内学者针对微型和微微型浮游藻类建立了18S rDNA克隆文库,分析了浮游藻类的多样性[5-6]。2011年,于杰等[7]建立了微型浮游生物的18S rDNA可变区V9的克隆文库并进行测序,发现褐潮是由抑食金球藻(Aureococcusanophagefferens)和多形微眼藻(Minutocelluspolymorphus)共同形成。2015年,也有学者对渤海海域[6]及我国东海靠近济州岛海域[8]真核浮游植物群落组成和多样性进行了研究。Stoeck等[9]采用高通量测序方法分析了海水中真核生物群落,并比较了18S rDNA的V9区和V4区对群落多样性研究的差异,结果显示,V4区在生物多样性研究的准确性中有一定优势。

以往454测序平台以读长优势广泛应用于18S rDNA测序领域,随着Hiseq平台双端PE250测序策略的发展,读长不断增长,使得基于HiSeq测序研究物种多样性的准确性大幅度提高[5]。利用HiSeq平台对18S rDNA的一个或多个高变区测序,具有测序深度高、利于鉴定低丰度群落物种以及费用低的特点,已成为研究微生物群落多样性的首选之策[10-11]。目前有关微藻的高通量测序鉴定技术已有较多应用,但在鉴定序列聚类水平等方面尚存在争议[12]。微生物多样性研究中多采用97%以上的聚类水平[11,13],真核微藻多样性的研究中97%的聚类水平应用较多[8-9]。同时研究者对不同分类水平下微藻多样性的差异进行了比较,并指出高的聚类水平可能会引入更多的误差,所以应作适当筛选[9]。笔者结合辽东湾真核微藻的高通量测序结果,比较不同序列聚类水平对真核微藻多样性研究的影响,并展示97%聚类水平下辽东湾海域浮游植物多样性,以期进一步优化真核微藻的分子鉴定技术。

1 材料与方法

1.1 样品采集及制备

2014年5月在辽东湾西、中、东侧海域分别网格化设置:靠近西岸LS01~05组(LS组)、远岸OS01~05组(OS组)、靠近东岸RS01~07组(RS组),3组17个调查站位(图1)。每站采集表层海水1 L经0.22 μm微孔滤膜收集浮游生物样本,最后将滤膜转移至1.5 mL无菌离心管中,置于-20 ℃或-80 ℃冷冻保存、运输。同时采集0.5 L水样5%甲醛固定用于微藻种类及数量镜检。

图1 辽东湾采样站位示意

1.2 分析方法

1.2.1 基因组DNA的提取

采用CTAB法提取真核微藻宏基因组,DNA含量及纯度检测合格后于-20 ℃冰箱保存备用,具体检测步骤参考文献[14]。

1.2.2 18S rDNA可变区V4的PCR扩增

利用自行开发的真核微藻18S rDNA的V4区基因扩增引物进行PCR反应,产物检测合格后构建文库,再经过Qubit定量和文库检测,合格后使用Hiseq2500 PE250进行上机测序,具体步骤参考文献[14]。

1.2.3 数据分析

测序得到的原始数据使用FLASH软件进行拼接,参照Qiime软件质量控制流程将拼接后的序列经过截取、过滤得到有效数据。利用Uparse对有效数据进行可操作分类单元(OTUs)聚类和物种分类,采用RDP Classifier方法与SILVA数据库对可操作分类单元代表序列进行物种注释[15]。

公式计算、数据分析、方差检验、图件绘制均通过Microsoft Excel 2007和SPSS 19.0、PRIMER 5.0软件完成。

2 结 果

2.1 测序数据质量分析

通过Illumina HiSeq 2500测序平台进行PE250模式测序得到的原始数据,存在一定比例的干扰数据,为使信息分析的结果更加准确、可靠,首先使用FLASH软件对原始数据进行拼接,参照Qiime软件质量控制流程,将拼接后的序列经过截取、过滤得到有效数据。数据处理过程中各步骤得到的统计结果见表1。每个样品获得的原始序列经过拼接和质量过滤,高质量序列数均达到87%以上,最终可用于后续分析的序列数中碱基质量值大于20(测序错误率小于1%)和30(测序错误率小于0.1%)的碱基占比分别达到了98%和97%以上,表明测得的数据准确可靠。

2.2 序列聚类水平优化

随后基于有效数据进行可操作分类单元聚类和物种分类分析。为研究各样本的物种组成,对所有样本的有效序列进行可操作分类单元聚类注释,分别以97%、98%、99%的一致性进行可操作分类单元聚类,研究不同聚类水平对真核微藻多样性统计差异的影响。结果表明,随着聚类水平的上升,获得注释的物种数量也随之增加,97%聚类水平共获得注释的可操作分类单元777个,98%聚类水平共获得注释的可操作分类单元996个,99%聚类水平共获得注释的可操作分类单元1705个,99%聚类水平获得注释的可操作分类单元显著高于97%和98%(P>0.01),而97%和98%聚类水平获得注释的可操作分类单元差异不显著(P<0.05)(图2)。

为评估各聚类水平对目标物种丰度的鉴定准确度,将镜检丰度较高、各站位均出现的夜光藻作为评估对象,夜光藻在不同聚类水平下各站位丰度占比及与镜检值拟合度分析见图3。结果表明,以各站位镜检夜光藻丰度占比为基准值,97%聚类水平获得的夜光藻注释丰度占比拟合度最高(r2=0.9239),98%、99%聚类水平反而依次下降。由于PCR、测序中不可避免的错误,或无法追踪基因组内多态性,减少高聚类水平注释物种多样性的误差,笔者应用了宽泛的聚类水平进行物种注释分析(97%水平)。

表1 测序质控数据

注:*Q20和Q30:序列中碱基质量值大于20(测序错误率小于1%)和30(测序错误率小于0.1%)的碱基所占的百分比;**%:过滤低质量和短长度后的序列数的数目与原始下机的序列数数目的百分比.

图2 不同聚类水平下各站位注释的可操作分类单元数量变化

图3 夜光藻在不同聚类水平和镜检下丰度占比

2.3 测序数据量合理性

为评估物种测序数据量的合理性,从样本中随机抽取一定测序量的数据,统计它们所代表物种的数目(即可操作分类单元数目),以抽取的测序数据量与对应的物种数来构建稀释曲线。同时为考察所检测物种丰度数据量的合理性,将样本中的可操作分类单元按相对丰度由大到小排序得到对应的排序编号,再以可操作分类单元的排序编号为横坐标,可操作分类单元中的相对丰度为纵坐标,将这些点用折线连接即绘制得到等级聚类曲线。在水平方向上,物种的丰富度由曲线的宽度来反映,物种的丰富度越高,曲线在横轴上的跨度越大;在垂直方向上,曲线的平滑程度,反映了样本中物种的均匀程度,曲线越平缓,物种分布越均匀[16]。结果表明,可操作分类单元相对丰度在10-4以下时,曲线趋于平缓,说明测序数据量已趋于合理,再多的数据量对群落整体丰度影响不大。按LS、OS、RS 3组进行稀释曲线和等级聚类曲线分析见图4。结果显示,3组随机抽取的测序条数达到15 000条时,曲线趋向平坦,说明测序数据量渐进合理,其中辽东湾西、东两侧的LS、RS站位获得的可操作分类单元数量趋势一致,均较中间海域的OS站位获得的可操作分类单元数量高。同样,3组站位可操作分类单元相对丰度在10-4以下时,曲线趋于平缓,说明测序数据量已趋于合理,其中RS站位曲线相对平缓,物种分布比较均匀(图5)。

利用稀释曲线和等级聚类曲线评估测序数据量的合理性。稀释曲线主要关注物种α多样性的挖掘程度,当曲线趋向平坦,说明测序数据量渐进合理,增加测序数据量浪费时间和成本。等级聚类曲线主要关注物种β多样性,在垂直方向上,曲线趋于平缓,说明测序数据量已趋于合理,无需增加测序时间和成本。本研究对辽东湾的测序量无论站位评估还是组内评估均达到合理水平。

2.4 辽东浮游植物名录、分布及特征

根据高通量测序结果,笔者整理了种水平辽东湾浮游植物名录、分布及特性(表 2)。名录包含90种藻类,通过比较发现,辽东湾西岸(LS组)与东岸的浮游植物种类数更相近,比中部海域(OS组)站位种类丰富,包括古多甲藻(Archaeperidiniumsaanichi)、凯聪杜波斯克藻(Euduboscquellacachoni)、伊姆裸甲藻(Gymnodiniumimpudicum)、五刺多甲藻(Peridiniumquinquecorne)、涡轮共甲藻(Syndiniumturbo)、球半隐藻属藻类(Hemiselmisbrunnescens)、恩诺巴夫藻(Pavlovaennorea)、硅鞭藻纲藻类(Ciliophrysinfusionum)、中华拟根管藻(Rhizosoleniasimiloides)、近囊胞藻(Paraphysomonasvestita)。辽东湾西岸与东岸的藻类分布也有差异,其中包括古多甲藻、多纹膝沟藻(Gonyaulaxpolygramma)、平行原多甲藻(Protoperidiniumpellucidum)、南极衣藻(Chlamydomonasraudensis)等10种藻类。本次调查中发现7种导致鱼类死亡的藻类,25种引发过赤潮或者褐潮的藻类,21种含有毒素的藻类(表2)。

图4 稀释曲线

图5 等级聚类曲线

分类地位学名站位LSOSRS毒害性所含毒素甲藻门甲藻纲红哈卡藻(Akashiwosanguinea)+++B, FHEM相关亚历山大藻(Alexandriumaffine)+++BPSP伪亚历山大藻(A.fraterculus)+++BPSP李氏亚历山大藻(A.leei)+++PSP假性亚历山大藻(A. pseudogoniaulax)+++BPSP古多甲藻+凯聪杜波斯克藻++刺毛杜波斯克藻(E.crenulata)+++多纹膝沟藻+B, FHEM具刺膝沟藻(G.spinifera)+++BYTX底刺膝沟藻(G.verior)+++伊姆裸甲藻++BPSP无纹裸甲藻(G.instriatum)+++PSP微型裸甲藻(G.microreticulatum)+++PSP微小卡罗藻(Karlodiniummicrum)+++B,FHEM帕氏帆甲藻(Kofoidinium cf. pavillardii)+++多边舌甲藻(Lingulodiniumpolyedrum)+++YTX夜光藻(Noctilucascintillans)+++B, F五刺多甲藻++B, F圆秃顶藻(Phalacromarotundatum)+++科夫多沟藻(Polykrikoskofoidii)+++斯氏多沟藻(P.schwartzii)+++B海洋原甲藻(Prorocentrummicans)+++微小原甲藻(P.minimum)+++BDSP网状原角藻(P.reticulatum)+++YTX双角多甲藻(Protoperidiniumbipes)+++单卷原多甲藻(P.monovelum)+++平行原多甲藻++B三角原多甲藻(P.tricingulatum)+++斯氏扁甲藻(Pyrophacussteinii)+++B涡轮共甲藻++绿藻门绿藻纲南极衣藻++单针藻(Monoraphidiumcontortum)+++绿藻类麦可属(Mychonasteshomosphaera)+++绿枝藻纲塔形藻(Cymbomonastetramitiformis)+++微微型藻类(Dolichomastixtenuilepis)+++青绿藻(Mamiellagilva)+++细小微胞藻(Micromonaspusilla)+++B双鞭绿藻(Nephroselmispyriformis)+++

续表2

分类地位学名站位LSOSRS毒害性所含毒素绿枝藻纲单细胞球状绿藻(Ostreococcustauri)+++B具翅冠突藻(Pterospermacristatum)+++密球藻(Pycnococcusprovasolii)+++四嘴塔胞藻(Pyramimonastetrarhynchus)++共球藻纲尖粒藻(Amphikrikos cf. nanus)+++小球藻(Chlorellavulgaris)+++喜糖椭圆球藻(Chloroidiumsaccharophilum)+++石莼纲藻类(Dilabifilumarthropyreniae)+++球半隐藻属藻类(H.brunnescens)+球半隐藻属藻类(H.cryptochromatica)+++海洋白隐藻(Leucocryptosmarina)+++双尖全沟藻(Teleaulaxamphioxeia)+++尖尾全沟藻(Teleaulaxgracilis)+++隐藻门隐藻纲恩诺巴夫藻++普林藻纲草莓定鞭金藻(Haptolinafragaria)+++球等鞭金藻(Isochrysisgalbana)++鱼腥棕囊藻(Phaeocystiscordata)+++FHEM球形棕囊藻(Phaeocystisglobosa)+++B, FHEM浮生藻纲抑食金球藻+++BEPS硅鞭藻纲弧形无柄钟藻(Apedinellaradians)+++硅鞭藻纲藻类(Ciliophrysinfusionum)++小鞭毛虫(Florenciellaparvula)+++硅鞭藻纲藻类(Pseudochattonellafarcimen)+++弹性假柄钟藻(Pseudopedinellaelastica)+++硅藻门中心硅藻纲冰河拟星杆藻(Asterionellopsisglacialis)+++B长角四棘藻(Attheyalongicornis)++大洋角管藻(Cerataulinapelagica)+++钙质角毛藻(Chaetoceroscalcitrans)+++并基角毛藻(C.decipiens)+++牟氏角毛藻(C.muellerii)+++布氏双尾藻(Ditylumbrightwellii)+++B柔弱几内亚藻(Guinardiadelicatula)+++B泰晤士旋鞘藻(Helicothecatamesis)+++中华拟根管藻++曼氏骨条藻(Skeletonemamenzellii)+++塔形冠盖藻(Stephanopyxisturris)+++海链藻属藻类(Thalassiosiraconcaviuscula)+++大洋海链藻(T.oceanica)+++羽纹藻纲新月柱鞘藻(Cylindrothecaclosterium)+++B

续表2

分类地位学名站位LSOSRS毒害性所含毒素羽纹藻纲翼茧形藻(Amphiprora alata)+++奇异楔形藻(Licmophoraparadoxa)+++中型斜纹藻(Pleurosigmaintermedium)+++斜纹藻属藻类(P.planktonicum)+++中华齿状藻(Odontellasinensis)+++金藻门金藻纲黄金色鞭毛藻(Poterioochromonasmalhamensis)+++HEM近囊胞藻++针胞藻纲海洋卡盾藻(Chattonellamarina)++BHEM日本纤囊藻(Fibrocapsajaponica)+++BNSP真眼点藻纲微拟球藻(Nannochloropsisgaditana)++颗粒微拟球藻(N.granulata)+++黄藻门黄藻纲赤潮异弯藻(Heterosigmaakashiwo)+++BHEM

注:+.此站位出现; B.藻华暴发; F.致鱼死; HEM.溶血素; PSP.麻痹性贝类中毒; DSP.腹泻性贝毒; NSP.神经性贝毒; YTX.虾夷扇贝毒素.

3 讨 论

3.1 测序数据质量对真核微藻多样性质控的影响

自DNA样本到最终数据获得的过程中,样本检测、PCR、纯化、建库、测序每一个环节都会对数据质量和数量产生影响,而数据质量又会直接影响后续信息分析的结果。为了从源头上保证测序数据的准确性、可靠性,应对样本检测、建库、测序每一个试验步骤严格把控,从根本上确保高质量数据的产出。本研究在辽东湾17个站位每个样品获得的高质量序列数均达到87%以上,用于注释的序列数达97%以上,表明测得的数据准确可靠。

3.2 序列聚类水平对真核微藻多样性质控的影响

笔者研究了97%、98%、99%不同聚类水平对真核微藻多样性统计差异的影响发现,虽然随着聚类水平的上升,获得注释的物种数量也随之增加,但增加的部分丰度很低,均无法获得注释(未获培养的种类)。通过显微镜检测方法检测夜光藻的丰度,并以此为基准值,与高通量测序方法获得的夜光藻丰度进行比较,发现97%聚类水平获得的夜光藻注释丰度占比拟合度最高。由于测序过程中存在一些不可避免的错误,如核苷酸误读,可能由于Taq聚合酶错误或测序技术错误导致[17]。在380 bp序列中无法追踪到的基因组内多态性和PCR重组的发生率也不可避免,这可能会导致对新物种和多样性的高估[15]。另外,目前许多微藻分子测序鉴定文献均使用97%一致性聚类水平,因此,为避免物种多样性的高估,增加与相关研究文献的可比性[18-19],建议使用相对宽泛的聚类水平(97%)进行序列聚类分析。97%的聚类水平下,利用稀释曲线和等级聚类曲线评估测序数据量的合理性。稀释曲线主要关注物种α多样性的挖掘程度,当曲线趋向平坦,说明测序数据量渐进合理,增加测序数据量浪费时间和成本。等级聚类曲线主要关注物种β多样性,在垂直方向上,曲线趋于平缓,说明测序数据量已趋于合理,无需增加测序时间和成本。本研究对辽东湾的测序量无论站位评估还是组内评估均达到合理水平。

3.3 辽东湾浮游植物名录、分布及特征

根据3种聚类水平的比较结果,整理了97%水平下辽东湾浮游植物种类,名录包含90种藻类。通过比较发现,辽东湾西岸(LS组)与东岸(RS组)的浮游植物种类更相近,比远离岸边的站位(OS组)种类要多,辽东湾西岸与东岸的藻类分布也有差异。浮游藻类分布的差异,可能是藻类本身特性影响,对营养物质不同造成的,也可能是调查中的差异操作造成的,仍需要多次调查进行证实。该次调查中,发现7种导致鱼类死亡的藻类,25种引发过赤潮或褐潮的藻类,21种含有毒素的藻类(表2)。本次在辽东湾海域发现的红哈卡藻,是一种赤潮藻,曾在佛罗里达和南加州海岸附近引发赤潮[20]。抑食金球藻可产生一种抑制双壳类动物摄食的胞外多糖,使硬壳蛤(Mercenariamercenaria)、海湾扇贝(Argopectenirradians)、紫贻贝(Mytilusgalloprovincialis)等纤毛活动受到抑制,进而停止摄食,最终大量死亡[21]。球形棕囊藻在福建、广东沿海大量暴发,导致约6×104t鱼的死亡[22]。本次调查发现,多种含有毒素的藻类,例如李氏亚历山大藻、无纹裸甲藻、微型裸甲藻等含有麻痹性贝毒,具刺膝沟藻、微小卡罗藻、鱼腥棕囊藻等含有溶血素,日本纤囊藻含有神经性贝毒。这些含有毒素的藻类在没有大规模暴发时,暂时不会对水环境和生物造成危害,但仍存在潜在的风险,需要连续的调查和监测。

高通量测序检测的藻类DNA信息大部分未能注释到种,主要原因是由于很多种类尚未录入数据库,导致注释到种的成功率较低。虽然扩增区域、引物、PCR、扩增效率、读长解析和数据库等因素会影响微藻分子鉴定准确度[23],但相比传统形态学镜检方式,分子鉴定对物种多样性的发掘已有很大提升,尤其对微型、微微型藻类的发现提供了科学手段,同时大大降低了形态学鉴定的人为主观误差。随着高通量测序技术的发展,测序通量不断增大,测序片段长度也可逐渐增长,数据库会逐渐完善,物种注释的准确度也会逐渐提升。

猜你喜欢

微藻数据量藻类
碳酸酐酶胞外酶影响下的岩溶湖泊微藻碳汇研究
代食品运动中微藻的科研与生产
藻类水华控制技术及应用
基于大数据量的初至层析成像算法优化
微藻,跨界小能手
细菌和藻类先移民火星
高刷新率不容易显示器需求与接口标准带宽
动物体内有植物
宽带信号采集与大数据量传输系统设计与研究
吃蔬菜有个“321模式” 三两叶菜类,二两其他类,一两菌藻类