APP下载

病毒宏基因组及其在鼠类肠道病毒中的研究进展

2014-01-23曹婧

中国医药生物技术 2014年6期
关键词:鼠类基因组学核苷酸

曹婧



病毒宏基因组及其在鼠类肠道病毒中的研究进展

曹婧

671000 大理学院公共卫生学院,Email:275824198@qq.com

当传统的序列测定方法还在测定某种单一种类的基因组特征时,宏基因组学(Metagenomics)却能超越种族的界限,通过单一种来探索变化多样的微生物群落。这种方法提供了一个通过已知单一样本来了解整个生物群体多样性的全局观,完全不受培养物需求的限制[1-5]。通过不懈的努力,我们发现在这一领域里病毒群落在生态系统中就像海洋一样变化多端[1, 6]。病毒宏基因组可以用于描述现存自然环境中的病毒菌群[1, 7-13],也可以描述哺乳动物粪便中的病毒[14-17]、细胞培养中的病毒[18-19]、呼吸道抽出物中的病毒[20]以及血液中的病毒[21-22]。

1 病毒宏基因组学概述

宏基因组学是近年来新兴的从基因组角度高通量分析在特定环境中所有微生物遗传组成的学科。病毒宏基因组能够探知整个生物圈中大部分的生物群体的基因多样性,并且能够消除传统病毒鉴定方法,例如 PCR 或微数列的局限性。与传统的宏基因组得到 DNA 全序列的方法相反,在病毒宏基因组的方法中,最初的病毒核酸提纯就垫定了病毒序列是否能测出的基础。病毒宏基因组能够了解病毒群体的构建,并且能发现新的基因和病毒。

2 主要技术路线

2.1 样品制备

2.1.1 提取核酸 理论上,任何种类的样品都可以被宏基因组学分析,包括海水[7]、血液[21]、马粪[16]、茎株[17]、海洋沉积物[9]、珊瑚组织[23-24]以及温泉[25]。如果我们想把病毒的 DNA 或 RNA 隔离出来单独研究,特别是想提取某一有代表性的小片段时,常常会有些困难。因为病毒基因组的长度相对较短,经常会被细菌或真核生物的核苷酸干扰。因此移除非病毒核酸是非常必要的[26]。这样我们就要集中样本中的病毒颗粒,样本必须经过混合、过滤、超速离心三个步骤。为了保证在病毒制备过程中不损失病毒,在样本的混合、过滤、氯仿处理后,要用 SYBR-金染色法来检测病毒颗粒的剩余量[26]。

2.1.2 DNA 酶处理 DNA 酶消化后通常用氯仿处理法来移除受污染的 DNA。氯仿使线粒体、细菌和真核生物的膜破裂,从而释放无病毒的 DNA 去进行下一步的核酸酶处理[27-28]。但是氯仿处理液可能会破坏保护包膜病毒的类脂膜,使它们的 DNA 被 DNA 酶消化[21]。此外,DNA 酶处理并非每次都能完全地消除样本中的无病毒 DNA[26]。提取核酸后,DNA 可能需要通过随机引物来进行放大处理[29-30]。用 whole transcriptome amplification(WTA)试剂盒能通过病毒 RNA 合成 cDNA[31]。

2.1.3 分离病毒 由 Allen 和他的研究伙伴们引进的单病毒基因组可以在测序前有选择地隔离病毒[32]。Brussaard 等[33]最先提出单病毒基因组可以通过流式细胞仪将病毒分类。不同大小的 DNA 被琼脂糖胶固定住,然后用多重置换扩增法(multiple displacement amplification)来扩增。在流式细胞术和多重置换扩增法中,也可以增加一个单病毒基因组的逆转录步骤。

2.2 高通量测序

早先的宏基因组测序法都与鸟枪法文库有关,并且通过 Sanger 酶的双脱氧测序法来获得整个 DNA 内容物的直接序列。这种方法可以探索海洋环境中的新噬菌体[34]。1977 年首次记载的 Sanger 技术是测序的标准方法[35]。新一代测序的发展提供了兼具速度、自动化、高通量的测序平台,Sanger 技术只能从一百个因子中选取一个来测序,而新技术却可以从百万因子中选取一个。

新一代的测序平台如 Illumina/Solexa 测序技术和罗氏 454 测序已经更多地应用到病毒宏基因组测序上。Illumina/Solexa 测序技术的基础是测序合成的化学作用,将样本的 DNA 片段和寡核苷酸连接物连接。连接物在载体中扮演一个引物的角色,作用是将 DNA 多聚酶和可逆的终止子核苷酸结合,每一个都用不同的荧光染料标记。一个有代表性的测序可以产生 18 G的数据,读出的核苷酸的平均长度在 75 ~ 100 bp[36]。例如甘薯杆状 DNA 病毒属(sweet potato badnavirus)和甘薯玉米线条病毒属(sweet potato mastrevirus)就是通过 Illumina/Solexa 测序平台发现的[37]。

现在为了发现和鉴定新病毒,最常使用的就是罗氏公司生产的 454 测序仪。这种平台经常用来鉴定未被记录过的真菌病毒,例如红火蚁病毒 3(solenopsis invicta virus 3)[38]、Merino Walk 病毒和新的沙粒病毒[39-40]。为了测序,必须把 DNA 变成片段,连接在被生物素酶化的特殊连接子上。DNA/连接子的合成片段连接在一个铺满抗生蛋白链菌素的串珠状固定凹上,这个固定凹能将 DNA 锁在一小滴水和PCR 碎片里,然后保存在油乳胶中。第一轮扩增中的每一个片段都是为了制造测序反应的模板。为了能够测序,在退火时将引物与模板的连接子部分合成,然后用 DNA 多聚酶将核苷酸结合,以便使互补的DNA更容易延伸。某些光感产品可以测量这一过程中释放的焦磷酸盐的量[41-42]。在DNA多聚酶介导DNA合成的过程中,罗氏 454 法把焦磷酸盐的释放作为核苷酸结合的结果。电荷耦合器件(charge-coupled device)相机可以捕捉光信号,然后将光信号转化为数字数据[43-44]。454 测序最合适的范围:大概可以读取一百万个平均长度在 350 ~ 450 bp 的核苷酸,总量在 0.4 G 左右。

2.3 生物信息学分析

在对病毒序列进行分类指令时有一个内部难题:用来建立系统树的所有病毒中并没有一个普遍对应的核苷酸成分——某个因子同时也能讨论病毒是否属于生命树[45]。在大多数的宏基因组研究中,同源性搜索通过比对储存于本地数据库或是公共数据库中记录在案的序列后,总是对高通量测序产生的序列有所疑问。更巧的是,若比对未知病毒序列,同源性搜索便会拒绝 GenBank 中的已知序列。

关于宏基因组库的分析,要求对于有争议的病毒片段能够快速地计算和正确地分析。为了保证生物信息学分析的数据都是高质量的,读取的数据都必须是经过典型处理的。处理的方法就是移除所有背景序列,包括在过滤、氯仿、DNase I 处理后仍残留的宿主和细菌的DNA[46-48]。我们从相同生物体的类似种中得到的每一个序列都是合成序列,合成序列的读取需要与严格的参数组合才能产生毗连序列群。使用一个严格的汇编参数是避免序列抗体嵌合的关键。然后将毗连序列群序列用 BLAST100 或 USEARCH101 来与 GenBank 中无多余核苷酸的数据库进行比对。如果用一个只包含病毒序列的数据库来记录这些,将不能鉴别未知的细菌、古细菌或者真核生物的序列,并且将导致对未知片段的过高评价。

由于不同研究会产生越来越多的数据,需要记录不同的病毒宏基因组,但是由于缺乏下游数据分析的标准规则,交叉宏基因数据分析法变得越来越重要[49-50]。具体方法就是要做好病毒宏基因组研究的相关报告,包括记录:①测序平台和版本号;②在原始数据库登录的原始序列数据;③关于生物信息学分析的数据,包括同源性搜索工具和用于生物分类学分配的数据和它们的版本;④已知病毒和以前未知病毒的对比,清楚地体现这个新病毒究竟是属于已经收录的种中的一个新菌株还是完全不同的病毒;⑤如果需要的话,加上因果性证据。

3 鼠类肠道病毒宏基因组的研究

人类和鼠类频繁的交互作用使两者有着共同的动物传染病。鼠类是众所周知的天然宿主,它能储存为数众多的动物源性病毒,这些病毒可以使人类患上严重的疾病。鼠携带病毒种类包括了痘病毒科()、疱疹病毒科()、腺病毒科()、多瘤病毒科()、细小病毒科()、反转录病毒科()、嗜肝 DNA 病毒科()、副黏病毒科()、沙粒病毒科()、黄病毒科()、布尼亚病毒科()、星状病毒科()、微 RNA 病毒科()和冠状病毒科()等 10 多个病毒科。我们用宏基因组这种无偏倚的方法去了解鼠类粪便中众多的病毒。Phan 等[51]最近用宏基因组学的方法,对美国捕获的 105 只鼠类标本进行了肠道病毒研究,共获得 26 846 条病毒序列(> 100 bp),包括圆环病毒科()、双生病毒科()、矮缩病毒科()、浓核病毒科()、细小病毒科、拟态病毒科()、乳头瘤病毒科()、星状病毒科、虹彩病毒科()、多分体 DNA 病毒科()、杆状病毒科()、双组分 RNA 病毒科()、微 RNA 病毒科、双顺反子病毒科()、传染性软腐病病毒()、腺病毒科、星状病毒科()、野田村病毒科()、Nora 病毒、冠状病毒科等 20 多科的病毒,其中还发现新的鼠乳头瘤病毒、圆环病毒、博卡病毒(Bocavirus)、微小核糖核酸病毒、微 RNA 病毒、星状病毒、腺病毒和腺联病毒等。用宏基因组这种方法可以大大地提升我们对鼠类中的真核病毒多样性的认识。结合宏基因组学、随机 PCR 和 454 高通量测序等技术,分析不同鼠类种群中肠道病毒群基因组组成、丰度和动态变化,可以丰富我们对自然环境中未知病毒的认识,为预防和控制一些可能发生的新发病毒性疾病的暴发和流行提供科学的指导。

4 展望

病毒宏基因组是一个能探索病毒生物学世界的新工具,并且这一领域的蓬勃发展对其他领域也有很多益处。现在科学家们在研发可以用来治疗疾病以及用于生物技术等方面的新病毒酶。病毒宏基因组在监测病毒病原体方面也有着巨大的优势,这对公众健康和食品安全也十分重要。昆虫可以通过传播媒介把目标病毒传给人类和植物,宏基因组在现有的领域可以了解病毒的循环并且能够提早发现、鉴别病毒病原体。此外,从人类粪便中得到的宏基因组数据也可作为一种新的指示剂来鉴别粪便污染的问题,对水的质量进行检测。总而言之,病毒宏基因组提供了科学的方法去探索广阔环境中的病毒,这样就可以了解病毒的多样性,了解病毒的进化过程,也能作为一种新的探测方法应用在社会生活中。

[1] Breitbart M, Salamon P, Andresen B, et al. Genomic analysis of uncultured marine viral communities. Proc Natl Acad Sci U S A, 2002, 99(22):14250-14255.

[2] Tyson GW, Chapman J, Hugenholtz P, et al. Community structure and metabolism through reconstruction of microbial genomes from the environment. Nature, 2004, 428(6978):37-43.

[3] Venter JC, Remington K, Heidelberg JF, et al. Environmental genome shotgun sequencing of the Sargasso Sea. Science, 2004, 304(5667): 66-74.

[4] Tringe SG, von Mering C, Kobayashi A, et al. Comparative metagenomics of microbial communities. Science, 2005, 308(5721): 554-557.

[5] Hallam SJ, Putnam N, Preston CM, et al. Reverse methanogenesis: testing the hypothesis with environmental genomics. Science, 2004, 305(5689):1457-1462.

[6] Culley AI, Lang AS, Suttle CA. Metagenomic analysis of coastal RNA virus communities. Science, 2006, 312(5781):1795-1798.

[7] Angly FE, Felts B, Breitbart M, et al. The marine viromes of four oceanic regions. PLoS Biol, 2006, 4(11):e368.

[8] Bench SR, Hanson TE, Williamson KE, et al. Metagenomic characterization of Chesapeake Bay virioplankton. Appl Environ Microbiol, 2007, 73(23):7629-7641.

[9] Breitbart M, Felts B, Kelley S, et al. Diversity and population structure of a near-shore marine-sediment viral community. Proc Biol Sci, 2004, 271(1539):565-574.

[10] Culley AI, Lang AS, Suttle CA. Metagenomic analysis of coastal RNA virus communities. Science, 2006, 312(5781):1795-1798.

[11] Desnues C, Rodriguez-Brito S, Rayhawk S, et al. Biodiversity and biogeography of phages in modern stromatolites and thrombolites. Nature, 2008, 452(7185):340-345.

[12] Dinsdale EA, Edwards RA, Hall D, et al. Functional metagenomic profiling of nine biomes. Nature, 2008, 452(7187):629-632.

[13] Fierer N, Breitbart M, Nulton J, et al. Metagenomic and small-subunit rRNA analyses reveal the genetic diversity of bacteria, archaea, fungi, and viruses in soil. Appl Environ Microbiol, 2007, 73(21):7059-7066.

[14] Breitbart M, Haynes M, Kelley S, et al. Viral diversity and dynamics in an infant gut. Res Microbiol, 2008, 159(5):367-373.

[15] Breitbart M, Hewson I, Felts B, et al. Metagenomic analyses of an uncultured viral community from human feces. J Bacteriol, 2003, 185(20):6220-6223.

[16] Cann AJ, Fandrich SE, Heaphy S. Analysis of the virus population present in equine faeces indicates the presence of hundreds of uncharacterized virus genomes. Virus Genes, 2005, 30(2):151-156.

[17] Zhang T, Breitbart M, Lee WH, et al. RNA viral communityin human feces: prevalence of plant pathogenic viruses. PLoS Biol, 2006, 4(1):e3.

[18] Jones MS 2nd, Harrach B, Ganac RD, et al. New adenovirus species found in a patient presenting with gastroenteritis. J Virol, 2007, 81(11): 5978-5984.

[19] Kapoor A, Victoria J, Simmonds P. A highly divergent picornavirus in a marine mammal. J Virol, 2008, 82(1):311-320.

[20] Allander T, Tammi MT, Eriksson M, et al. Cloning of a human parvovirus by molecular screening of respiratory tract samples. Proc Natl Acad Sci U S A, 2005, 102(36):12891-12896.

[21] Breitbart M, Rohwer F. Method for discovering novel DNA viruses in blood using viral particle selection and shotgun sequencing. Biotechniques, 2005, 39(5):729-736.

[22] Jones MS, Kapoor A, Lukashov VV, et al. New DNA viruses identified in patients with acute viral infection syndrome. J Virol, 2005, 79(13):8230-8236.

[23] Marhaver KL, Edwards RA, Rohwer F. Viral communities associated with healthy and bleaching corals. Environ Microbiol, 2008, 10(9): 2277-2286.

[24] Vega Thurber R, Willner-Hall D, Rodriguez-Mueller B. Metagenomic analysis of stressed coral holobionts. Environ Microbiol, 2009, 11(8): 2148-2163.

[25] Schoenfeld T, Patterson M, Richardson PM, et al. Assembly of viral metagenomes from yellowstone hot springs. Appl Environ Microbiol, 2008, 74(13):4164-4174.

[26] Thurber RV, Haynes M, Breitbart M, et al. Laboratory procedures to generate viral metagenomes. Nat Protoc, 2009, 4(4):470-483.

[27] Willner D, Furlan M, Schmieder R, et al. Microbes and health sackler colloquium: metagenomic detection of phage-encoded platelet- binding factors in the human oral cavity. Proc Natl Acad Sci U S A, 2010, 108 Suppl 1:4547-4553.

[28] Lee S, Hallam SJ. Extraction of high molecular weight genomic DNA from soils and sediments. J Vis Exp, 2009(33). pii:1569.

[29] Dean FB, Nelson JR, Giesler TL, et al. Rapid amplification of plasmid and phage DNA using Phi 29 DNA polymerase and multiply-primed rolling circle amplification. Genome Res, 2001, 11(6):1095-1099.

[30] Pinard R, de Winter A, Sarkis GJ, et al. Assessment of whole genome amplification-induced bias through highthroughput, massively parallel whole genome sequencing. BMC Genomics, 2006, 7:216.

[31] Tomlins SA, Mehra R, Rhodes DR, et al. Whole transcriptome amplification for gene expression profiling and development of molecular archives. Neoplasia, 2006, 8(2):153-162.

[32] Allen LZ, Ishoey T, Novotny MA, et al. Single virus genomics: a new tool for virus discovery. PLoS One, 2011, 6(3):e17722.

[33] Brussaard CP, Marie D, Bratbak G. Flow cytometric detection of viruses. J Virol Methods, 2000, 85(1-2):175-182.

[34] Finkbeiner SR, Li Y, Ruone S, et al. Identification of a novel astrovirus (astrovirus VA1) associated with an outbreak of acute gastroenteritis. J Virol, 2009, 83(20):10836-10839.

[35] Sanger F, Nicklen S, Coulson AR. DNA sequencing with chain-terminating inhibitors. Proc Natl Acad Sci U S A, 1977, 74(12): 5463-5467.

[36] Ansorge WJ. Next-generation DNA sequencing techniques. N Biotechnol, 2009, 25(4):195-203.

[37] Kreuze JF, Perez A, Untiveros M, et al. Complete viral genome sequence and discovery of novel viruses by deep sequencing of small RNAs: a generic method for diagnosis, discovery and sequencing of viruses. Virology, 2009, 388(1):1-7.

[38] Valles SM, Hashimoto Y. Isolation and characterization of Solenopsis invicta virus 3, a new positive-strand RNA virus infecting the red imported fire ant, Solenopsis invicta. Virology, 2009, 388(2):354-361.

[39] Palacios G, Druce J, Du L, et al. A new arenavirus in a cluster of fatal transplant-associated diseases. N Engl J Med, 2008, 358(10):991-998.

[40] Palacios G, Savji N, Hui J, et al. Genomic and phylogenetic characterization of Merino Walk virus, a novel arenavirus isolated in South Africa. J Gen Virol, 2008, 91(Pt 5):1315-1324.

[41] Meyer M, Stenzel U, Hofreiter M. Parallel tagged sequencing on the 454 platform. Nat Protoc, 2008, 3(2):267-278.

[42] Meyer M, Stenzel U, Myles S, et al. Targeted high-throughput sequencing of tagged nucleic acid samples. Nucleic Acids Res, 2007, 35(15):e97.

[43] Nyrén P. The history of pyrosequencing. Methods Mol Biol, 2007, 373:1-14.

[44] Hyman ED. A new method of sequencing DNA. Anal Biochem, 1988, 174(2):423-436.

[45] Rohwer F, Edwards R. The Phage Proteomic Tree: a genomebased taxonomy for phage. J Bacteriol, 2002, 184(16):4529-4535.

[46] Schmieder R, Edwards R. Quality control and preprocessing of metagenomic datasets. Bioinformatics, 2011, 27(6):863-864.

[47] Schmieder R, Edwards R. Fast identification and removal of sequence contamination from genomic and metagenomic datasets. PLoS One, 2011, 6(3):e17288.

[48] Schmieder R, Lim YW, Rohwer F, et al. TagCleaner: Identification and removal of tag sequences from genomic and metagenomic datasets. BMC Bioinformatics, 2010, 11:341.

[49] Field D, Garrity G, Gray T, et al. The minimum information about a genome sequence (MIGS) specification. Nat Biotechnol, 2008, 26(5): 541-547.

[50] Raes J, Foerstner KU, Bork P. Get the most out of your metagenome: computational analysis of environmental sequence data. Curr Opin Microbiol, 2007, 10(5):490-498.

[51] Phan TG, Kapusinszky B, Wang C, et al. The fecal viral flora of wild rodents. PLoS Pathog, 2011, 7(9):e1002218.

2014-04-01

10.3969/cmba.j.issn.1673-713X.2014.06.011

猜你喜欢

鼠类基因组学核苷酸
单核苷酸多态性与中医证候相关性研究进展
徐长风:核苷酸类似物的副作用
贺兰山西坡鼠种内脏重量与海拔梯度关系研究
山西在谷子功能基因组学研究领域取得重大突破
新疆和西藏少数民族的群体基因组学研究
系统基因组学解码反刍动物的演化
Acknowledgment to reviewers—November 2018 to September 2019
日粮核苷酸对动物肠道健康和免疫功能的影响及其在养猪生产中的应用
天津七里海湿地鼠类十年变化
浅谈户内变电站防鼠安全工作