APP下载

烟草基因组计划进展篇:1.烟草全长cDNA文库的构建及分析

2013-01-26龚达平

中国烟草科学 2013年1期
关键词:中国烟草文库克隆

龚达平

(中国农业科学院烟草研究所,青岛 266101)

全长cDNA文库代表的是mRNA的完整拷贝,能提供完整的基因编码区信息,揭示基因的表达水平,特别是基因组测序完成后对辅助基因注释和开展功能基因研究具有重要作用。普通烟草(Nicotiana tabacum)为异源四倍体植物,基因组大小约 4.5G,基因组结构高度复杂。美国烟草基因组计划对四倍体烤烟品种采用甲基过滤法测序只获得了部分基因序列信息[1]。我国烟草基因组计划完成了对普通烟草的两个祖先种绒毛状烟草(N.tomentosiformis)和林烟草(N.sylvestris)全基因组序列图谱的绘制,更充分地验证了烟草基因组结构高度复杂这一事实[2]。美国烟草基因组计划以及欧洲和日本烟草测序项目通过构建各种烟草不同发育时期的多个cDNA文库对基因组数据信息进行了补充[3]。目前,在GenBank数据库中登录的烟草表达序列标签(expressed sequence tags,ESTs)超过30万条,但关于烟草全长cDNA文库的规模化构建和测序分析报道较少。烟草全长cDNA文库的构建及测序是我国烟草基因组计划的重要研究内容,目前也取得了较大进展。

1 烟草cDNA文库构建

采用cap-trapper、SMART和CloneMiner等多种方法,构建了普通烟草红花大金元、净叶黄、小黄金1025、大白筋599、K326、白肋21、Basma等品种以及绒毛状烟草、林烟草、残波烟草(N.repanda)和非洲烟草(N.africana)等烟草野生种幼苗期、旺长期、成熟期叶片、腺毛、腋芽、根、花等组织器官的全长cDNA文库和均一化文库[4-6]。此外还构建了马铃薯Y病毒、黑胫病抗性差减杂交文库,共建成多种烟草材料的不同发育时期不同组织的cDNA文库32个[7-8]。为进一步获得基因信息和筛选重要功能基因,对其中4个cDNA文库进行了EST测序和生物信息学分析,同时还开展了绒毛状烟草、林烟草、耳状烟草(N.otophora)和栽培烟草的根、茎、叶、花等主要组织共16个样品的转录组测序及分析。

2 烟草EST测序分析

对红花大金元幼苗期叶片全长cDNA文库共测序5280个克隆,获得5233个高质量EST序列,平均长度518 bp,拼接出3922个非冗余基因(unigene),其中3519个基因具有功能注释,通过同源基因比较法确认,1124个非冗余基因是全长的完整基因[4]。对普通烟草品种K326腺毛全长cDNA文库进行5’端测序,得到有效序列5139条,拼接出2831个非冗余基因。对林烟草共测序11 232个克隆,获得长度大于100 bp的高质量序列 10 503条,平均序列长度为 671 bp;通过组装得到重叠群(contigs)1408条和单一序列(singlets)4293条,共得到5701个非冗余基因,其中全长基因数量为1611条。对绒毛状烟草共测序11 293个克隆,获得长度大于100 bp的高质量序列10 450条,平均序列长度为641 bp;通过组装得到重叠群1202条,单一序列3606条,共得到4808个非冗余基因,其中全长基因数量为1639条。

3 烟草分子标记开发

简单重复序列(simple sequence repeat,SSR)和单核苷酸多态性(single nucleotide polymorphism,SNP)标记是目前应用最为广泛的两种分子标记。基于普通烟草EST序列的冗余性,结合SNP位点所在序列的文库和品种信息以及多个SNP位点的共分离分值,鉴定了大量的编码区SNP(coding SNP,cSNP)[9]。共计317 175条普通烟草EST拼接成至少包含4个读长的重叠群15 429个,鉴定出53 477个冗余度大于2的候选SNP,烟草中出现SNP的频率为0.34%。其中SNP的转换率大于颠换率,插入/删除表现出A/T偏好。此外,还鉴定了包含2~6个碱基重复单元的SSR位点11 869个。其中,单一类型和复合类型的SSR分别是1209个和945个,大多数序列只包含一个SSR位点。最为丰富的SSR重复单元是AG(2494个)和AAG(1576个),分别占二核苷酸重复和三核苷酸重复的21.1%和13.3%。大约每0.8 Kb长度的序列中存在 1个 SSR。基于 EST序列的组装、注释和标记信息,构建了具有 blast比对和序列检索功能的Linux+Apache+MySQL+PHP烟草EST数据库系统。

4 烟草基因功能研究

基于cDNA文库和EST测序信息,鉴定了多个参与烟碱合成、抗病历程、香气代谢的关键候选基因或转录因子[4];克隆了调控烟草腋芽形成基因(NtLS)、烟草钙依赖蛋白激酶基因(NtCDPK)、烟草抗马铃薯Y病毒病相关基因(NtPsaN)等重要基因(家族),并对其组织表达特异性进行了研究,还对NtLS基因、含有核苷酸结合区(nucleotide binding site, NBS)结构的抗病基因等构建了RNAi干涉载体库并进行遗传转化,对其具体功能进行了初步研究[10-13]。

[1]Bindler G, Plieske J, Bakaher N, et al.A high density genetic map of tobacco (Nicotiana tabacumL.) obtained from large-scale microsatellite marker development[J].Theor Appl Genet., 2011, 123(2): 219-230.

[2]国家烟草专卖局.中国烟草基因组计划取得重大突破:绒毛状烟草和林烟草全基因组序列图谱完成[EB/OL].2011.http://www.tobaccoinfo.com.cn/zhxx/spgdgg/2011/12/78013.shtml.

[3]Edwards K D, Bombarely A, Story G W, et al.TobEA: an atlas of tobacco gene expression from seed to senescence[J].BMC Genomics, 2010, 11(1): 142-157.

[4]龚达平,解敏敏,孙玉合.烟草叶片全长cDNA文库构建及EST序列分析[J].中国农业科学,2012,45(9):1696-1702.

[5]崔红,冀浩,张华,等.烟草腺毛全长cDNA文库的构建[J].厦门大学学报,2006,45(6):859-862.

[6]蔡刘体,胡重怡,张永春,等.烤烟品种江南3号均一化全长文库构建[J].生物技术,2011(2):45-47.

[7]周佳.烟草抗马铃薯Y病毒病SSH文库构建及相关基因研究[D].北京:中国农业科学院,2010.

[8]苏振刚,杨爱国,孙玉合,等.黑胫病菌诱导的烟草SSH文库构建及其分析[J].作物学报,2011,37(10):1763-1770.

[9]龚达平,王鲁,李凤霞,等.基于EST序列的烟草cSNP发掘[J].中国烟草科学,2012,33(6):61-65.

[10]王卫锋,太帅帅,王鲁,等.烟草NtLS基因RNA干扰表达载体的构建及遗传转化[J].中国烟草科学,2011,32(4):31-35.

[11]张丽,张磊,康乐,等.绒毛状烟草钙依赖蛋白激酶基因家族分析[J].中国烟草科学,2012,33(3):56-62.

[12]周佳,李凤霞,陈帅,等.烟草抗马铃薯Y病毒病相关基因NtPsaN的克隆及表达分析[J].中国农业科学,2010,43(6):3323-3330.

[13]杨帆,李凤霞,孙玉合,等.烟草抗病毒相关R基因RNAi表达载体的构建[J].中国烟草科学,2012,33(1):23-26.

猜你喜欢

中国烟草文库克隆
克隆狼
"中国烟草科教网"平台简介
专家文库
浙江:诞生首批体细胞克隆猪
优秀传统文化启蒙文库
关于推荐《当代诗坛百家文库》入选诗家的启事
基于完全垄断体制下的中国烟草企业伦理管理浅析
专家文库
《中国烟草科学》2017年征订启事
属于“我们”