APP下载

三叶木通果实转录组测序初步分析

2016-09-16刘红昌石小兵

山地农业生物学报 2016年2期
关键词:木通碱基测序

杨 航,刘红昌,石小兵,葛 菲,赵 致*,罗 辉

(1.贵州大学 生命科学学院,贵州 贵阳 550025;2.贵州大学 农学院,贵州 贵阳 550025;3.贵州省林业厅推广总站,贵州 贵阳 550001)



三叶木通果实转录组测序初步分析

杨航1,刘红昌2,石小兵1,葛菲1,赵致2*,罗辉3

(1.贵州大学 生命科学学院,贵州 贵阳 550025;2.贵州大学 农学院,贵州 贵阳 550025;3.贵州省林业厅推广总站,贵州 贵阳 550001)

为了探究三叶木通果实成熟过程中基因表达情况,本实验采用Illumina HiSeq2000高通量测序技术对三叶木通6个不同时期果实进行了转录组测序,对所获得的数据进行GO和KOG注释与分类及KEGG代谢通路分析。本实验共获得Unigene 106 547 条,在GO与KOG数据库中分别有27 302和12 014条Unigene注释成功,KEGG通路分析显示有11 749个Unigene参与到270 条已知代谢通路中,其中包括26条乙烯合成关键酶的Unigene。本实验结果可为探究三叶木通果实成熟过程中基因表达情况以及三叶木通果实成熟基因的后续研究提供重要基础。

三叶木通;果实;转录组

三叶木通(Akebiatrifoliate(Thunb.) Koidz)为木通科木通属木质藤本植物,原产于中国和日本,在我国主要分布于贵州、湖南、湖北、陕西、江西等地区[1]。三叶木通的近成熟果实可制作中药预知子[2],中药预知子的药效高低与三叶木通果实发育相关,果实发育过程即是药效成分积累过程。α-常春藤皂苷是其主要指标性成分和活性成分[3],研究表明预知子中的有效成分对肝癌细胞的恶性增殖有抑制作用[4-5]。三叶木通果皮中含有黄酮类物质[6],茎中含有酚醇类物质、三萜及三萜皂苷类物质以及多种微量元素[7-8]。近年来,针对三叶木通的研究主要集中在对其生态学、药理作用、扦插栽培、化学成分以及指纹图谱等方面[9],而基因表达方面的研究却很少见。本实验旨在为三叶木通果实基因克隆、表达分析乃至转基因等研究提参考。

1 材料与方法

1.1材料

本实验材料为野生三叶木通果实,取自贵州省贵阳市花溪区花溪乡麦乃寨,经贵州大学生命科学学院赵财副教授鉴定为木通科木通属三叶木通Akebiatrifoliate(Thunb.) Koidz。采样时间为自2014年4月起每隔一个月采样一次,共采集6个时期的果实样品。将果实采下后立即用液氮速冻,后转存于-80℃超低温冰箱中保存。

1.2RNA提取

果实样品在冷冻的研钵和研杵中手工细磨,RNA提取利用OMEGA公司生产的Plant RNA Kit (200) R6827-02试剂盒。

1.3转录组测序

测序工作委托北京诺禾致源生物信息科技有限公司完成。

1.4数据拼接

Trinity软件拼接得到转录本。取每条基因中最长的转录本作为Unigene。

1.5基因注释

将Unigene比对到Nr (NCBI蛋白序列数据库)、Nt (NCBI核酸序列数据库)、PFAM(蛋白结构域注释分类系统)、Swiss-Prot (蛋白序列数据库)、GO (基因功能描述分类系统)、KO (KEGG注释系统)、KOG (NCBI基因直系同源关系数据库)7个数据库中,进行功能注释和分类以及KEGG代谢通路分析。

2 结果与分析

2.1转录组测序数据统计

测序分为左端测序(L)和右端测序(R),样品的Raw reads数及Clean reads数均为左端测序与右端测序之和。Q20与Q30分别表示Phred 数值大于20和30的碱基占总体碱基的百分比,Phred 数值是在碱基识别过程中通过一种预测碱基判别发生错误概率模型计算得到的,一般以Q20 (对应碱基正确识别率99%)来衡量数据质量。结果显示左端测序和右端测序结果及各样品间GC含量基本一致,Phred 数值大于20的碱基占总体碱基百分比均在94%以上,测序数据质量较好(见表1)。

表1 测序数据统计

2.2结果组装

利用Trinity软件对Clean Reads进行拼接,共获得转录本193 578 条,平均长度为971 bp,N50与N90 (将拼接转录本按照长度从长到短排序,依次累加碱基数,当累计碱基数达到转录本总碱基数的50%/90%时转录本的长度为N50/N90)分别为1 681bp和379bp。取每条基因中最长的转录本作为Unigene,共获得106 547条Unigene,平均长度686 bp,N50与N90分别为1 088 bp和275 bp。总的来说,转录本与Unigene长度分布表现为长度短的转录本及Unigene数量多(表2)。

表2 拼接结果统计

2.3Unigenes功能注释

将所得Unigene在7个数据库中进行注释,每个数据库中分别注释成功的Unigene条数及其占总Unigene数的百分比如表3所示。结果显示,在Nr数据库中注释成功的Unigene最多(34 245条),在KO数据库中注释成功的Unigene最少(9 852条),在7个数据库中至少一个数据库注释成功的Unigene有39 501条,占总Unigene数的37.07%。

表3 Unigene功能注释

2.4GO分类

GO功能一般分为三个大类,即生物学过程、细胞组分和分子功能。本试验GO分析共有27 302 条Unigene注释成功,且较多的单条Unigene能够与多种基因相对应[10],其中注释到生物学过程的Unigene最多(71 428条);其次是注释到细胞组分的Unigene有50 004 条;注释到分子功能的Unigene最少(33 250条)。在三大类之下又分为55 个亚类以说明基因功能,其中细胞过程匹配Unigene最多(16 538条),其次是代谢过程和结合功能分别有15 518 条和15 200条Unigene与其匹配(图1)。

1:生物附着;2:生物调节;3:细胞损伤;4:细胞组成的组织和生物合成;5:细胞过程;6:发育过程;7:局部构建;8:生长;9:免疫系统过程;10:定位;11:移动;12:代谢过程;13:多细胞生物过程;14:多生物过程;15:负调控过程;16: 正调控过程;17:生物过程管理;18:繁殖;19:生殖过程;20:刺激应答;21:律动过程;22:信号;23:单菌种处理;24:细胞;25:细胞连接;26:细胞组分;27:细胞外基质;28:细胞外基质成分;29:胞外区;30:胞外区成分;31:大分子复合物;32:膜;33:膜封闭腔;34:膜组分;35:拟核;36:细胞器;37:细胞器组分;38:共质体;39:突触;40:突触组分;41:病毒;42:病毒组分;43:抗氧化剂活动;44:结合功能;45:催化活性;46:通道调控;47:酶调控;48: 金属伴侣活动;49:分子转导;50:核酸结合转录因子的活性;51:蛋白结合的转录因子的活性;52:分泌活动;53:受体调控;54:结构分子活性;55:转运活性

图1Unigene GO注释和分类

Fig.1GO annotation and classification ofunigenes

2.5KOG分类

将12 014 条Unigene分类到26个Group (图2),其中一般功能预测注释成功的Unigene最多(2 116 条);其次是翻译后修饰、蛋白转换、伴侣蛋白注释成功1 634 条;翻译、核糖体结构和生物起源注释成功1 020 条。仍有501条未知功能的Unigene等待进一步研究。

A:RNA 加工和修饰;B:染色体结构和动力学;C:能源生产和转换;D:细胞周期调控、细胞分裂、染色体分离;E:氨基酸转运和代谢;F:核苷酸转运和代谢;G:碳水化合物转运和代谢;H:辅酶转运和代谢;I:脂类转运和代谢;J:翻译、核糖体结构和生物合成;K:转录;L:复制重组与修复;M:胞壁/膜生物发生;N:细胞运动;O:蛋白质翻译后修饰与转运,分子伴侣;P:无机离子转运和代谢;Q:次生产物生物合成,运输及代谢;R:一般功能基因;S:未知功能;T:信号转导机制;U:胞内分泌秘膜泡运输;V:防御机制;W:胞外结构;X:未命名蛋白;Y:核酸结构;Z:细胞骨架

图2Unigene KOG注释和分类

Fig.2KOG annotation and classification ofunigenes

2.6KEGG分类

对基因做KO注释后,根据它们参与的KEGG代谢通路进行分类,将结果进行Pathway第一层分类,分为细胞过程、环境信息处理、遗传信息处理、代谢过程和有机系统五大类;在此基础上再进行Pathway第二层分类,共分为32类;在Pathway第二层分类下又分为270 个第三层分类,即KEGG pathway (表4)。结果显示,在第一层分类中,代谢过程中注释成功的Unigene数最多(5 553条),KEGG pathway也最多(133类);在第二层分类中KEGG pathway数最多的是信号传导(24类),而注释成功的Unigene数最多的是翻译过程(1 050条)。

2.7乙烯合成相关基因

乙烯是五大植物激素之一,有促进花和果实衰老以及呼吸跃变型果实成熟的作用。在植物体内甲硫氨酸是乙烯合成的前体物,甲硫氨酸在甲硫氨酸腺苷转移酶的催化下,转变为S-腺苷甲硫氨酸(SAM),SAM在ACC合酶催化下,成为1-氨基环丙烷-1-羧酸(ACC),ACC在有氧条件下, 由ACC氧化酶催化形成乙烯。而CH3S-则通过甲硫氨酸循环保留在植物组织内[11]。

KEGG通路分析显示,与甲硫氨酸腺苷转移酶、ACC合酶、ACC氧化酶有关的Unigene分别有11、12和3条(表5)。

表4 Unigene KEGG代谢途径分类

表5 乙烯合成相关Unigene

3 讨论

本实验采用Illumina HiSeq2000 技术平台对野生三叶木通果实6个不同时期样品进行转录组测序,通过对数据的分析获得三叶木通果实的Unigene 106 547 条,对基因功能注释分类及代谢通路做了初步的解析,获得了三叶木通果实中乙烯合成相关基因的序列信息。

在中药领域已有大量药用动植物进行了转录组测序,截止2014年已有超过40 种药用动植物进行了转录组的研究[12]。张绍鹏等[13]对珠子参进行了转录组测序,确定了与三萜皂苷合成相关的候选基因。祁建军等[14]对七叶一枝花进行了转录组测序研究,发现了在种子层积处理条件下胚芽与胚乳中的差异表达基因。魏麟等[15]对鱼腥草进行转录组测序研究,发现了4 800个潜在的cDNA SSR分子标记。

在李铁柱等[10]对杜仲幼果和成熟果实的转录组测序结果中,Q20值为94.08%,GC%值为47.39%。在金红等[16]对楮头红转录组测序结果中,GC%和Q20分别为 52.59%和98.33%。在赵德刚等[17]对杜仲雌雄株转录组测序结果中,GC%为35.04%和33.61%,Q20为95.47%和96.01%。本试验中GC%在94.08%到98.15%之间,Q20在43.20%到43.93%之间,与上述文献比较认为本次实验所得三叶木通果实成熟过程中转录组测序结果质量较好。

总的来说,本实验得到的三叶木通果实转录组数据,数据量较大、对比全面、数据质量较好、具有进一步深入研究的科研价值。本实验结果为研究三叶木通乙烯合成机制研究提供了参考,并为探究三叶木通果实成熟过程中基因表达情况以及三叶木通果实成熟基因的后续研究提供重要基础。

[1]马玉华,王荔. 三叶木通特性研究进展[J]. 江西农业学报,2011,23(5):71-73.

[2]国家药典委员会. 中华人民共和国药典[S]. 北京:中国医药科技出版社,2015:297.

[3]侯雄军,刘岩庭,张武岗,等. 预知子中α-常春藤皂苷提取工艺研究[J]. 中药新药与临床药理,2012,23(2):204-207.

[4]任红艳,方肇勤,梁超. 预知子籽及预知子抑制肝癌细胞恶性增殖的研究[J]. 中华中医药学刊,2014,32(6):1310-1312.

[5]白雪,关宝生,孙艳男,等. 八月札水提物对H22肝癌荷瘤鼠免疫功能的影响[J]. 中国老年学杂志,2015,35(7):1946-1948.

[6]张孟琴,张丽娜,王朝阳,等. 三叶木通果皮总黄酮的提取和含量测定的研究[J]. 食品工业科学,2010,31(1):250-253.

[7]关树光,於文博,关树宏. 三叶木通中酚醇及酚醇苷类化学成分的研究[J]. 时珍国医国药,2010,21(4):905-906.

[8]曹岚. 江西婺源三叶木通微量元素的测定[J]. 时珍国医国药,2008,19(3):544-545.

[9]吴永朋,原雅玲,肖娅萍. 三叶木通的研究进展[J]. 陕西林业科技,2013,(1):31-34.

[10]李铁柱,杜红岩,刘慧敏,等. 杜仲幼果和成熟果实转录组数据组装及基因功能注释[J]. 中南林业科技大学学报,2012,32(10):9-17.

[11]潘瑞炽. 植物生理学.第六版.[M]. 北京:高等教育出版社,2008:184-187.

[12]王尧龙,黄璐琦,袁媛,等. 药用植物转录组研究进展[J]. 中国中药杂志,2015,40(11):2055-2061.

[13]张绍鹏,金健,胡炳雄,等. 珍稀药用植物珠子参的转录组测序及分析[J]. 中国中药杂志,2015,40(11):2084-2089.

[14]Qi J,Zheng N,Zhang B,etal. Mining genes involved in the stratification ofparisPolyphyllaseeds using high-throughput embryo transcriptome sequencing[J].BMCGenomics,2013,14(1):358.

[15]Wei L,Li S,LiuS,etal. Transcriptome analysis ofHouttuyniacordataThunb. by illumine paired-end RNA sequencing and SSR marker discovery[J].PLOSONE,2014,9(1) :e84105.

[16]金红,焦根林,陈刚. 基于RNA-seq技术的楮头红转录组分析[J]. 生物技术通报,2015,31(5):84-92.

[17]赵德刚,李岩,赵懿琛,等. 杜仲雌雄株转录组测序数据组装及基因功能注释[J]. 山地农业生物学报,2015,34(1):1 -12.

Transcriptome Analysis ofAkebiatrifoliatein Ripening Process

YANGHang1,LIUHong-chang2,SHIXiao-bing1,GEFei1,ZHAOZhi2*,LUOHui3

(1.CollegeoflifesciencesGuizhouUniversity,Guiyang,Guizhou550025,China; 2.CollegeofagricultureGuizhouUniversity,Guiyang,Guizhou550025,China; 3.ForestryDepartmentofGuizhouProvincepopularizedterminal,Guiyang,Guizhou550001,China)

To reveal the gene regulation ofAkebiatrifoliateduring fruit ripening, Illumina HiSeq-2000 platform was recently employed for high-throughput sequencing of six fruit samples at different stages of fruit ripeness. Afterdenovoassembly and alignment, a total of 106,547 unigenes were obtained, including 27,302 and 12,014 hit the sequences deposited in Gene Ontology (GO) and Eukaryotic Orthologous Groups (KOG) databases, respectively. Additionally, 270 Kyoto Encyclopedia of Genes and Genomes (KEGG) metabolic pathways were obtained for 11,749 unigenes, among which 26 involved in ethylene synthesis. The obtained results provided a basis for further investigation of gene regulation and key genes involving in fruit ripening of this species.

Akebiatrifoliate; Fruits; Transcriptome

2015-12-02;

2016-03-15

贵州省科技厅项目“木通仿生栽培研究与应用示范”(黔科合SY字[2014] 3034-1号);贵州省科技厅项目“贵州省林业厅青年人才基金项目”(黔林科合J字[2014] 08号);贵州省科技厅项目“贵州省药用植物繁育与种植人才基地”(黔人领发(2013)15号)。

赵致(1959-),男,教授,硕士生导师,主要研究方向:药用植物育种、药用植物代谢与药材质量控制;E-mail: zzhao@gzu.edu.cn。

Q37

A

1008-0457(2016)01-0046-06国际DOI编码:15958/j.cnki.sdnyswxb.2016.02.009

猜你喜欢

木通碱基测序
二代测序协助诊断AIDS合并马尔尼菲篮状菌脑膜炎1例
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
基因测序技术研究进展
生命“字母表”迎来4名新成员
木通的新生
基因捕获测序诊断血癌
单细胞测序技术研究进展
白木通醇提取物体外抗肿瘤活性研究