APP下载

甘蔗SoNIN1基因结构及其内含子信息分析

2014-03-22牛俊奇吴朝兴杨丽涛2李杨瑞

生物技术通报 2014年12期
关键词:内含子外显子甘蔗

牛俊奇吴朝兴杨丽涛,2李杨瑞,2

(1. 广西大学农学院 亚热带农业生物资源保护与利用国家重点实验室,南宁 530005;2. 中国农业科学院甘蔗研究中心 广西农业科学院甘蔗研究所 农业部广西甘蔗生物技术与遗传改良重点实验室 广西甘蔗遗传改良重点实验室

广西作物遗传改良生物技术重点开放实验室,南宁 530007)

甘蔗SoNIN1基因结构及其内含子信息分析

牛俊奇1吴朝兴1杨丽涛1,2李杨瑞1,2

(1. 广西大学农学院 亚热带农业生物资源保护与利用国家重点实验室,南宁 530005;2. 中国农业科学院甘蔗研究中心 广西农业科学院甘蔗研究所 农业部广西甘蔗生物技术与遗传改良重点实验室 广西甘蔗遗传改良重点实验室

广西作物遗传改良生物技术重点开放实验室,南宁 530007)

根据前期克隆得到的SoNIN1基因的全长cDNA和部分启动子序列设计引物,应用PCR技术从甘蔗叶片gDNA中克隆SoNIN1基因,并利用生物信息学方法分析基因的结构。结果表明,SoNIN1基因的DNA序列长4 938 bp,包含6个外显子和5个内含子,GenBank登录号KF563902。在该基因5'非翻译区存在一个268 bp 内含子序列,同时5个内含子序列中含有与低温、干旱和激素等胁迫响应相关的作用元件,这些可能对SoNIN1基因转录表达起调控作用。依据SoNIN1蛋白聚类和外显子-内含子基因结构可以将植物NINs分为两类。

甘蔗 中性/碱性转化酶 外显子 内含子 信息分析

中性/碱性转化酶(Alkaline/Neutral Invertase)是转化酶家族成员之一,在调节植物的生长发育过程中起作用。它是一种胞质酶,最适pH值在7.0-8.0左右,以蔗糖为底物,能不可逆地把蔗糖分解为葡萄糖和果糖,用于细胞能量代谢[1]。而在酸性转化酶和蔗糖合成酶(分解方向)活性较低的植物组织中,中性/碱性转化酶能分解蔗糖,为三羧酸循环提供底物,因此被视为“维持酶”[2]。其酶活性极不稳定,在提取过程中容易丧失活力,导致纯化该类酶存在很大难度。已经纯化出来的中性或碱性转

化酶主要以八聚体和四聚体两种形式存在[3]。

内含子是真核生物基因的重要组成部分,它在基因剪接过程中可以区分外显子起标点符号作用,而外显子-内含子连接区高度保守性和特异性的碱基序列是真核生物基因断裂的重要特征 。通过选择剪接,一个基因可以产生不同的成熟mRNA,再翻译成功能各异的蛋白质。这种调控机制可使某些基因在不同细胞组织中或是在发育的不同阶段产生特定的蛋白质,以满足生物体代谢的需求[4-6]。近年来,内含子对真核生物基因和植物基因表达影响越来越受到人们的重视[7,8]。因此,本研究在前期克隆得到SoNIN1基因的全长cDNA和部分启动子序列,并分析了该基因在不同组织和环境胁迫下基因表达情况的基础上,利用PCR克隆获得SoNIN1基因的全长DNA序列,通过生物信息学分析该基因结构和内含子序列,旨在为进一步阐述甘蔗SoNIN1基因参与植物生长发育和对逆境胁迫下的响应机制提供参考。

1 材料与方法

1.1 材料

新型植物基因组DNA提取试剂盒(康为试剂Nuclean PlantGen DNA Kit);λ-Hind III digest DNA Marker、LA Taq酶、pMD18-T vector和T4 DNA连接酶购自TaKaRa宝生物工程(大连)公司有限公司。引物由上海生工生物工程技术服务有限公司合成。

1.2 方法

1.2.1 RNA和DNA提取 以甘蔗品种GT28叶片为材料提取总RNA,RNA提取采用天根Trizol-A+提取液,提取过程参照TRIzol试剂盒说明书。甘蔗基因组DNA提取过程参照DNA提取试剂盒说明书进行。利用琼脂糖凝胶电泳检测总RNA和DNA完整性,利用Thermo Scientific NaNoDrop 2000c检测总RNA浓度及纯度。反转录按照ReverAid First Strand cDNA Synthesis Kit试剂盒说明书反转录成cDNA第一链。

1.2.2 甘蔗SoNIN1编码区DNA序列克隆 参照SoNIN1的cDNA序列(GenBank登录号:JX109944)和启动子序列(GenBank登录号:KC854419)[9]在基因编码区序列两侧分别设计两条上游引物NIF71:5'-ACTCCGGTTTTGCCCTCCATTG-3'、NIF81:5'-TTCTTGCTGGGTTGCTCTGATTAG-3'。以及两条下游引物NIR71:5'-TTGATGGAACTTGCTGCGAGAAC-3'和NIR81:5'-CCATAATAACAGCATCCCACAGCA-3'。以甘蔗基因组DNA为模板,扩增体系为25 μL:LA Taq酶0.25 μL、10×LA Taq Buffer II 2.5 μL、10 mmol/L dNTPs 1.5 μL、10 mmol/L上下游引物各1 μL,模板DNA 1 μL、ddH2O 17.75 μL。PCR反应程序为:94℃预变性1 min;98℃变性10 s,68℃退火5 min,30个循环;最后72℃延伸10 min。PCR产物经胶回收纯化后,经T4 DNA连接酶连接到pMD18-T上,转入感受态细胞E. coli DH5α,经M13通用引物PCR菌液检测和质粒检测后,把含有目的片段的菌液送深圳华大基因研究院测序。SoNIN1基因编码区引物设计和扩增体系参照牛俊奇等[9]方法。

1.2.3 序列分析 利用MEGA6构建NIN蛋白的系统进化树;利用Gene Structure Draw(www.compgen. uni-muenster.de/tools/strdraw)分析外显子-内含子基因结构;利用Alignment Exon Intron Structure(www. compgen.uni-muenster.de/tools/alignexin)分析基因外显子进化关系;利用http://hits.isb-sib.ch/cgibin/motif_scan分析SoNIN1蛋白的活性位点;利用 PlantCARE(http://bioinformatics.psb.ugent.be/ webtools/plantcare/html)和PLACE(http://www.dna. affrc.go.jp/PLACE/signalup.html)分析SoNIN1基因内含子顺式作用元件。

2 结果

2.1 DNA和RNA琼脂糖凝胶电泳检测

利用DNA试剂盒提取的甘蔗基因组DNA经0.8%琼脂糖凝胶电泳检测,结果(图1-A)显示电泳条带单一,平直,清晰,点样孔干净。经紫外分光光度计检测其OD260/OD230为1.92,浓度为900 ng/μL,说明所提取的DNA质量和浓度均符合试验的要求。利用试剂盒提取的RNA经1%琼脂糖凝胶电泳检测图,产生3条清晰的条带:28S、18S和5S RNA,无DNA污染,OD260/OD230为1.92,说明所提取的RNA完整性好、纯度高、完全可满足cDNA逆转录的要求(图1-B)。

2.2 SoNIN1基因 DNA序列克隆与序列分析

对设计的6条引物(两条上、下游引物和一对编码区引物)随机组合,分别进行PCR扩增,结果(图

2-A)显示只有引物对NIF71和NIR71 PCR扩增产物在5 000 bp左右处有单一、清晰的电泳条带。以cDNA为模板,用编码区引物扩增结果如图2-B所示。测序结果显示扩增出来DNA序列长4 938 bp,编码603 aa,与SoNIN1编码区cDNA推导氨基酸序列同源性为100%,说明克隆的序列是SoNIN1基因的DNA序列。该基因已在 DDBJ/EMBL/GenBank 基因数据库注册,注册号为KF563902。

图1 DNA(A)和RNA(B)琼脂糖凝胶电泳检测结果

图2 SoNIN1 基因的DNA序列(A)和编码区cDNA(B)扩增结果

将SoNIN1基因DNA序列与其cDNA(编码区)序列进行比对分析,结果显示该基因含有6个外显子和5个内含子,外显子大小分别为582、164、212、494、49和256 bp,内含子大小分别为1 374、89、1 146、90和214 bp,外显子与内含子的交界符合GT-AG法则(即内含子具有5'-GT...AG-3'特征)。基因5'UTR(Untranslated Regions)有192 bp,3' UTR有23 bp,序列中A+T含量58.46%,G+C含量为占41.54%。利用Vector NTI 11.0 里的conting 软件将SoNIN1基因DNA序列与其启动子(KC854419)序列进行拼接,拼接结果长5 920 bp。该拼接结果与基因的全长cDNA进行比对,并利用Gene Structure Draw程序构建内含子-外显子基因结构图(图3)。结果显示在起始密码子ATG之前49 bp之前有一个268 bp的非转录区,该区域含有干旱胁迫响应元件(MBS)、赤霉素响应元件(P-box)、胚乳特异性响应元件(Skn-1_motif)以及2个CAAT-box,该序列可能在增强基因转录方面起作用。

2.3 内含子作用元件预测

用PlantCARE和PLACE在线预测SoNIN1基因内含子顺式作用元件,结果显示基因内含子1具有ABA响应元件(ABRE)、厌氧响应元件(ARE)、ABA和VP1响应元件(CE3)、茉莉酸响应元件(CGTCA-motif),低温诱导响应元件(LTR)、干旱胁迫响应元件(MBS)、4个分生组织特异性响应元件、胁迫防御响应元件(TC-rich repeats)、光诱导根特异性表达响应元件和光响应元件。此外还具有14个CAAT-box 和27个TATA-box。同时,在内含子1中有一段233 bp(位于868-1 101 bp之间)的核苷酸序列,该序列与玉米、高粱、薏米和甘蔗叶绿体基因组中的细胞色素B(petB)基因的反向互补序列同源性达98%,而该序列能否抑制petB基因的表达,还有待于进一步的研究。内含子3具有4个CAAT-box、ABA响应元件、厌氧诱导响应元件、分生组织特异性响应元件和光响应元件。内含子5具有厌氧响应元件、干旱诱导的MBY结合位点,胚乳特异表达响应元件,胁迫防御响应元件。而内含子2和4都具有TATA-box和CAAT-box。

2.4 构建植物NIN蛋白系统进化树

根据在基因数据库中搜索到的拟南芥(3个)、水稻(8个)和玉米(6个)NIN基因相应DNA、cDNA和氨基酸序列,利用MEGA6.0软件构建NIN蛋白的系统进化树,并利用Gene Structure Draw分析基因外显子-内含子结构。结果(图4)表明,植物NIN蛋白可以分为两类:I 类和II类。其中,I类中基因结构主要有4个外显子和3个内含子组成,只有拟南芥(AT4G09510)有5个外显子和4个内含子组成,甘蔗SoNIIN2[10]属于I 类。II类中基因结构都有6个外显子和5个内含子组成。SoNIN1蛋白首先与玉米(GRMZM2G040843)聚类,其次与黑

麦草(CAM32308)和水稻(Os02g32730)聚类,再次与拟南芥(AT5G22510和AT1G56560)聚类,最后与水稻(Os01g22900)聚类。虽然甘蔗SoNIN1蛋白与玉米(GRMZM2G040843)NIN亲缘关系很近,但二者内含子序列大小相差很大,尤其是第3个内含子,甘蔗的为1 146 bp,而玉米的达6 235 bp。

图3 SoNIN1基因结构图

图4 SoNIN1蛋白质与其他20个不同来源的中性/碱性转化酶的进化关系分析

2.5 II类NIN基因内含子-外显子结构分析

甘蔗NIN1蛋白与玉米(GRMZM2G040843)、水 稻(Os02g32730)、 黑 麦 草(AM489692)、 水稻(Os04g33490)、拟南芥(AT5G22510)和拟南芥(AT1G56560)氨基酸序列的同源性分别为96%、90%、86%、79%、67%和62%。利用Alignment Exon Intron Structure分析植物II 类NIN基因内含子-外显子结构,结果(图5)表明进化距离较近的基因之间外显子-内含子结构差异小,内含子插入位置仅在外显子末端个别氨基酸序列处不同。而在进化距离相对较远的NIN基因结构中,内含子插入位置变化较大,如水稻的Os02g32730和Os04g33490。

3 讨论

本研究采用98℃变性10 s,68℃退火-延伸5 min,30个循环进行PCR扩增,即二温式PCR技术。该方法优点是退火温度比常规PCR高,扩增产物的特异性强,目的条带清晰。同时扩增程序简单,耗时短[11]。缺点是对引物要求高,不但要求G+C含量在40%-60%之间,而且引物退火温度要在65-70℃之间,而利用Taq酶最佳温度为68℃。从甘蔗

中克隆到的SoNIN1 DNA序列,外显子和内含子之间的交界完全符合的GT-AG法则,且在SoNINI蛋白与其他来原的进化关系中所示植物的NIN基因内含子都符合这一特征。甘蔗SoNIN1基因结构含有6个外显子,5个内含子,第2个为164 bp,而植物酸性转化酶基因第2个内含子大部分都是9 bp,编码DPN 3个氨基酸,它是呋喃果糖酶基序(NDPNG/A)的一部分[12],而SoNIN1推导的这3个多肽位于第1个内含子内。而在小麦(CAL26914)、木薯(AFH77958)和水稻(BAG89564)的NINI基因中已经不含DPN序列,因此推测DPN并不是某些植物中性/碱性转化酶必需酶活性位点。

图5 NINs基因内含子-外显子结构图

启动子是基因表达所必需的重要的DNA信号序列,是细胞内控制基因转录与表达的时空特异性的重要因子,是基因转录调控的中心[13]。基因表达不仅需要5'侧翼启动子序列,而且也需要内含子的参与[14,15]。基因中不同的内含子在启动基因转录中发挥的作用不同,通常第一个内含子对基因启动表达贡献最大[16]。内含子能诱导启动子启动活性和启动内含子含有的响应作用元件[17]。内含子中存在一些类似增强子或其他顺式作用调控元件,能提高基因表达,但内含子在基因表达中具有位置效应和方向依赖性[18]。有研究表明内含子中部序列在基因表达调控中起重要作用[19]。高转录基因内含子中存在一些潜在的正调控位点,这些内含子非常靠近基因上游区,甚至位于5'-UTR区,其中内含子可能参与转录调控,并可能与上游转录调控有协同调节作用[20,21]。在甘蔗SoNIN1基因5'-UTR含有一个的内含子,而有研究表明基因5'-UTR中存在的内含子能诱导基因的表达模式[22]。而有些内含子序列对基因表达起负调控作用,如内含子中的NRSE 序列参与介导了其对CART基因的转录负调控作用[23]。剪切后的内含子与相应编码序列也存在相互作用,在mRNA输出和基因表达调控过程中也起到非常重要的作用[24]。

从NIN蛋白系统进化树和外显子-内含子基因结构上,本研究将植物中性/碱性转化酶分为两个亚类群,在同一亚群内部不同物种间内含子序列的长度存在极大差异。内含子序列中的各类可移动单元,可以加速蛋白质结构的进化及加大蛋白质的变异性,内含子已经成为提高转基因生物基因表达的重要元件[25]。本研究从甘蔗中克隆到SoNIN1基因的全长DNA序列,并利用生物学方法分析了SoNIN1基因的系统进化、外显子-内含子基因结构,这不仅有利于从分子层面了解NIN基因的进化和基因结构,而且为今后分离、纯化甘蔗NIN蛋白和进行功能研究提供理论基础。

4 结论

克隆获得SoNIN1基因的DNA序列,全长4 938 bp,由6个外显子和5个内含子组成。在翻译起始密码子ATG前49 bp存在一个268 bp的内含子

序列,内含子1和内含子3含有多个顺式作用元件,可能在启动或诱导SoNIN1基因表达中起作用。植物中性/碱性转化酶可以分为两个亚类,I类基因结构主要是4个外显子和3个内含子组成,少数为5个外显子和4个内含子组成,而II类是6个外显子和5个内含子组成。

[1]Chandra A, Jain R, Solomon S. Complexities of intvertases controlling sucrose accumulation and retention in sugarcane[J]. Current Science, 2012, 102(6):857-866.

[2]Gallagher JA, Pollock CJ. Isolation and characterization of a cDNA clone from Lolium temulentum L. encoding for a sucrose hydrolytic enzyme which shows alkaline/neutral invertase activity[J]. Journal of Experimental Botany, 1998, 49(322):789-795.

[3]潘秋红, 张大鹏.植物转化酶的种类、特性与功能[J]. 植物生理学通讯, 2004, 40(3):275-280.

[4]Morello L, Breviario D. Plant spliceosomal introns:Not only cut and paste[J]. Current Genomics, 2008, 9(4):227-238.

[5]Lorkovic ZJ, Kirk DAW, Lambermon MHL, Filipowicz W. PremRNA splicing in higher plants[J]. Trends in Plant Science, 2000, 5(4):160-167.

[6]Blencowe BJ. Alternative splicing:new insights from global analyses[J]. Cell, 2006, 23(10):37-47.

[7]Nott A, Muslin SH, Moore MJ. A quantitative analysis of intron effects on mammalian gene expression[J]. RNA, 2003, 9(5):607-617.

[8]Emami S, Arumainayagam D, Korf L, Rose AB. The effects of a stimulating intron on the expression of heterologous genes in Arabidopsis thaliana[J]. Plant Biotechnol J, 2013(11):555-563.

[9]牛俊奇, 王爱勤, 黄静丽, 等.甘蔗中性/碱性转化酶基因(SoNIN1)的克隆和表达分析[J].作物学报, 2014, 40(2):253-263.

[10]Bosch S, Grof CPL, Botha FC. Expression of neutral invertase in sugarcane[J]. Plant Sci, 2000(166):1125-1133.

[11]董倩, 黄国强, 叶冰莹, 等.二温式PCR 在特异短核酸探针合成中的应用[J].花生学报, 2008, 37(3):5-10.

[12]刘慧英, 朱祝军.转化酶在高等植物蔗糖代谢中的作用研究进展[J].植物学通报, 2002, 19(6):666-674.

[13]聂丽娜, 夏兰琴, 徐兆师, 等.植物基因启动子的克隆及其功能研究进展[J].植物遗传资源学报, 2008, 9(3):385-391.

[14]陈俊, 王宗阳.水稻OsBP-73基因表达需要其内含子参与[J].植物生理与分子生物学学报, 2004, 30(1):81-86.

[15]Chorev M, Carmel L. The function of introns[J]. Frontiers in Genetics, 2012(3):1-15.

[16]Wang YD, Joh K, Masuko S, et al. The mouse murrl gene is imprinted in the adult brain, presumably due to transcriptional interference by the antisense-oriented U2af1-rs1 gene[J]. Molecular and Cellular Biology, 2004(24):270-279.

[17]李江涛, 杨世湖, 陈苗苗, 万建民.内含子1, 2对水稻pib基因启动子活性影响的转基因分析[J].江苏农业科学, 2012, 40(3):15-19.

[18]Chung BYW, Simons C, Firth AE, et al. Effect of 5’UTR introns on gene expression in Arabidopsis thaliana[J]. BMC Genomics, 2006, 7(1):120.

[19]张强, 李宏, 赵小庆, 等.基因外显子连接序列与相应内含子序列的相互作用[J].生物信息学, 2013, 11(3):172-180.

[20]张昆林, 张静, 罗静初.酵母基因上游与内含子可能存在的转录协同作用[J].生物化学与生物物理进展, 2005, 32(1):46-52.

[21]Parra G, Bradnam K, Rose AB, Korf L. Comparative and functional analysis of intron-mediated enhancement signals reveals conserved features among plants[J]. Nucleic Acids Research, 2011, 39(13):5328-5337.

[22]Fu H, Kim SY, Park WD. High-level tuber expression and sucrose inducibility of a potato Sus4 sucrose synthase gene require 5’ and 3’flanking sequences and the leader intron[J]. The Plant Cell Online, 1995, 7(9):1387-1394.

[23]张静, 王思涵, 杨印祥, 等.内含子序列对CART基因转录调控作用的初步研究[J].军事医学, 2011, 35(4):272-277.

[24]Zhao XQ, Li H, Bao T. Analysis on the interaction between postspliced introns and corresponding protein coding sequences in ribosomal protein genes[J]. Journal of Theoretical Biology, 2013(328):33-42.

[25]Kamo K, Kim AY, Park SH, Joung YH. The 5'UTR-intron of the Gladiolus polyubiquitin promoter GUBQ1 enhances translation efficiency in Gladiolus and Arabidopsis[J]. BMC Plant Biology, 2012(12):79-89.

(责任编辑 马鑫)

Analysis of Genomic Structure and Introns of SoNIN1 Gene from Sugarcane

Niu Junqi1Wu Chaoxing1Yang Litao1,2Li Yangrui1,2
(1. Agricultural College,Guangxi University / State Key Laoratory of Conservation and Utilization of Subtropical Agro-bioresources,Nanning 530005;2. Sugarcane Research Center,Chinese Academy of Agricultural Sciences / Sugarcane Research Center,Guangxi Academy of Agricltural Sciences / Key Laboratory of Sugarcane Biotechnology and Genetic Improvement(Guangxi),Ministry of Agriculture / Guangxi Key Laboratory of Sugarcane Genetic Improvement / Guangxi Crop Genetic Improvement and Biotechnology Lab,Nanning 530007)

According to the full length cDNA and part of the promoter sequences of the SoNIN1 gene we designed primers,amplified the SoNIN1 gene form gDNA of sugarcane leaves by PCR, and analyzed the gene structure of SoNIN1 by using bioinformatics methods. The results showed that the DNA sequence of the SoNIN1 gene is 4 938 bp, containing six exons and five introns, GenBank accession number KF563902. 5’UTRs of the SoNIN1 gene contain 268 bp introns, and five introns contain low temperature, drought, and hormonal stress response related cisacting elements, which may play a role in transcription and expression regulation of SoNIN1 gene. According to phylogenetic analysis and exonintron gene structure, the NIN proteins can be classified into 2 classes’ type I and type II.

Sugarcane Alkaline/neutral invertase Exon Intron Information analysis

10.13560/j.cnki.biotech.bull.1985.2014.12.024

2014-05-26

国家“863”计划课题(2013AA102604),广西自然科学基金项目(2011GXNSFF018002,2013NXNSFAA019073),国家国际合作项目(2009DFA30820,2013DFA31600),广西八桂学者和特聘专家专项经费

牛俊奇,男,博士研究生,研究方向:甘蔗生理和分子生物学;E-mail:niujunqi3218@163.com

杨丽涛,女,博士,教授,研究方向:甘蔗生理生化和病虫害;E-mail:liyr@gxu.edu.cn

李杨瑞,男,博士,教授,研究方向:甘蔗育种和生物固氮;E-mail:liyr@gxaas.net

猜你喜欢

内含子外显子甘蔗
外显子跳跃模式中组蛋白修饰的组合模式分析
清明甘蔗“毒过蛇”
线粒体核糖体蛋白基因中内含子序列间匹配特性分析
外显子组测序助力产前诊断胎儿骨骼发育不良
甘蔗的问题
不同方向内含子对重组CHO细胞中神经生长因子表达的影响
更 正
外显子组测序助力产前诊断胎儿骨骼发育不良
内含子的特异性识别与选择性剪切*
爱咬甘蔗的百岁爷爷