APP下载

转GbVe1基因在棉花基因组中的整合与定位分析

2019-01-31陈天子凌溪铁杨郁文张保龙

棉花学报 2019年1期
关键词:转基因产物基因组

陈天子,凌溪铁,杨郁文,张保龙

(江苏省农业科学院/江苏省农业生物学重点实验室,江苏 南京210014)

自从1997年我国审定第一个转基因抗虫棉后,转基因抗虫棉在国内推广应用已达20余年,累计推广面积超过3 000万hm2,产生了巨大的社会效益和经济效益[1]。伴随着转基因作物种植面积的持续扩大[2],转基因作物的知识产权保护、转基因作物潜在的生态安全风险、转基因产品的标识及其安全问题日益受关注。因此,明确转基因作物的转基因分子特征,是加强对转基因作物及其产品的保护和安全监管的重要技术依据。

转基因作物及其产品的分子检测可通过基于核酸(如Polymerase chain reaction,PCR等)或蛋白(如Enzyme-linked immunosorbent assay,ELISA等)的系列方法进行。其中,PCR技术因具有高特异性、较高的检测灵敏度、较低的检测成本等优势而成为转基因检测最常用的方法,尤以转化体特异性检测方法的特异性最高。转化体特异性检测是根据转化载体T-DNA以及T-DNA插入位点侧翼序列的融合序列而建立的PCR检测技术,具有高度特异性。目前已有多个转基因棉花转化体的单个PCR特异性检测[3-5]和多重PCR同时检测[6]的报道。这些研究工作都是建立在棉花转化体有明确的T-DNA侧翼序列的基础之上。

自抗虫棉推广以来,我国通过生产应用的转基因抗虫棉安全性评价材料已达2 000多份[1],但大多数获得批准的转基因抗虫棉花品种只简单介绍导入基因的有限分子信息,并未明确其最初的转化体来源,造成了转基因转化体的溯源和监管的困难。侯娜等[7]通过hiTAIL-PCR获得转基因抗虫棉材料06N-119的5’端侧翼序列,发现该侧翼序列与汪巧等[8]采用Genome Walking方法获得的转基因抗虫棉鄂杂棉1号的5’端侧翼序列完全相同。通过序列比对发现,鄂杂棉1号和06N-119的侧翼序列与专利US6893826中公开的MON757转化体序列高度相似,推测鄂杂棉1号和06N-119中的转基因转化体均来源于MON757转化体[5]。含有cry1Aa基因的转基因棉花在我国和国外均未通过安全审批,但孙艾等在我国棉花商品种子中检测出了cry1Aa基因[9],王叶等随后通过Genome Walking、长链PCR分离获得含有cry1Aa基因的棉花转化体NN6的整合结构全长序列,并建立特异性检测方法[10]。由此可见,我国转基因棉花的转化体来源及其T-DNA侧翼序列等相关分子特征信息还有待进一步完善。

棉花基因组序列的公布为研究棉花基因功能提供了契机,也为准确地鉴定棉花转基因插入位点奠定了基础。随着棉花基因功能研究的不断深入,将有更多的转基因棉花涌现;明确棉花转化体的T-DNA侧翼序列将有助于我国转基因棉花的良性发展。在前期研究中,我们利用农杆菌介导转化方法将表面受体蛋白GbVe1导入了棉花基因组中,获得了抗黄萎病的转基因棉花材料[11]。本研究旨在利用hiTAIL-PCR技术[12]扩增转GbVe1基因棉花T-DNA的侧翼序列,明确外源基因在棉花染色体上的插入位点,建立特异性定性PCR检测方法,并提供扩增含有pCAMBIA2301载体的转化体边界序列的特异引物,提高棉花转化体的侧翼序列分离效率,为我国转基因棉花的安全评价和知识产权保护提供相关分子信息。

1 材料与方法

1.1 实验材料

抗黄萎病GbVe1基因过量表达的转基因棉花由本实验室通过农杆菌介导转化棉花子叶和下胚轴而获得[11],含有基于pCAMBIA2301载体构建的、采用CaMV35S启动子驱动GbVe1目的基因过量表达的植物表达载体(图1a)。

Ex-Tap DNA聚合酶、KOD DNA聚合酶、DNA marker、pMD18-T载体等购自宝生物工程(大连)有限公司;PCR产物回收试剂盒、琼脂糖凝胶回收试剂盒购自生工生物工程(上海)有限公司;DH5α感受态菌株等购自北京天根生物技术有限公司。PCR引物的合成和克隆片段的测序由南京金斯瑞生物科技有限公司完成。

1.2 转基因棉花的Southern杂交检测

取棉花幼叶3~5 g,采用CTAB方法[13]提取棉花基因组DNA,溶解300μL无菌水中。取1μL DNA在1.2%琼脂糖凝胶检测DNA完整性,并根据DNA条带亮度估算其浓度。然后取棉花基因组DNA 40μg,HindⅢ酶切后,经0.8%琼脂糖凝胶低压电泳并转移到尼龙膜后,用地高辛标记的700 bp NPTII探针进行杂交。探针标记和杂交参照试剂盒DIG High Prime DNA Labeling and Detection Starter Kit I(Roche公司)的说明书进行。

1.3 hiTAIL-PCR引物

LAD随机简并引物采用刘耀光等[12]所介绍的引物,LB端的特异引物根据pCAMBIA2301载体左边界35S polyA终止子序列设计,RB端的特异引物根据pCAMBIA2301载体右边界GUS基因和NOS终止子序列设计。特异引物使用Primer Premier 5.0软件设计,引物由南京金斯瑞生物科技有限公司合成,引物序列及其位置见表1。

1.4 hiTAIL-PCR扩增体系和反应条件

hiTAIL-PCR扩增体系和扩增程序参考刘耀光等[12]方法,略有改动。第一轮pre-amplification反应体系为20μL,包括10.0μL 2×Ex-Tap pre-mix buffer、1.0μL 20μmol·L-1LAD1-1引物、1.0 μL 20μmol·L-1LAD1-3引 物(或1.0μL 20 μmol·L-1LAD1-2引 物、1.0μL 20μmol·L-1LAD1-4引物)、1.0μL 6μmol·L-1RBGUS-2引物(扩RB边 界)(或1.0μL 6μmol·L-1LB35STR-4引物(扩LB边界))、1.0μL 20~30 mg·L-1棉花基因组DNA、5.0μL无菌水。第二轮primary TAIL-PCR反应体系为25μL,包括12.5 μL 2×Ex-Tap premix buffer、1.25μL 6μmol·L-1AC1引物、1.25μL 6μmol·L-1RBGUS-4C引物(扩RB边 界)(或1.25μL 6μmol·L-1LB35STR-3C1引物(扩LB边界))、1.0μL稀释50倍的Pre-amplification产物、9μL无菌水。第三轮secondary TAIL-PCR反应体系为25μL,包括12.5μL 2×Ex-Tap premix buffer、1.25μL 6 μmol·L-1AC1引物、1.25μL 6μmol·L-1RB-2a或RB-0a引物(扩RB边界)(或1.25μL 6μmol·L-1LB35STR-2或LB35STR-1引物(扩LB边界))、1.0μL稀 释10倍的第二轮primary TAIL-PCR产物、9μL无菌水。

表1 本研究中所用的引物Table 1 Primers in this study

1.5 侧翼序列获取和分析

第三轮secondary TAIL-PCR扩增产物经琼脂糖电泳分离后,特异条带用Axygen Axy Prey DNA Gel Extraction Kit回收纯化,回收的PCR片段连接到pGEM-T easy载体,转化大肠杆菌,每条片段的转化克隆随机挑8个单克隆菌落,用载体的通用M13引物进行PCR检测,随后取2个阳性克隆送测序。

1.6 侧翼序列分析

测序获得的序列合并成为FASTA格式文件,利用NCBI vector contamination(http://www.ncbi.nlm.nih.gov/tools/vecscreen/)分析测序片段中的载体骨架序列,含有T-DNA载体的LB或RB端骨架序列以及未知序列的测序片段随后与棉花基因组比对,从而判断获得的未知序列是否属于插入位点的侧翼序列。本文采取的棉花基因组版本是在phytozome网站picos测序方法拼装的陆地棉TM-1基因组,可以视图化地看出获得的边界序列在基因组的位置。

1.7 侧翼序列验证及转化体特异性分析

为了验证T-DNA插入位点的正确性,根据所获得的LB、RB边界侧翼序列和T-DNA区段内的序列设计PCR特异引物,以12/100826-393株系T5代植株DNA为模板,特异性扩增T-DNA插入序列到其插入位点两侧的棉花基因组的序列片段,引物序列和位置分别见表1和图1。

图1 12/100826-393株系T-DNA插入位点的侧翼序列及特异PCR引物的位置示意图Fig.1 The T-DNA flanking sequences of transgenic line 12/100826-393 and specific primers on the flanking sequences

2 结果与分析

2.1 Southern杂交检测

如图2所示,利用内切酶HindⅢ酶切消化转基因棉花DNA时,T-DNA区段将产生同时含有NPTII基因、Gbve1基因的6 057 bp(base pair)片段和单含GUS基因的2 938 bp片段;用NPTII探针杂交时,杂交带预期的最小条带为6 057 bp,故小于marker 5 148 bp的杂交信号不考虑,有效的杂交信号位于marker 5 148~21 226 bp之间。孔道2(野生型)和孔道7的样品未检出杂交信号,孔道3、4的样品呈多拷贝插入,孔道5、6、8、9的样品呈单拷贝插入。本研究候选孔道6、8、9对应的12/100826-393、7/100826-152、1/w-ch14等3个株系进行后续T-DNA侧翼序列分析。

图2 转GbVe1基因棉花的T-DNA载体示意图及southern blot结果Fig.2 The T-DNA construct and southern blot of transgenic GbVe1 cotton

2.2 侧翼序列的扩增

取第二轮primary TAIL-PCR(一对引物)和第三轮secondary TAIL-PCR(两对引物)扩增产物一起进行琼脂糖凝胶电泳,结果发现各个引物组合均可获取清晰的条带,且第三轮扩增产物(0a、2a;R2、R1)略小于第二轮扩增产物(4c;3c),第三轮内侧巢式引物(2a;R1)的扩增产物也略小于外侧巢式引物(0a;R2)的扩增产物(图3),符合预期。从图3中可见,hiTAIL-PCR产物有多条带,但一般仅有一条带最亮,其中RB侧翼序列扩增产生的平均条带数为3.1条/反应,片段长度在250~1 300 bp之间,LB侧翼序列扩增产生的平均条带数为1.7条/反应,片段长度在250~800 bp之间。此外,第一轮采用LAD1-1/LAD1-3的扩增体系获取的最终产物比采用LAD1-2/LAD1-4扩增的产物长,尤其是在对LB侧翼序列进行扩增时尤为明显。

2.3 侧翼序列的克隆与分析

图3 hiTAIL-PCR扩增转GbVe1基因株系的T-DNA边界序列Fig.3 hiTAIL-PCR results of T-DNA flanking sequences of transgenic GbVe1 cotton

根据hiTAIL-PCR特异引物位置可知,hi-TAIL-PCR正确扩增的产物应含有T-DNA序列和棉花基因组序列。本研究共计回收测序16条片段(图2红色箭头所示),其中长度>500 bp的回收片段10条,含T-DNA序列的片段有9条,hiTAIL-PCR正确扩增率90%;长度≤500 bp的回收片段6条,含T-DNA序列的片段仅有2条,hiTAIL-PCR正确扩增率33.33%。共计11条片段同时含有T-DNA序列及其旁侧的未知序列(表2)。该11条片段进一步与TM-1棉花基因组比对,发现其上的未知序列均能比对到棉花基因组上,比对长度介于119~1 011 bp(表2),表明所获得的片段即是T-DNA插入位点的侧翼序列。另有编号1的片段,其2个测序克隆均不含T-DNA序列但含有未知序列,未知序列也能比对到棉花基因组序列,推测该片段可能是引物非特异性扩增棉花基因组的产物。

2.4 插入位点分析

将12/100826-393株系的侧翼序列与Phytozome网站的TM-1棉花基因组比对,发现其4条RB侧翼序列均源于D01染色体上的53 897 359~53 898 368区段,2条LB侧翼序列源于D01染色体上的53 896 822~53 897 337区段(表3),RB和LB侧翼序列间隔21 bp,表明T-DNA插入导致棉花基因组发生了21 bp碱基的缺失,该插入位点位于Gohir.D01G157600.1内含子(图4)。

以同样方法对另外两个株系(1/w-ch14、7/100826-152)进行插入位点分析,发现7/100826-152株系的T-DNA插入位点也同在Gohir.D01G157600.1内含子上,推测这两个株系可能是来源于同一个转化事件。1/w-ch14株系的LB和RB侧翼序列也能定位到Gohir.-D01G157600.1基因上,但另有其它RB侧翼序列(表2的测序片段2和片段4)唯一地定位到A12染色体Gohir.A12G167400.1和Gohir.-A12G167500.1两基因间的间隔区中,推测该株系可能不是单拷贝插入。

对12/100826-393株系的T-DNA侧翼序列的AT含量进行分析,发现LB侧翼序列的516bp碱基和RB侧翼序列的1 008 bp碱基中的AT含量分别为63.4%和63.7%;对插入位点所处的基因序列分析,发现Gohir.D01G157600.1的AT含量为59.5%,说明T-DNA插入位点的侧翼序列AT含量较高。

表2 hiTAIL-PCR获取的转GbVe1基因棉花T-DNA侧翼序列Table 2 T-DNA flanking sequences in transgenic GbVe1 cotton by hiTAIL-PCR

2.5 转化体特异性分析

根据获得的侧翼序列和T-DNA序列设计PCR引物(表1、图1),以12/100826-393株系T5代植株DNA为模板,PCR验证其插入位点的正确性。NOS终止子到RB边界序列(图5a)、35S终止子到LB边界序列(图5b)、GUS基因到RB边界序列(图5c)、NPTII基因到LB边界序列(图5c)和T-DNA区内GbVe1基因到NPTII基因的片段(图5c)都在转基因棉花中扩增出了预期目标片段,说明T-DNA插入及其侧翼序列是正确的。进一步扩增GbVe1基因到RB边界序列更长的片段,引物组合Gbvdr-1R+R4获得4.8 kb符合预期大小的特异带,但条带较弱;引物组合Gbvdr-1R+R2(预期大小4.3 kb)则无扩增产物,可能是由于引物特异性不足。相比之下,引物组合Gbvdr-2F+S11、Gbvdr-2F+S21扩 增GbVe1基因到LB边界序列获得3.5 kb左右的特异带(图5d)。非转基因植株(WT)在各个引物组合下均无任何扩增条带,表明上述引物可以特异性地检测T-DNA在Gohir.D01G157600.1内含子上的插入事件。

表3 转基因株系12/100826-393的T-DNA侧翼序列与棉花TM-1基因组的blast结果Table 3 The blast result of T-DNA flanking sequences of transgenic line 12/100826-393 with TM-1 cotton genome

图4 转GbVe1基因棉花株系12/100826-393的T-DNA及其侧翼序列在基因组的定位示意图Fig.4 The locations of T-DNA and flanking sequences in the genome of transgenic GbVe1 cotton line 12/100826-393

图5 PCR验证转基因株系12/100826-393的T-DNA插入Fig.5 The confirmation of T-DNA insertion in the transgenic line 12/100826-393

3 讨论

hiTAIL-PCR是获取T-DNA侧翼序列的高效方法,在水稻中扩增的成功率不低于90%[12]。采用同样的简并引物和反应体系,侯娜等[7]成功获得了转基因抗虫棉的3’端侧翼序列800 bp,但没能获得5’端侧翼序列。这说明hiTAIL-PCR的高扩增率一方面得益于LAD简并引物的高度简并性,另一方面也依赖于锚定在T-DNA上的特异引物的有效性。为了克服单条LAD简并引物在棉花上的兼容性不好,且鉴于第一轮pre-amplification反应体系混合采用两条LAD简并引物能比单条LAD简并引物提高扩增产物的条带数量[12],本研究采用LAD1-1/LAD1-3或LAD1-2/LAD1-4对相同的DNA模板进行第一轮扩增。此外,为了确认hiTAIL-PCR扩增的特异性,我们在第三轮secondary TAIL-PCR扩增时采用2条巢式引物分别对第二轮primary TAIL-PCR产物进行独立扩增。理论上,hiTAIL-PCR第三轮扩增产物比第二轮产物略小,且采用内侧巢式引物扩增的第三轮产物比外侧巢式引物扩增的第三轮产物也偏小。实际结果也符合预期,3个株系均能获得扩增产物。本研究hiTAIL-PCR所用的特异引物用在其它含有pCAMBIA2301载体骨架的棉花转化体上也成功获得了T-DNA侧翼序列,说明这些引物具有较好的特异性,可为含有类似基因结构的转化体的T-DNA侧翼序列研究提供借鉴。

本研究hiTAIL-PCR扩增RB端和LB端的产物都含有多条带,这与在水稻中的结果一致,但水稻中大部分产物大于500 bp,多在1~3 kb[12]。本研究对hiTAIL-PCR不同长度的产物分别进行克隆、测序,结果表明90%大于500 bp的产物属于hiTAIL-PCR正确扩增的;而小于500 bp的产物只有1/3左右是hiTAIL-PCR正确扩增的。所以,hiTAIL-PCR获取T-DNA侧翼序列时,尽可能选取大于500 bp的产物进行克隆、测序。但产物片段也不是越大越好,如本研究的片段1是最大的产物片段,含有能比对上棉花基因组的未知序列600~1000 bp,但其不含T-DNA序列,无法判断其是否属于T-DNA侧翼序列,只能将其归于非特异扩增的产物。

许多研究表明农杆菌介导的T-DNA整合到基因组有偏好性。左开井等[14]发现不同来源的转基因抗虫棉的T-DNA下游侧翼片段为富含AT碱基结构,其中泗棉3号转基因抗虫品系中下游侧翼片段的AT碱基高达92%。王晓波等[15]也发现抗草甘膦EPSPS基因插入的下游侧翼片段为富含AT碱基(71.5%)结构,上游侧翼片段也富含AT碱基(75.3%),且这些区域的基因密度相对较低。而李彦龙[16]则发现在农杆菌介导T-DNA整合到棉花基因组的过程中,T-DNA更偏好整合到基因区或转座子区域。此外,T-DNA插入通常伴随着插入位点序列的删除或复制、T-DNA序列的部分删除或复制、基因组的重排、染色体的易位或倒位等现象[17]。侯娜等[7]发现Bt抗虫基因的插入过程中造成了75 bp的棉花基因组片段缺失。在本研究中,T-DNA插入位点位于基因的内含子上,插入位点上游和下游序列也富含AT碱基,T-DNA插入的导入造成了插入位点处的21 bp碱基丢失,同时T-DNA序列的LB端缺失12 bp,RB端缺失44 bp,推测T-DNA的插入位点可能与基因组中的重组热点区域有关,但有待于更多的材料加以分析和印证。

4 结论

hiTAIL-PCR获取了转GbVe1基因棉花的T-DNA侧翼序列,提供了T-DNA插入位点位于Gohir.D01G157600.1基因的内含子的特异性的检测引物,并提供了适用于含有pCAMBIA2301载体骨架的转化体的hiTAIL-PCR特异引物。

猜你喜欢

转基因产物基因组
探秘转基因
“植物界大熊猫”完整基因组图谱首次发布
转基因,你吃了吗?
牛参考基因组中发现被忽视基因
球形三氧化钼还原产物形貌
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
孤独是现代产物,了解其历史或有助抗疫克艰 精读
美联储加息的产物研究
天然的转基因天然的转基因“工程师”及其对转基因食品的意蕴