APP下载

云南原始地方种四路糯基因组中的MITE类转座子“124”

2022-07-18武晓阳杨亚洲隆文杰周国雁伍少云黄兴奇

安徽农业科学 2022年13期
关键词:转座子糯玉米文库

武晓阳,杨亚洲,隆文杰,陈 丹,周国雁,杜 娟,伍少云,蔡 青*,黄兴奇

(1.云南大学生命科学学院,云南昆明 650091;2.云南省农业科学院生物技术与种质资源研究所,云南昆明 650223;3.中国种子集团有限公司生命科学技术中心,湖北武汉 430206)

糯玉米(L.var.Kulesh)是一类主要的鲜食玉米。糯玉米籽粒胚乳中的淀粉全部为支链淀粉,使得籽粒具有糯性口感。糯性受隐性的单基因控制。普通玉米基因能正常表达GBSSⅠ(Granule-Bound Starch Synthase Ⅰ)蛋白,用于直链淀粉的合成。的突变造成GBSSⅠ蛋白失去活性,直链淀粉的合成受阻,使玉米籽粒中的淀粉几乎全为支链淀粉,产生出籽粒的糯性。玉米基因位于第9号染色体上,全长约4.5 kb,包含有14个外显子。

糯玉米起源于我国,我国拥有丰富的糯玉米地方品种,大量的等位变异也存在其中,主要等位基因类型包括-7、-10、-4、-124、-、-、-、-和-2等类型。-7、-10是序列缺失造成的突变;-4、-124、-、-、-、-和-2是玉米基因组中转座子活动造成的突变。其中-124是由MITE类转座子“124”插入基因的第六外显子造成的突变。

转座子插入是造成基因突变的主要原因之一。转座子是基因组中一段可移动的DNA序列,可以通过切割、重新整合等一系列过程从基因组的一个位置“跳跃”到另一个位置。根据转座子在基因组内跳跃媒介的不同,可以将转座子分为DNA转座子和RNA转座子,RNA转座子又叫反转录转座子。RNA转座子通过“复制—粘贴”的方式转座,DNA转座子通过“剪切—粘贴”的方式转座。微型反向重复转座元件(miniature inverted-repeat transposable element,MITE)是一类主要的DNA转座子,TITE转座子通常具有靶位点重复(target site duplications,TSDs)和末端反向重复(Terminal Inverted Repeats,TIRs)的序列结构,根据这些特征其进一步可以划分成1、、、、、和等家族类型。“124”是在基因突变研究中,鉴定出的一个新的MITE类转座子家族。

云南及其周边地区是我国少数民族的聚集地,自古以来就有食用糯性食物的习惯。很多特殊类型的糯性玉米就是在这一地区发现。“四路糯”就是其中之一,最早在云南勐海的傣族居民区发现,其果穗具有四路籽粒,形态具有许多玉米原始特征,即分蘖多、果穗多、穗行数少等,并具有独特的口感。“勐海四路”玉米已经用于许多科学研究中。通过对基因的鉴定,发现勐海四路是-10类型的突变;通过“四路糯”玉米穗行数QTL的定位,鉴定出多个控制穗行数的主效QTL位点;“勐海四路”基因组重测序的完成,为“四路糯”的研究提供了基础数据。由此可见,“四路糯”已成为玉米遗传育种及相关基础学科的特异研究材料,收集保护好这一珍贵的我国古老地方品种具有重要意义。云南省农业科学院作物种质资源库经过多年的考察收集,保存了云南不同地区的四路糯玉米资源。笔者对来自中缅边境地区的四路糯进行了基因组的重测序,通过与普通玉米B73基因组中“124”转座子进行比较,探讨了四路糯与普通玉米之间的亲缘关系。

1 材料与方法

以糯玉米地方品种四路糯为研究材料,用于其基因组的重测序。试验材料由云南省农业科学院种质资源库收集保存。

对四路糯中随机选取的3个单株分别进行了基因组的重测序。样品DNA提取参考文献[23],检验合格的DNA样品通过Covaris破碎机随机打断成长度为350 bp的片段。采用TruSeq Library Construction Kit 试剂盒进行建库。文库构建完成后,先使用Qubit 2.0进行初步定量,稀释文库至1 ng/μL,随后使用Agilent 2100对文库的insert size进行检测,insert size符合预期后,使用Q-PCR方法对文库的有效浓度进行准确定量,使文库有效浓度大于2 nmol/L,以保证文库质量。库检合格,根据文库的有效浓度及数据产出需求进行 illumina HiSeq 双向测序。获得原始测序序列(sequenced reads)后,进行接头序列及polyN,polyA 等序列的过滤,将过滤后的valid reads测序数据用于进一步分析。

使用玉米自交系B73的基因组序列(http://ftp.maizesequence.org/current/assembly/),建立本地Blast数据库。使用-124中的“124”序列比对B73基因组,采用Blastn程度确定“124”的插入位点,提取插入位点上下游150 bp的序列,用于分析“124”的结构。

根据“124”的结构特征编写Perl代码(图1),提取测序结果中具有“124”结构的Read序列;使用获得的Read序列建立本地Blast数据库;利用Blastn程序进一步确定含有“124”转座子的Read序列;利用这些Read序列分析其中的“124”结构;根据“124”序列插入位点信息和剔除其中的重复。

使用RNAstructure 6.2软件预测转座子“124”的二级结构;使用软件CLUSTAL W和Genedoc进行序列比对;使用MEGA 5软件构建最大似然树(Maximum Likelihood Tree)。植物MITE数据库(Plant MITE Database,http:∥pmite.hzau.edu.cn/)用于 “124”转座子家族的划分。

2 结果与分析

“124”家族的转座子最早在基因中鉴定出。通过与数据库中已知的MITE比对,未发现相似转座子,由此可知“124”为新鉴定出的转座子家族。该研究使用这一序列与B73基因组进行比对,进一步鉴定出13个“124”家族转座子的插入位点,利用转座子上下游150 bp的序列进一步分析出每个转座子的结构,将这些序列命名为73-124-1~73-124-13(表1)。“124”在玉米基因组中是一类低拷贝数的转座子家族。典型的“124”转座子全长116 bp;具有9 bp靶位点的重复序列(TSDs),但这一结构的序列并不保守;具有保守的3 bp末端反向互补重复序列(TIRs)5′-GGA-3′和5′-TCC-3′;转座子序列内部存在多处5′-GGA-3′和5′-TCC-3′序列,存在进一步截短的趋势,最短的“124”序列仅73 bp;“124”转座子可形成明显的二级结构(图2),“124”家族成员的序列存在一定的相似性,但相似程度不高。值得注意的是,-124中的“124”序列与73-124-1的序列完全一致,但二者的靶位点TSDs结构并不相同。

表1 B73基因组中的“124”转座子Table 1 The “124” transposon in B73 genome

该研究对四路糯进行了基因组的重测序,序列信息见表2。数据总量121.98 Gb。每个“124”的插入位点包括转座子序列长度为116 bp,TSDs长度为18 bp,小于重测序的Read序列长度为150 bp,因此可以根据“124”的结构从测序结果中直接提取包含“124”的Read。该研究利用Perl代码中的正则表达式描述“124”的结构,5~10 bp的TSD,加5′-GGA-3′序列,加70~120 bp的序列,加5′-TCC-3′,加TSD重复(图1),共计得到了1 101 959个含有类似“124”结构的Read序列,进一步将所得到的Read建立本地Blast数据库,通过鉴定得到60个含有“124”转座子的Read,-evalue 值设置为1e-010;剔除重复后共计得到17个“124”序列,并分析出其TSDs结构。这17个“124”序列分别命名为-124-1~-124-17(图3)。

图1 从测序结果中提取“124”结构Read的Perl代码Fig.1 The Perl code of extracting “124” structure Read from the sequencing results

图2 部分“124”转座子展现出的二级结构Fig.2 The secondary structure of some “124” transposons

四路糯基因组中的“124”较B73基因组中的分布数目稍多;通过序列比对发现,“124”转座子成员间序列具有相似性,但序列间并不具有一致性(图3);通过构建“124”的系统进化树,可以将“124”转座子大体分为4类不存在独立基因组来源的类型;基因中的“124”可在二者基因组中找到完全一致的序列,归为第一类“124”转座子,但插入位点存在差异;二者基因组中存在3个完全一致的插入位点,图4中箭头所示分布在Ⅱ、Ⅲ、Ⅳ类型转座子中,展现出一致的“124”序列和一致的TSDs序列。

表2 四路糯基因组重测序的序列信息Table 2 Information of myanmar four-row wax genome resequencing

图3 “124”转座子间的序列比对Fig.3 Sequence alignment of “124” transposons

图4 利用“124”转座子序列构建的系统进化树Fig.4 Phylogenetic tree constructed by transposon “124”

3 讨论

糯玉米的中国起源目前已经受到了比较广泛的认可。然而,对于的起源存在不同的观点,一种观点认为玉米起源于美洲,引入我国后经过单基因突变而产生不同类型的基因;另一种观点认为基因是由本土玉米近源物种形成,在玉米中国本土化过程中转播到引进的玉米中,形成了不同类型的糯玉米地方品种。第二种观点的依据是四路糯可能是我国本土物种,可能是基因的主要来源。究其原因在于四路糯本身存在大量玉米的原始特征,并且在云南以外地区并未发现其分布,目前已知“四路糯”的基因类型是-10,也是我国糯玉米地方品种中广泛分布的等位基因类型。然而,目前尚缺乏明显的证据说明四路糯的起源。因此,四路糯基因组与普通玉米间的比较,对四路糯的起源与演化的研究具有重要意义。-124是在我国糯玉米地方品种中鉴定出的一类等位基因。该研究探索使用“124”转座子的分布差异,研究四路糯基因组与普通玉米基因组间的分化,从“124”转座子的构成来看,更倾向与四路糯与B73的基因组差异是玉米种内的差异。基因中插入的“124”序列在普通玉米B73和四路糯中均发现了与其一致的序列,由此推断-124的形成于四路糯无必然的关系。这一结果倾向于玉米在引入我国后基因的突变产生了糯质性基因的观点。

猜你喜欢

转座子糯玉米文库
毛竹Mariner-like element自主转座子的鉴定与生物信息学分析*
地熊蜂基因组中具有潜在活性的转座子鉴定
专家文库
优秀传统文化启蒙文库
专家文库
花叶矢竹转录组中的转座子表达分析
黑糯玉米果冻的加工工艺研究
黑糯玉米新品种‘华耘黑糯501’的选育
Tn7转座子在大肠杆菌、迟钝爱德华氏菌及鳗弧菌中的应用
黑糯玉米色素清除亚硝酸盐及阻断亚硝胺合成的研究