APP下载

LTR逆转录转座子分类及结构特征

2019-07-05刘盼盼

智富时代 2019年5期
关键词:结构特征

刘盼盼

【摘 要】逆转录转座子是真核生物基因组中普遍存在的一类可移动的遗传因子,是基因组的重要组成成分。它们以RNA为中间媒介,在基因组中通过不断自我复制增加拷贝数,影响基因的活性以及基因组的结构,进而导致物种的遗传多样性,在生物体的进化过程中发挥重要作用。DNA测序技术的快速发展使我们获得了大量的组学资源,为全基因组水平的逆转录转座子的系统分析提供了可能。

【关键词】LTR逆转录转座子;结构特征;鉴定方法

ClassⅠ又被称为逆转录转座子,逆转录转座子根据结构的不同又被分为LTR逆转录转座子和non-LTR逆转录转座子,non-LTR逆转录转座子包括长散布原件(LINE)和短散布原件(SINE)。non-LTR的长度从数千碱基(如典型的LINE)到500bp(多数的SINE)不等。non-LTR反转录转座子的不完全逆转录会产生很多小片段,例如MITE。这些转座子的长度也是大小不一的,例如MULE,是在拟南芥中发现的其长度是从444bp-19397bp不等。non-LTR反转录转座子具有与LTR反转录转座子完全不同的结构和复制机制。 non-LTR反转录转座子,在哺乳动物基因组中首次发现,但也在植物,真菌和无脊椎动物中被鉴定出来。根据所有已知的LTR的RT序列和所有已知non-LTR反转录转座子的系统进化分析,显然是同源的,表明这两个主要类别来自共同的祖先。需要强调的是,在大多数基因组中,具备完整序列的转座子是很少的。大多数都是非自主转座的转座子,甚至是一些很小的片段。LTR逆转录转座子包括五个不同的亚族,Ty1-copia,BEL,DIRS和Ty-3 Gypsy,ERV(vertebrate retrovirus)它们广泛分布于动物和植物中。BEL逆转录转座子主要在后生动物中发现较多。所有的LTR逆转录转座子在结构特征,序列排列特点以及转座机制上都是非常相似的,通常翻译gag和pol两个基因,包含在一个开放阅读框或者两个开放阅读框里面,LTR逆转录转座子与逆转录病毒十分相似,而根据是否能够进行自主的转座,逆转录转座子又可以分为两大类,一类是自主型的逆转录转座子,本身具备完整的结构可以进行自主的转座过程,另一类为非自主转座子,主要是在植物中发现的如LARDS和TRIM,非自主型的转座子,必须在自主转座子的存在下才可以进行转座。非自主转座子的长度根据研究也在500-5000bp不等。

一般gag基因形成的蛋白主要包括三种都与病毒蛋白外壳类似:MA(matrix)基质蛋白,CA(capsid)蛋白外壳,,NC(nucleocapsid)核壳体,gag形成的多聚蛋白一般进化非常快所以很少用他们来做系统进化分析,pol基因是聚合酶基因,能够翻译成各种与转座有关的蛋白,主要包括4种蛋白的结构域,有RT,INT,RNaseH,而RT与RNaseH往往是连续的,又经常被称为RT/RNaseH,通常這段序列比较保守可以用来对不同转座子进行进化分析,RT序列是最为保守的, gag蛋白与逆转录病毒衣壳蛋白高度相似,某种程度上揭示着逆转录转座子与逆转录病毒存在进化上的关系。Pol基因含有编码多蛋白的长ORF,该基因编码的蛋白及其作用:整合酶(INT),逆转录酶(RT)和RNase H(RH)。RT和RH参与反转录转座子的复制和转座,INT帮助逆转录转座子的DNA形式整合到宿主基因组中。尽管Ty1 / Copia和Ty3 / Gypsy的基本结构相似,但Pol基因中的结构域顺序不同,即Ty1 / Copia中的PR-INT-RT-RH和Ty3/Gypsy中的PR-RT-RH-INT。在ORF的末端是长末端的重复序列(LTRs),LTRs的长度在也在几十个碱基到几千个碱基之间,一般结构为5-TG……CA-3,LTRs不翻译任何的蛋白,只有与逆转录活动有关的启动子与终止子,5端紧挨着引物结合位点(PBS),大约有18bp,能够与特定的tRNA结合,是逆转录起始的第一步;3端紧挨着多嘌呤位点(PPT),可以作为引物,从而促进转座过程中第二条cDNA链的合成。 LTR的五个超家族又具有各自的结构特点,所含酶的种类也是有所差异的。

LTR逆转录转座子的各个分类具有各个家族明显的结构特征,Gypsy, BEL/PAO与Copia之间在结构上有所不同,主要的差异在于整合酶的位置不同,但这个分布特点并不是绝对的,也会有一些例外的情况出现,例如Gypsy超家族里面的Gmer1本身整合酶是位于逆转录酶上游的,而DIRS与Ngaro与其他几类逆转录转座子的则区别比较大,这两类逆转录转座子属于YR(酪氨酸重组酶)逆转录转座子,酪氨酸重组酶(YR)逆转录转座子在植物,原生生物,真菌以及各种动物中包括脊椎动物,棘皮动物和线虫中都有发现,YR逆转录转座子的“gag-RT-RNaseH”结构域排列,类似于 LTR逆转录转座子,但YR逆转录转座子缺少Pro,典型结构包含反向末端重复序列(ITR),内部ORF和由侧翼ITR序列的重复衍生的内部互补区(ICR)构成。YR它不编码天冬氨酸蛋白酶(pep)或DDE型整合酶,YR通常负责位点相似或相同DNA序列之间的特异性重组。 YR逆转录转座子又可以分为DIRS,Ngaro和VIPER三个家族。 DIRS逆转录转座子与其他两个YR逆转录转座子家族的不同之处在于存在保守的甲基转移酶(MT)结构域,类似于各种噬菌体编码的MT,Ngaro逆转录转座子与DIRS逆转录转座子有相似的ORF,但侧翼重复的方向不同。DIRS逆转录转座子由反向重复分隔,但Ngaro逆转录转座子的两侧是直接重复(称为A1,A2,B1和B2)。最早被鉴定出来的DIRS逆转录转座子主要来自粘菌Dictyostelium discoideum, DIRS逆转录转座子在植物,真菌,原生生物和动物的广泛分布表明该类型的转座子在真核生物进化的早期出现。DIRS逆转录转座子与其他LTR逆转录转座子转座机制也有一些不同,其他的LTR逆转录转座子形成的染色体外的DNA分子是线性的而DIRS逆转录转座子的复制最有可能导致圆形染色体外分子。这些可能通过编码的酪氨酸重组酶催化的重组反应插入宿主基因组中。而ERV1则更为特殊,具有另外的ORF框,称为env,其编码具有感染性的蛋白质,env基因存在于逆转录病毒中,pol基因内的结构域顺序也是重新排列。

猜你喜欢

结构特征
论莫言小说的复线式结构特征
药物与辅料相互作用差异与结构特征的相关性研究
论东巴文对称型字组的结构特征及音义功能
赋格段概念界定与结构特征辨析
结构特征的交互作用对注塑齿轮翘曲变形的影响
特殊环境下双驼峰的肺组织结构特征
2012年冬季南海西北部营养盐分布及结构特征
橡胶相结构特征对ABS树脂力学性能的影响
基于测井响应评价煤岩结构特征
基于结构特征的身份证号码基数排序算法研究