APP下载

鸡DLK1基因的生物信息学分析

2011-08-08闫晓红

东北农业大学学报 2011年6期
关键词:禽类印记糖基化

闫晓红,王 宁

(东北农业大学动物科学技术学院,哈尔滨 150030)

DLK1(Delta-like 1 homolog)是一个跨膜蛋白,它的膜外区具有六个特征性的串联表皮生长因子样重复序列(EGF-like repeat)。DLK1又称前脂肪细胞因子(Preadipocyte factor 1)、SCP-1(Stromal cell derived protein-1),FA-1 (Fetal antigen 1),Zog(Zone glomerulosa specific clone)及 pG2。DLK1 是前脂肪细胞分泌的一个重要脂肪细胞因子,它参与多种细胞分化过程,包括脂肪形成、造血作用、骨生成、肾上腺和神经内分泌细胞的分化。此外,它还参与外周和中枢神经系统的分化,还与生长抑制及未分化肿瘤的恶性程度有关[1]。

DLK1蛋白的编码基因是DLK1基因。DLK1基因的第五外显子存在选择性拼接,因此该基因在不同动物和细胞存在不同拼接形式的转录本,其不同拼接形式转录本的表达量因组织和发育阶段不同而不同[2]。鼠的DLK1基因有4种不同的选择性转录拼接形式,除了全长的DLK1 mRNA转录本DLK1A之外,还有3种短的选择性拼接形式DLK1B、DLK1C、DLK1D[2]。牛、羊及猪的DLK1基因的主要拼接形式为DLK1C2。人和鸡的DLK1基因都仅有一种全长的DLK1 mRNA转录本DLK1A[3]。DLK1A和DLK1B所编码蛋白的膜外区存在两个蛋白酶切割位点,一个位于第四个EGF串联重复序列附近,蛋白酶在这个位点切割后释放出一个含有3个EGF重复序列的小的可溶性蛋白,大小约为24~25 ku。另一个切割位点位于近膜区,由 TACE(Tumor necrosis factor α converting enzyme,ADM17)切割,切割后释放出一个含有6个EGF重复序列的大的可溶性蛋白(人可溶性蛋白为38 ku,鼠可溶性蛋白为 50 ku)[4]。(见图 2)DLK1A 和 DLK1B 编码的DLK1蛋白经蛋白酶切割后所释放出的一大一小两个可溶性蛋白,目前仅知大的可溶性蛋白具有生物活性,它具有抑制脂肪细胞分化的能力[2-5]。而DLK1C和DLK1D所编码的蛋白都没有近膜区,因此,它们所编码的蛋白只有一个蛋白酶切点,酶切后只产生一个小的可溶性蛋白。

鸡和哺乳动物的DLK1基因具有相似表达模式,DLK1基因在胚胎期的多种组织和细胞中表达,但出生后其表达仅限于前脂肪细胞[3],因此DLK1基因常被用作前脂肪细胞的标志基因。体内和体外研究表明,DLK1基因促进哺乳动物肌肉的生长发育,但抑制脂肪组织的生长发育[3]。DLK1基因的这一特性对于提高动物生产具有重要的意义。哺乳动物DLK1基因是一个父源表达而母源沉默的印迹基因[6],但禽类并不存在印记基因,而且试验也证实禽类DLK1并不是印记基因[7],它是双等位基因表达。鸡DLK1基因已被克隆[3],但其功能和调控机制还不清楚。本文采用生物信息学方法,开展了包括鸡在内的13种动物DLK1蛋白的多序列比对、分子进化分析、糖基化分析,比较了人、鼠以及鸡的DLK1基因结构、基因同线性、启动子结构、3′非编码区(3′UTR)结构等。本研究为下一步鸡DLK1基因的试验研究奠定了基础。

1 材料与方法

1.1 材料

人、鼠、猴、牛、猪、羊、袋鼠、原鸡、鸡、火鸡、珍珠鸡以及鸭嘴兽等13种动物的DLK1蛋白序列以及人、鼠、鸡等的mRNA参考序列,序列均来自美国国家生物信息中心(NCBI,National center for biotechnology information)(http://www.ncbi.nlm.nih.gov)。

1.2 方法和软件

1.2.1 蛋白质序列比对分析

利用EBI在线多序列比对软件Clustalw2.0。

1.2.2 蛋白质分子进化分析

采用 MEGA4.1(Molecular evolutionary genetics analysis)软件分析,使用邻近相连算法 NJ(Neighbor joining model)构建系统进化树,计算距离采用泊松校验(Poisson correction)的方法,自展检验(Bootstrap test)估计NJ法所构系统树的可靠性,重复次数5 000次,其余参数取默认值。

1.2.3 蛋白质结构分析

利用蛋白结构预测和功能分析工具SMART(Simple modular architecture research tool)。

1.2.4 蛋白糖基化分析

利用真核生物蛋白功能位点数据库ELM分析(Eukaryotic linear motif resource for functional sites in proteins)。

1.2.5 基因结构分析

利用UCSC基因组浏览器(UCSC genome browser)提供的在线分析工具。PolyAde的加尾信号采用PolyA_SVM分析。

1.2.6 启动子分析

采用McPromoter和TRES软件分析,CpG岛分析采用UCSC基因组浏览器在线软件分析。

1.2.7 3′UTR 结构分析

3′UTR结构的功能元件分析采用UTR scan分析,micro RNA的结合位点采用MicroInspector软件分析。

2 结果与分析

从NCBI的蛋白质序列数据库和核酸序列数据库查询动物的全长DLK1蛋白质序列和mRNA序列,获得13种动物的全长DLK1蛋白序列及其相应的mRNA序列(见表1)。各种动物DLK1蛋白的大小有一定差异,其中鸡、原鸡、火鸡的DLK1蛋白大小均为386 aa,而人、猴、大鼠、羊、猪、珍珠鸡的DLK1蛋白序列长为383 aa,小鼠的为385 aa,鸭嘴兽的为375 aa,袋鼠的则为379 aa。

表1 不同动物DLK1基因查询信息Table 1 Information of DLK1 genes in 13 different animals

2.1 DLK1蛋白质序列分析

2.1.1 DLK1蛋白质序列比对分析

利用Clustalw 2.0软件对13种动物的全长DLK1蛋白做序列比对分析(见表2),结果表明,哺乳类(袋鼠除外)人、鼠、牛、猪、羊及猴的DLK1蛋白序列相似度在81%~96%之间,禽类中鸡、原鸡、火鸡和珍珠鸡的DLK1蛋白序列相似度在85%~100%。物种间进化关系越近则它们的DLK1蛋白序列的相似度越高,反之,动物间进化关系越远,DLK1蛋白序列相似度越低。例如,人与猴DLK1蛋白序列相似度高达96%,小鼠与大鼠为95%,牛与羊为96%,鸡与原鸡为100%,鸡和火鸡为97%,但哺乳类人、猴、鼠、牛、羊和猪与禽类鸡、火鸡、珍珠鸡的DLK1蛋白序列的相似度仅为46%~56%。

2.1.2 DLK1蛋白分子进化分析

选取上述13种动物的全长DLK1蛋白序列,利用分子进化遗传分析软件MEGA4.1构建系统进化树,结果如图1所示。13种动物的DLK1蛋白分子被聚为两大组,哺乳类组和禽类组。哺乳类组包括4个亚组,分别为:人与猴组、鼠类组、家畜类组,袋鼠组。鸭嘴兽与禽类聚在同一大组,其中鸡、原鸡、火鸡和珍珠鸡一组,鸭嘴兽独自一组,这表明鸭嘴兽与禽类的亲缘关系比起哺乳类更近。从遗传距离矩阵分析结果也可以看出(见表3),禽类鸡与原鸡、火鸡和珍珠鸡间的遗传距离很小,在0.000~0.0097之间;哺乳类人、鼠、猴、牛、猪和羊(袋鼠除外)彼此间的遗传距离稍大些,在0.021~0.179,但仍表现出动物间进化关系越近则遗传距离越小的规律,如人与猴之间的进化距离为0.021,鼠类间0.045、家畜(牛、羊及猪)之间<0.093,而遗传差异较大的人与鼠间遗传距离为0.141,人与家畜猪、牛和羊间的遗传距离为0.145~0.159,与禽类间遗传距离则>0.410。袋鼠是低等的哺乳动物,它虽与其他高等哺乳类同组,但在哺乳类组中单独为一组,这也表明袋鼠同人、猴、鼠、牛、猪等哺乳类动物的亲缘关系较远。鸭嘴兽是卵生的单孔类哺乳动物,是现存最原始的哺乳动物,它在进化上处于爬行类动物与哺乳类动物中间,它是形成高等哺乳动物的进化环节。根据DLK1蛋白序列进化分析,鸭嘴兽与禽类动物间的进化距离<0.307,而与哺乳类动物间的遗传距离>0.414,故被聚类到禽类组。鸭嘴兽全基因组序列分析发现,鸭嘴兽基因组是一个基因混合体,包含部分鸟类基因、部分爬行动物类基因以及部分哺乳动物类基因[8],这可能是鸭嘴兽被聚类到禽类组中的原因。

表2 不同动物DLK1蛋白全长序列多序列比对结果Table 2 Mutiple sequence alignment of DLK1 protein in different animals

图1 用邻接法(NJ)构建的13种动物DLK1蛋白的系统进化树Fig.1 Phylogenetic tree of DLK1 protein sequence from 13 different animals.

表3 不同动物DLK1蛋白质分子进化距离矩阵Table 3 Genetic distance of DLK1 proteins among 13 different animals

2.2 DLK1蛋白结构分析

利用蛋白质结构预测工具SMART分析13种动物全长DLK1蛋白序列,发现DLK1蛋白都由信号肽(Signal peptide)、EGF结构域(EGF domain)构成的膜外区以及跨膜区(Transmembrane)组成。绝大多数动物(人、猴、鼠、猪、羊、袋鼠、原鸡、鸡、火鸡及珍珠鸡)的DLK1蛋白都有6个EGF domain,只有牛和鸭嘴兽的DLK1蛋白有5个EGF domain。另外,EGF domain中与钙离子结合的EGF domain(EGF_Ca)结构域在不同动物DLK1蛋白中分布不同,人、鼠、牛、猪、羊的EGF_Ca为第三个EGF,而袋鼠及禽类(原鸡、鸡、火鸡和珍珠鸡)的EGF_Ca则为第五个EGF。Clustalw 2.0比对结果显示,DLK1蛋白EGF_Ca及跨膜区的序列组成在同类物种间具有较高的保守性。哺乳类动物的EGF_Ca结合位点序列的相似度为81%~97%,禽类在86%~100%。哺乳类动物DLK1蛋白跨膜区序列间的相似度达91%~100%,不同禽类动物DLK1蛋白跨膜区序列的相似度达100%。此外,与哺乳类动物不同,禽类(原鸡、鸡和火鸡)DLK1蛋白序列的N端都有7个连续的半胱氨酸(Cys)。

结果见图2。

图2 DLK1蛋白结构域及其剪切位点Fig.2 Schematic of DLK1 protein domain structure and its cleavage sites

2.3 DLK1蛋白糖基化分析

蛋白质糖基化是一种重要的翻译后修饰,约有一半以上的蛋白质发生糖基化。大量的研究表明,糖基化对蛋白质的结构和功能具有重要影响,它能影响蛋白质的折叠、运输、定位等。通过ELM(Eukaryotic linear motif resource for functional sites in proteins)数据库,分析比较这13种动物DLK1蛋白的糖基化位点。结果发现,哺乳类动物人、猴、鼠、牛、羊、猪的全长DLK1蛋白序列共有8个保守的糖基化位点,其中O-型2个(S/T),N-型6个(N),分别对应小鼠全长DLK1蛋白序列的第41N(牛、羊除外)、94S、100N、134N、165N、174N、216S(猪除外)和330N。在其中的四个糖基化位点100N、134N、165N和216S处,禽类原鸡、鸡、火鸡、珍珠鸡也具有相同的糖基化位点,它们分别对应于鸡全长DLK1蛋白序列的第105N、139N、170N和218S。除此之外,原鸡、鸡、火鸡和珍珠鸡的DLK1蛋白序列还有另外6个保守的糖基化位点,分别对应于鸡全长DLK1蛋白序列的60N、181S、255N、363N、378N和382N位点。

小鼠DLK1蛋白的大的可溶性蛋白片段由261个氨基酸构成,试验证实它具有3个N-糖基化位点 Asn77(100N)、Asn142(165N)、Asn151(174N)和 3 个 O-糖基化位点 Ser71(94S),Ser193(216S),Thr201[9]。这些糖基化位点分别对应于ELM数据库对小鼠全长DLK1蛋白预测得到的糖基化位点100N,165N,174N,94S,216S,小鼠DLK1蛋白糖基化位点的实验检测结果与ELM数据库预测结果一致,这说明ELM数据库对糖基化位点预测的准确性较高。应用ELM数据库预测分析,可知鸡DLK1蛋白的大的可溶性蛋白片段可能存在7个糖基化位点,它们分别是60N、105N、139N、170N、181S、218S和255N。除此之外,鸡全长DLK1蛋白的胞浆区还可能存在363N、378N和382N 3个糖基化位点。

2.4 鸡DLK1基因结构

利用 UCSC genome browser在线软件 BLAT,以鸡、人和鼠的DLK1 mRNA参考序列(NM_0011 42254、NM_003836、NM_010052)为查询序列,分别对鸡、人和鼠的基因组数据库进行Blat搜索,可见鸡DLK1基因位于#5染色体,大小为9 616 bp,它有5个外显子和4个内含子。人DLK1基因位于#14染色体,大小为8 205 bp,与鸡的DLK1基因结构相同,同样具有5个外显子4个内含子,起始密码子位于第一个外显子。小鼠DLK1基因位于#12染色体,大小为7 469 bp,不同于人和鸡,它有6个外显子和5个内含子,其起始密码子位于第二外显子上。鸡的基因组大约是人基因组的35%,鼠的45%[10],但在这三个动物中意想不到的是,鸡的DLK1基因最大,而且鸡DLK1基因的内含子大小累计之和也大于人和鼠的,鸡DLK1基因有一个最大内含子近5 kb,而人和小鼠DLK1基因最大内含子都小于3 kb。

2.5 基因同线性分析

DLK1基因是哺乳动物的一个印迹基因[6],它分别位于人#14染色体、小鼠#12染色体及羊#18染色体,印记基因的特征之一是呈簇存在,大小从几百kb到上千kb[11]。DLK1基因的印记簇为DLK1-DIO3印迹基因簇,该区域得到了人们广泛的关注和研究[12-13]。人和鼠DLK1-DIO3印迹基因簇都存在三个父源表达的基因:DLK1、类反转座子基因1(RTL1)、3型脱碘酶基因 (DIO3),多个母源表达长的非编码RNA和短的非编码RNA基因:Meg3/Gtl2、Anti-Peg11、Meg8、Irm/“Rian”、AK050713、AK053394、Meg9/Ming,以及核仁小 RNA簇和microRNA基因簇等[12]。人和鼠的DLK1-DIO3区域的基因同线性水平很高。鸡DLK1基因位于#5染色体上,与人和小鼠相比,鸡与人和鼠的DLK1基因具有一定的同线性,鸡DLK1基因和DIO3基因也位于同一染色体上,且两者位置相邻。根据DLK1和DIO3的mRNA参考序列,利用UCSD genome browser在线分析软件分析,可知鸡DLK1基因和DIO3基因间序列最短,大小仅为348.9 kb,而人和鼠的DLK1-DIO3基因间序列较长,分别约为836和827.6 kb。与人和鼠的一个显著不同之处是,鸡DLK1基因和DIO3基因间不存在其他基因。

2.6 DLK1基因启动子分析

根据NCBI数据库中人(NM_003836)、小鼠(NM_010052)以及鸡(NM_001142254)的mRNA序列,利用UCSC genome browser在线软件,分别获取人、小鼠以及鸡的起始密码子上游2 kb的基因组序列。CpG岛分析发现,这三种动物的DLK1基因起始密码子上游2 kb区域都有一个CpG岛,且都靠近起始密码子处(1 kb内)。其中鼠的CpG岛最大是862 bp,甲基化区包括第一外显子、第一内含子以及第二外显子;人的CpG岛为648 bp,甲基化区域包括整个第一外显子;鸡的CpG岛大小为586 bp,包括第一外显子和部分第一内含子。甲基化区域往往涉及到转录区域,CpG岛一般与基因的启动子区重叠,由此推测,人、小鼠以及鸡的DLK1基因的启动子位于起始密码子上游1 kb范围之内。进一步采用McPromoter软件分析,结果显示人、小鼠以及鸡的DLK1基因起始密码子上游1 kb范围之内作为启动子区的可能性最大。依据CpG岛分析和启动子分析结果可以确定,人、小鼠和鸡的DLK1基因的启动子区位于起始密码子上游1 kb范围内。利用UCSC基因组浏览器分析人、小鼠和鸡启动子区的保守性,发现三者核苷酸序列的保守性非常低,鸡与鼠的启动子区没有同源区域,鸡与人仅在启动子区有一个77 bp的同源性区域,这一同源性区域具有一个CAP(Cap signal for transcription initiation)信号,1 个 MZF、c-Myb、STRE、AML-1a,5个 HSF位点和2个ADR1位点。利用TRES软件比较人、小鼠和鸡的启动子区的保守转录因子结合位点(Search TF Binding Sites/Cis-Elements using IUPAC consensus strings),查询5 919个位点,共发现了35个保守位点,包括10个SP1、2个AP2、2个GATA1结合位点,此外,还发现有TFIIB 结合位点和转录酶复合体的结合位点、PEA3、ETS、MBF-I、E2A、malT、P3A1/P3A2、Lmo2、SEF4、CTCF以及多个未知结合位点。目前已知SP1/KLFs转录因子家族成员、AP2及GATA等转录因子均在脂肪细胞表达,并在脂肪细胞分化中发挥重要调控作用。启动子区保守性转录因子结合位点分析结果显示,人、小鼠和鸡DLK1基因启动子区存在多个这些转录因子的结合位点,这为下一步分析DLK1基因的转录调控机制提供了方向,具有重要的参考价值。

2.7 DLK1基因的3′UTR区分析

基因的3′非编码区 (3′UTR)是基因表达调控的重要区域,它在基因表达转录后的调控中发挥重要作用,3′UTR调控mRNA的定位、翻译及稳定性等[14]。mRNA的3′UTR区的顺式作用元件除了有microRNA结合位点,还有特定RNA结合蛋白的结合基序(Motif)。mRNA的3′UTR序列保守性很低,转录后的调控主要依赖于其存在的顺式元件。

鸡DLK1基因的3′UTR序列目前尚未报道,为了获取3′UTR序列,我们利用UCSC的BLAT软件,将鸡mRNA序列(NM_001142254)与鸡基因组序列进行比对,取终止密码子下游1 kb基因组序列,进而采用PolyA_SVM分析Poly A加尾信号(PolyA_SVM:analysis and prediction of mRNA polyadenylation sites by Support Vector Machine)[15]。PolyA_SVM分析结果显示,该序列有四个可能的Poly A加尾信号,分别位于终止密码子下游263、319、403及629处,cutoff值分别为1.2、5.7、0.5及5.3,该软件是cutoff值越小,结果可靠性越大,由此推测403 bp处的AATAAA作为加尾信号的可能性最大,其切割加尾的位置在419 bp处。为验证上述推测的可靠性,利用UCSC Genome Browser Home在线分析软件比较终止密码子下游1 kb序列与鸡EST序列,发现绝大多数鸡DLK1基因的EST序列与该1 kb序列的5′端匹配,即位于所推测的419 bp的范围之内,与其匹配最长的一个EST(BU353140)序列的同源性为96.1%,该EST序列(BU353140)仅比所推测的鸡DLK1基因的3′UTR序列的3′端少6个核苷酸。这说明通过生物信息学方法分析获得的鸡DLK1基因的3′UTR序列是正确的。利用这419 bp序列做Blast分析,发现其1~364区与珍珠鸡DLK1基因(XM_002200261)的3′UTR序列有达77%的同源性,这也提示我们鸡的DLK1基因3′UTR序列是正确的。

根据人和鼠的DLK1基因参考序列(NM_003836、NM_010052),分别获得人和鼠DLK1基因的3′UTR序列,它们大小分别为227和331 bp。利用UCSC Genome Browser在线软件分析DLK1基因3′UTR序列的保守性,发现鸡与鼠的3′UTR序列无相似性,但与人的DLK1基因的3′UTR序列组成有一定的相似性,鸡与人DLK1基因3′UTR序列 的5′端存在一个由172个核苷酸组成的相似区域;鸡与人和鼠3′UTR的3′端序列相似性非常低,但鸡与斑马鱼3′UTR的3′端序列相似度较高。另外,鸡与负鼠(Opossum)的DLK1的3′UTR保守性也较高。

试验还利用UTR scan做了人、鼠和鸡3′UTR的Motif分析,结果显示,除了都有加尾信号(Polyadenylation Signal,PAS)外,三者没有找到其他相同的基序。

鸡和鼠的3′UTR都具有一个IRES(Internal Ribosome Entry Site,IRES)元件。此外,鸡还有一个MBE结合位点(Musashi binding element)。

DLK1基因3′UTR序列的microRNA结合位点分析采用microRNAinspector软件(Version 1.5,miRBASE 13)(http://bioinfo.uni-plovdiv.bg/microinsp ector/),按照软件默认的杂交温度和自由能阈值条件分析人、鼠及鸡DLK1基因的microRNA结合位点,结果显示,人具有27个microRNA结合位点(包括两个hsa-miR-611和两个hsa-miR-127-3p)、鼠有34个microRNA结合位点(包括3个mmumiR-1966和三个 mmu-miR-1943)、鸡有 27个microRNA结合位点(包括两个gga-miR-1619)。比较发现,鸡、鼠以及人三者之间没有相同的microRNA结合位点,但人和鼠具有5个相同的micorRNA结合位点(miR-16、miR-195、miR-339-3p、miR-449a、miR-449b)。由此可知,鸡DLK1基因的转录后调控与哺乳动物的转录调控差异很大。

3 讨论与结论

印记基因虽然数量不多,但其功能多样,它们在哺乳动物生长发育以及维持人和动物的健康中发挥重要作用,印记基因表达异常将导致包括癌症在内的疾病发生。基因组印记是一种表观遗传学现象,表现为只有双亲中一方的基因表达。基因组印记仅发现于胎盘类哺乳动物,鸟类等低等动物没有这种现象[10]。基因的印记是一种基因表观调控机制,DLK1基因在哺乳动物中是一个父源表达而母源沉默的印迹基因。禽类并不存在印记基因,而且试验也证实鸡DLK1基因并非印记基因。目前非哺乳动物DLK1基因的功能和表达调控还不清楚。因此,开展鸡的DLK1基因研究对于了解印记基因的进化、阐明鸡脂肪细胞分化的机制以及鸡的分子育种等具有重要意义。

从蛋白序列的多序列比对分析、分子进化分析、蛋白糖基化分析以及共线性分析来看,鸡与人和鼠的DLK1蛋白相似性很低,进化关系较远,但从mRNA拼接形式、基因结构、启动子结构、3′UTR结构以及CpG岛来看,鸡和人却有许多相似之处,提示鸡的DLK1基因的调控与人的DLK1基因调控相似。这一分析结果与鸡的比较基因组学研究结果类似,比较基因组学研究发现,鸡染色体上的基因结构更接近于人而不是鼠[16]。

microRNA是一类短的内源非编码RNA(noncoding RNA),大小约为20~22个核苷酸,它通过与靶基因mRNA的3′UTR的结合位点(micro RNA binding site)结合,参与基因转录后调控(Posttranscriptional regulation)。microRNA 参与细胞增殖、凋亡、分化、代谢、发育等多种生物学过程。近年来的研究证实,microRNA也是一类广泛存在的重要反式作用因子,绝大多数基因受microRNA的调控。3′UTR结构分析发现,人、鸡及鼠三者没有相同的microRNA识别位点,除了加尾信号外,也没有其他相同的调控元件,这表明鸡与人和鼠在DLK1基因转录后的调控有极显著的差别。DLK1基因在人和鼠等哺乳动物为印记基因,而在鸡并非印记基因,因此,推测DLK1基因作为印记基因和非印记基因时其调控方式是不同的。这些分析结果为下一步的实验研究提供了依据和方向。

人和鼠的DLK1-DIO3区域大小均约为1 Mb,而鸡的DLK1-DIO3区域约为0.4 Mb,同线性分析显示,人和鼠该区域同线性程度很高,人和鼠DLK1基因和DIO3基因间插入有多个基因和小的非编码RNA基因,但是鸡的DLK1-DIO3区域较小,该区域也没有人和鼠的相应的基因和非编RNA基因。由于DLK1基因是哺乳动物的一个印记基因,本研究提示该区域的基因组印记现象出现晚于DLK1和DIO3基因的同线性。推测DLK1-DIO3基因间插入其他基因和非编RNA基因后才出现基因组该区域的印记现象。

鸡的基因组大小为1.2×109bp,大约是人基因组的35%,鼠的45%[10]。基因结构分析显示,与人和鼠相比,鸡DLK1基因具有最大的内含子,而且鸡DLK1基因的内含子大小之和也最大。有研究报道,内含子长度随物种的复杂性升高而变长[17],人和鼠的进化程度都要高于鸡,但鸡DLK1基因并不符合这一规律。哺乳动物印记基因和非印记基因相比较分析表明,印记基因具有较少的内含子和较小的内含子[18]。DLK1基因是哺乳动物的一个印记基因,但在禽类它并不是印记基因,根据本研究结果我们推测动物在进化过程中,从非印记基因向印记基因进化的过程中其内含子变小。

[1] Nueda M L,García-Ramírez J J,Laborda J,et al.Dlk1 specifically interacts with insulin-like growth factor binding protein 1 to modulate adipogenesis of 3T3-L1 cells[J].J Mol Biol,2008,379(3):428-442.

[2] Wang Y,Kim K A,Kim J H,et al.Pref-1,a preadipocyte secreted factor that inhibits adipogenesis[J].J Nutr,2006,136(12):2953-2956.

[3] Shin J,Lim S,Latshaw J D,et al.Cloning and expression of deltalike protein 1 messenger ribonucleic acid during development of adipose and muscle tissues in chickens[J].Poult Sci,2008,87(12):2636-2646.

[4] Wang Y,Sul H S.Ectodomain shedding of preadipocyte factor 1((Pref-1)by tumor necrosis factor alpha converting enzyme(TACE)andinhibitionofadipocytedifferentiation[J].Mol Cell Biol,2006,26(14):5421-5435.

[5] Smas C M,Chen L,Sul H S.Cleavage of membrane-associated pref-1 generates a soluble inhibitor of adipocyte differentiation[J].Mol Cell Biol,1997,17(2):977-988.

[6] Sul H S.Minireview:Pref-1:Role in adipogenesis and mesenchymal cell fate[J].Mol Endocrinol,2009,23(11):1717-1725.

[7] Shin S,Han J Y,Lee K.Cloning of avian Delta-like 1 homolog gene:the biallelic expression of Delta-like 1 homolog in avian species[J].Poult Sci,2010,89(5):948-955.

[8] Warren W C,Hillier L W,Marshall G J A,et al.Genome analysis of the platypus reveals unique signatures of evolution[J].Nature,2008,453(7192):175-183.

[9] Krogh T N,Bachmann E,Teisner B,et al.Glycosylation analysis and protein structure determination of murine fetal antigen 1(mFA1)-the circulating gene product of the delta-like protein(dlk),preadipocyte factor 1(Pref-1)and stromal-cell-derived protein 1(SCP-1)cDNAs[J].Eur J Biochem,1997,244(2):334-342.

[10] Burt D W.Chicken genome:Current status and future opportunities[J].Genome Res,2005,15(12):1692-1698.

[11] Bartolomei M S.Genomic imprinting:employing and avoiding epigenetic processes[J].Genes Dev,2009,23(18):2124-2133.

[12] Hagan J P,O'Neill B L,Stewart C L,et al.At least ten genes define the imprinted Dlk1-Dio3 cluster on mouse chromosome 12qF1[J].PLoS One,2009,4(2):e4352.

[13] 张意军,屈良鹄.非编码RNA与哺乳动物基因组印记的起源[J].中国科学C辑:生命科学,2009,39(1):3-12.

[14] Chatterjee S,Pal J K.Role of 5'-and 3'-untranslated regions of mRNAs in human diseases[J].Biol Cell,2009,101(5):251-262.

[15] Lee J Y,Yeh I,Park J Y,et al.PolyA_DB 2:mRNA polyadenylationsitesinvertebrategenes[J].NucleicAcidsRes,2007,35:165-168.

[16] Hillier L W,Miller W,et al.(International Chicken Genome Sequencing Consortium)Sequence and comparative analysis of the chicken genome provide unique perspectiveson vertebrate evolution[J].Nature,2004,432(7018):695-716.

[17] Gopalan V,Tan T W,Lee B T,et al.Xpro:Database of eukaryotic protein-encoding genes[J].Nucleic Acids Res,2004,32:D59-63.

[18] Hurst L D,McVean G,Moore T.Imprinted genes have few and small introns[J].Nat Genet,1996 12(3):234-237.

猜你喜欢

禽类印记糖基化
影响禽类养殖的不利因素及措施
禽类呼吸道疾病防治措施
糖基化燕麦分离蛋白制备的工艺优化研究
过去一年,国家立法的深刻印记
解除美国禽类产品进口限制
30年印记
幸福印记
禽类呼吸道疾病的防治体会
糖基化终末产物与冠脉舒张功能受损
油炸方便面贮藏过程中糖基化产物的变化规律