APP下载

拟南芥未知基因AT1G16730 的节律性表达模式预测

2020-03-24李浠榕

科学技术创新 2020年3期
关键词:信息学节律生物钟

李浠榕

(西安交通大学附属中学,陕西 西安710000)

1 背景概述

1.1 生物钟概述

生物因为光、暗,冷、热等呈周期变化的自然因素产生的节律行为具有周期性,而随着外界自然环境变化,生物体自身进化出了一套能够进行前瞻性调节的机制。根据节律的长短以及响应不同的环境变化,这个机制的节律可分为:日节律、月节律、季节节律和年节律等。而被研究最多的是以24 小时为周期的日节律变化,这是生物因昼夜变化做出的适应,从生物的生理方面进行有周期性波动的内在节奏称为生物钟(Circadian Clock)。

植物的生物钟被首先发现与植物的叶片移动,比如菜豆叶片在光照条件不变的条件下,也会做出上下摆动,而叶子的升起和下降运动的所构成的周期接近27 小时,近似于一天的24小时,这是植物的近似昼夜节律的典型例子。

一般来说,植物生物钟系统可以分成三个组成部分:输入途径、核心振荡器和输出途径。输入途径负责将外界环境变化信号传导入生物钟的信号通路,从而使核心振荡器响应环境信号,已知的输入途径有接受光- 暗变化以及冷- 热变化等信号通路。核心振荡器定位于细胞核内,为几个以转录因子为主的基因所构成的互相抑制调控的闭合回路,并利用表达高低不同产生近似24 小时的昼夜节律的振荡。输出途径为核心振荡器通过时间性表达差异调控植物其他基因的调控机制,单个振荡器可以通过其转录因子特性,调控多个其他基因的表达,并利用其本身的表达节律性从而影响其他基因的表达节律性,以达到调控诸多关键基因从而控制植物生长发育和重要生理过程的目的。

1.2 拟南芥基因组研究概况

十字花科植物拟南芥为植物研究的模式物种,具有在全球分部广,生长周期短,结种多,基因组小等作为植物研究的优点。2000 年,国际拟南芥基因组合作联盟首先完成了拟南芥的基因组测序,是第一种完成全基因组测序和分析的植物,并阐述了拟南芥基因组序列与植物演化和农业的关系,并介绍了其他植物基因组的课题。2016 年6 月9 日,1135 个拟南芥(Arabidopsis thaliana)基因组重测序的论文在Cell 期刊在线发表。这篇对1135 个拟南芥基因组全基因组序列分析的论文的发表,宣告了对模式植物拟南芥至少1001 个品系(生态型)的全基因组序列分析计划项目一个阶段的结束,该项目揭示不同株系的野生型拟南芥基因组上自然的序列突变,并发现了拟南芥存在着祖先的残余群体。

2 材料与方法

2.1 拟南芥基因组生物信息学资源

前文已叙述过拟南芥基因组测序的已完成工作,在2017年,拟南芥基因组注释得到了更新。现今拟南芥的全部生物学信息位于The Arabidopsis Information Resource (TAIR)网站上供研究人员查询使用,并包括拟南芥27 000 个基因和35 000个编码蛋白的研究分析信息。通过该网站可以寻找各个拟南芥基因的序列,以及关于该基因的很多分析信息,另外还可以根据每一个基因的位置查找并且购买该基因的突变体。本文的生物信息学资源均来自TAIR 网站。

2.2 基因表达节律性预测分析

Diurnal 网页是对多个植物基因的节律性表达进行预测的服务网页,为的Mockler 实验室构建,是连接计算生物信息学和分子基因组学的重要分析工具,其数据来源为已知的基因表达分析数据。该网站是一个连接生物信息学和分子基因组生物学的工作站,可以根据基因编号查找通过计算方法统计出可视化数据,可以预测一个基因的时间性表达状况,自我剪接等等内容,现在已经收录了包括拟南芥,水稻,短穗二柄草,大豆,杨树,玉米等植物的相关生物学信息。

2.3 启动子功能分析网页

Plant CARE 网页是启动子分析服务网页,为比利时根特大学和VIB 研究所共同创建,该服务网页收录了已公开发表的拥有染色质免疫沉淀测序(ChIP-Seq)数据,并根据数据分析了各种转录因子结合在启动子上的结合片段(motif),而后根据已知的转录因子结合的motif 来预测一段启动子上可能结合的转录因子情况。

3 结果与讨论

3.1 AT1G16730 基因的结构以及基本信息

为了预测拟南芥未知基因AT1G16730 的表达节律性,我们先在TAIR 网站上查找关于该基因的生物信息学资料,根据网页显示得知:该基因位于拟南芥第一条染色体上,碱基位数为第5727406-5726358,反向表达。基因组全长1039bp,其中编码区全长609bp,编码区中间有一个内含子。编码区可以编码一段202 个氨基酸残基的蛋白,分子量为21685.9,蛋白质的等电点为4.79。该基因表达时期分析结果表明,基因表达的细胞内定位在细胞核内,以及过氧化物酶体上,在拟南芥生长史上与开花时期表达,表达部位为保卫细胞、雄蕊以及花茎。

图1 AT1G16730 的表达节律,在第20 到24 小时有很明显的表达高峰

图2 AT1G16730 基因的启动子分析

通过上述描述可以看出,这个基因的大小并不大,编码的蛋白是一个相对比较小的蛋白,只有20kd 左右。另外这个基因在拟南芥植株的生活史中,只在开花时期才表达,并且表达有组织特异性,只在雄蕊,保卫细胞,花茎中表达。根据拟南芥的生长规律,花茎只有拟南芥抽薹之后(进入花期)才会生长出来,而雄蕊更是只有花开始发育之后才会表达,证明该基因在拟南芥幼苗期,以及营养生长期的表达不会很高(只长莲座叶时期),而基于其细胞内定位在细胞核与过氧化酶酶体上这一点来看,该基因编码的很可能是一个转录因子,这预示着它和拟南芥开花以及花的生长发育有关,并且在这个过程中起重要的转录调控作用。

3.2 AT1G16730 基因的表达可能存在节律性

使用Diurnal 网页输入AT1G16730 基因的编号,可以对该基因的表达节律性可能性进行预测。前文已叙述过,Diurnal 网站通过收录的各种植物的转录情况数据可以对某个基因的2个昼夜的表达情况进行预测。在输入页面之上,在Genome 选项中选择物种Arabidopsis thliana(拟南芥),确定物种,而后选择LLHD 选项选择24 小时全光照的光照条件,最后在Cutoff 选项中选择默认的数值0.8,这个选项是将节律表现的不够强的基因表达曲线去除,最后电击Submit 提交条件。网页归化出的表达曲线表现出了很强的表达节律,在第0 小时和24 小时有明显的表达峰值,但是在其他时间点表达量都不高(图1)。

通过这个分析,我们得知该基因在全光照条件下在一天大部分时间表达量都不高,只有在临近一天结束时期才会有一个峰值,这说明只有在午夜附近时候该基因的功能才起到最重要的作用,这首先预示着该基因可能在黑暗环境下的作用会比在有光照时候的作用大,结合该基因在保卫细胞中表达这一点来看,有可能对气孔开闭控制有调控作用。

3.3 AT1G16730 基因的启动子可能被生物钟核心振荡器直接调控

一般情况某个基因的转录水平与该基因的启动子直接相关,现已知AT1G16730 基因的表达可能存在节律性,所以对该基因的启动子做生物信息学分析就显得尤为重要。利用Plant CARE 网页进行分析,在网页中点开Search of CARE 一项,将AT1G16730 基因起始密码子上游1666 个碱基作为该基因的启动子序列输入进输入框,点击Search 键开始进行分析。

从分析的结果中可以得知,该基因启动子中不但有拟南芥核心振荡器调控必备的G-Box 区域以及与能够被核心振荡器基因CCA1,LHY 调控的相似序列MYB-Binding 序列,这预示着该基因有被拟南芥核心振荡器调控的可能性(图2)。

综上所述,拟南芥AT1G16730 基因的各种分析表明,该基因表达可能有节律并且有可能是被生物钟核心振荡器直接调控的基因。因为生物钟的重要性但是因为该基因表达存在组织特异性(只在雄蕊,保卫细胞,花茎中表达)和生长阶段特异性(只在开花时期表达),这与已知的直接被生物钟核心振荡器直接调控的基因有一定的差异,因为一般被核心振荡器直接调控的基因在拟南芥幼苗阶段就可以表达。关于拟南芥生物钟的研究目前还比较多的集中于对拟南芥幼苗时期核心振荡器的转录,翻译,修饰以及它们构成的对其他基因的调控网络,但是对于拟南芥开花时期生物钟究竟是如何发挥作用的,除了影响开花时间之外其他方面研究还比较少。基于拟南芥的生活史,抽薹是拟南芥由营养性生长向生殖性生长的拐点,从此拟南芥进入花期,而植株整体的很多基因的表达,调控肯定会发生变化,是否会有很多类似AT1G16730 基因一样只有在开花时期才表达的基因参与了生物钟对植物各个方面的调控,从而参与到这个过程之中,这方面未来有待于相关研究人员做进一步的研究,而这些未知功能基因的生物信息学分析无疑是非常重要的一个步骤。

猜你喜欢

信息学节律生物钟
周末“补觉”是一个谎言
GmELF3s调控大豆开花时间和生物钟节律的功能分析
鸡NRF1基因启动子区生物信息学分析
空间里的时间:微重力等环境下的生物节律研究
生物信息学辅助研究乳腺癌转移相关lncRNA进展
PBL教学模式在结构生物信息学教学中的应用
打乱生物钟会让人变丑
智能生物钟
神通广大的生物钟
食管腺癌DNA拷贝变化相关基因的生物信息学分析