APP下载

毛竹基因组中热激蛋白HSP90基因家族的鉴定与分析

2022-04-28AndreaChen陈思睿

福建林业科技 2022年1期
关键词:毛竹元件基因组

Andrea Chen(陈思睿)

(St.Aidan′s Anglican Girls′ School,Brisbane,Queensland 4075)

毛竹(Phyllostachysedulis)属禾本科(Gramineae)竹亚科(Bambusoideae)多年生常绿单子叶植物,广泛分布于北纬25°—30°之间400~800 m的丘陵、低山山麓地带,耐贫瘠、高温干旱,但不耐寒。与同科农作物相比,毛竹具有比较强的抗非生物胁迫能力。一般来讲,植物抗逆强弱由自身携带的基因来决定。

植物热激蛋白(heat shock protein,HSP)是在植物遭遇非生物胁迫时,激活并能大量产生的一类蛋白质;是广泛存在于各种生物体内、进化上高度保守的蛋白质[1]。根据分子量大小,热激蛋白可分为 5 个家族:即sHSP(小分子热激蛋白)、HSP60、HSP70、HSP90、HSP100[2-4]。HSP90蛋白是一类正常细胞中不可缺少的蛋白质,包含3个区域:含有ATP结合和水解位点的N末端,中部区域和包含二聚化作用区域的C末端结构域,其中ATP酶活性是HSP90蛋白发挥生物功能所必需的[5]。HSP90蛋白参与调控多种蛋白的调控和维持蛋白正常构型,并参与细胞的抗逆活动[6-7]。真核生物中的HSP90s属于持家蛋白,含量较高,约占总蛋白的1%~2%[8],在高温胁迫时,比例迅速升至4%~6%[9]。

本研究利用多种生物信息学工具鉴定毛竹HSP90基因家族成员,分析家族各成员的特征、进化关系及表达特征,以期为更深入研究HSP90基因的生物学功能及挖掘毛竹的优良基因资源提供参考。

1 材料与方法

1.1 材料

从毛竹基因组、蛋白数据库(http://202.127.18.221/bamboo/down.php)中下载毛竹全基因组序列、cDNA序列及氨基酸序列,构建本地blast数据库。

1.2 方法

1.2.1 毛竹HSP90基因家族序列的获得 从Pfam蛋白家族数据库中(http://pfam.xfam.org/)下载与PF00183.18和PF02518.26 结构域相对应的HMM图谱,e-value≤1e-10。以单子叶植物水稻(Oryzasativa)的所有HSP90基因家族氨基酸序列为诱饵,通过blastp和隐藏马尔科夫模型(HMM)方法对毛竹基因组中的HSP90基因进行筛选。

1.2.2 毛竹HSP90基因家族理化性质分析 通过在线网站Expasy的ProtParam(https://web.expasy.org/protparam/)分析毛竹HSP90基因家族成员分子量,理论等电点、亲疏水性等理化性质,通过ProtComp 9.0在线分析工具(http://linux1.softberry.com/berry.phtml?topic=protcomppl&group= programs&subgroup=proloc)对HSP90蛋白进行亚细胞定位预测,通过SignalP-5.0(http://www.cbs.dtu.dk/cgi-bin)预测蛋白是否具有信号肽。

1.2.3 毛竹HSP90基因家族系统发生树的构建及基因结构分析 从水稻和拟南芥(Arabidopsis)数据库中筛选具有PF00183.18和PF02518.26结构域的蛋白序列,分别通过ClustalW多重比对,用MEGA 7.0(http://www.megasoftware.net)软件邻位连接(Neighbor-Joining,NJ)法构建毛竹和其它物种中HSP90基因家族系统进化树,自检值取1000次抽样。利用毛竹基因组位置注释文件,使用TBtools绘制毛竹HSP90家族基因结构图及scaffold定位图。利用在线网站NCBI Conserved Domain(https://www.ncbi.nlm.nih.gov/cdd/)和MEME(http://meme.sdsc.edu/meme/meme-intro.html)预测HSP90家族基因保守域和基序,并提交到TBtools绘制。

1.2.4 共线性分析 利用TBtools软件对毛竹基因组所有氨基酸进行序列比对,并将毛竹基因组蛋白序列与水稻基因组氨基酸序列成对比对,利用MCScanX获得毛竹基因家族共线性关系,并用Circos对结果进行可视化。

1.2.5 毛竹HSP90基因家族顺式响应元件分析 从毛竹数据库中下载全基因组序列,构建本地Blast 数据库,以已获得的完整的毛竹HSP90基因家族cDNA序列进行本地Blast搜索,分析毛竹11个HSP90基因与上游基因之间的间距,对于间距大于2000 bp的HSP90基因,获取翻译起始密码子上游2000 bp序列,剔除长度小于2000 bp的序列,所获序列用于顺式作用元件预测。利用Plant CARE database(plant cis-acting regulatory element database,http://bioinformatics.psb.ugent.be/webtools /plantcare/ html/)对所获启动子序列上的顺式调控元件进行分析。预测所得的顺式作用元件按功能进行分类。

1.2.6 组织特异性表达 从毛竹数据库[10]中下载毛竹不同组织,包括根、叶、鞭、花序1(早期花序)、花序2(花期花序)、茎20(20 cm长的笋芽顶部)、茎50(50 cm长的笋芽顶部)的7个转录组数据,绘制各组织中HSP90家族成员的表达热图。

同时,采集30 d的毛竹幼苗的根、茎、叶,液氮速冻,5株为1次重复,共3次重复。使用天根公司RNAprep Pure 植物总 RNA提取试剂盒提取RNA,用Takara公司的反转录试剂盒合成cDNA第1链,用在线工具Primer 3.0(http://primer3.ut.ee/)设计特异性引物(表1)。

表1 特异性引物

荧光定量PCR扩增体系为10 μL,包括2×SYBR Premix ExTaqTMII 5μL,正反向引物(10 μM)各0.4 μL,cDNA 1 μL,ddH2O 3.2 μL。荧光定量PCR扩增条件:95 ℃ 3 min;95 ℃ 10 s,60 ℃ 20 s,72 ℃ 20 s,40个循环。数据分析采用2-ΔΔCt方法[11]。

2 结果与分析

2.1 毛竹HSP90基因家族成员序列分析

以水稻8条完整的HSP90基因序列为种子序列,通过本地Blastp和hmmsearch搜索,共获得16条毛竹HSP90基因的氨基酸序列,通过在线pfam搜索软件,确认11个成员序列既含有N端的ATP酶结构域,又含有HSP90结构域。需要说明的是:虽然4个成员(PH02Gene07542、PH02Gene09089、PH02Gene17689、PH02Gene45866)的分子量均小于50 kD,但由于均含有ATP酶结构域和HSP90结构域,后续一并进行分析。11个成员的基本信息见表2,11个成员的多肽链长度从356(PH02Gene17689)~806 aa(PH02Gene31917)不等;分子量介于39.63~92.42 kD;脂肪指数介于78.86(PH02Gene48597)~85.48(PH02Gene17689)之间;等电点范围为4.56(PH02Gene17689)~5.31(PH02Gene39947),11个毛竹HSP90蛋白均为酸性蛋白(pI<7.0)。4个HSP90的不稳定指数大于40,表明毛竹中这4个HSP90属于稳定蛋白,而另外7个属于不稳定蛋白。亲水性总平均值均为负值,表明11个HSP90蛋白均为亲水性蛋白。亚细胞定位显示,分子量小于50 kD的4个成员定位在细胞质,而其它7个成员定位在内质网。另外,11个HSP90蛋白均不含跨膜结构,只有PH02Gene31917包含有典型的信号肽序列。PH02Gene37282和PH02Gene31917包含有驻留内质网的KDEL短肽。

表2 11个毛竹HSP90成员信息

2.2 毛竹HSP90家族基因的结构

毛竹家族成员的基因结构存在明显差异,所含外显子数5~20个,其中分子量低于50 kD的4个基因含有5个外显子,结构相对简单;其它7个大分子量的基因含有15~20个外显子,结构较为复杂(图1)。

图1 毛竹HSP90基因家族成员系统发育关系及结构

2.3 毛竹HSP90基因家族的scaffold定位

从毛竹基因组数据库获得HSP90家族成员的位置以及在scaffold上的信息。从图2可知,11个毛竹HSP90基因分布在9条scaffold上,较为分散。其中scaffold 3和scaffold 22上各分布有2条,且每2条之间的距离非常接近,不过分布在同一scaffold上的2个基因结构不一致,进化上也分属于不同的group组,表明同一scaffold上的2个HSP90基因不是基因复制而来的。

图2 毛竹HSP90基因家族成员在scaffold上的分布

2.4 毛竹HSP90家族成员蛋白保守基序的预测

毛竹HSP90家族成员中,6个成员的蛋白序列共含5个保守基序(图3),每个基序含40~50个氨基酸(表3)。4个成员的蛋白序列含4个保守基序,缺乏Motif 5。另外1个成员也含4个保守基序,但缺乏Motif 2。11个成员均含有Motif 1、Motif 3、Motif 4 3个保守基序,从pfam注释来看,motif 3、motif 4被注释为HATPase_c,而motif 1被注释为HSP90。以上结果表明毛竹HSP90家族成员的功能可能发生了分化。

表3 毛竹HSP90家族蛋白的基序组成

图3 毛竹HSP90家族成员蛋白保守基序的预测

2.5 毛竹HSP90家族成员及其它植物中该家族成员的聚类分析

以拟南芥、水稻、毛竹的26个HSP90家族成员的氨基酸序列构建了无根系统进化树(图4)。结果显示:26个成员被分为3组:Group A中包含5个毛竹HSP90家族成员,Group B中包含2个含15个外显子的HSP90家族成员,而4个结构简单、分子量小的HSP90家族成员均聚在Group C组,表明结构类似的毛竹HSP90基因在进化上更接近,推测功能也更相近。另外,Group A和B组的毛竹HSP90基因具有倍增的现象。从进化树来看,毛竹HSP90与水稻HSP90更为接近。

图4 拟南芥、水稻、毛竹中HSP90蛋白的系统进化树

2.6 毛竹HSP90家族成员的共线性分析

直系同源基因对可以提供有关物种之间进化关系的有效信息。水稻与毛竹HSP90家族成员间的共线性分析表明:7个水稻HSP90基因与10个毛竹HSP90基因有共线性关系(图5)。仅1个毛竹的HSP90基因PH02Gene09089与水稻HSP90基因间无直系同源关系,表明该基因是毛竹中特有的。

图5 毛竹与水稻HSP90家族的共线性分析

2.7 毛竹HSP90家族基因的启动子分析

截取ATG上游2 kb的序列用于分析启动子中的顺式作用元件,结果显示,除了基本的启动子结构元件,如TATA box和CAAT box外,HSP90家族成员的启动子序列上还存在13个与逆境胁迫相关的顺式元件及其它顺式作用元件。每个成员启动子上的顺式作用元件见图6。每个启动子上都含有光相关的顺式作用元件,如G-box和MRE等。在所有11个成员的顺式作用元件中,与激素(如茉莉酸甲酯、脱落酸、赤霉素、生长素和水杨酸)相关的顺式作用元件约占一半(46.1%);其次是与光相关的顺式作用元件,占到五分之二;与各种逆境胁迫(如无氧胁迫、干旱胁迫及其他防御胁迫)相关的顺式作用元件占8.1%。另外,与各组织(如分生组织及胚乳)相关的顺式作用元件也有被鉴定到。虽然各成员中都包含光相关及激素相关的元件,但每个成员的顺式作用元件仍存在差别,如昼夜节律相关的元件仅存在于2个成员的启动子中,也说明了毛竹11个HSP90成员的功能发生了变化。

图6 毛竹HSP90基因家族成员启动子上顺式作用元件的分布

2.8 毛竹HSP90家族成员的组织特异性表达分析

基于已发表的毛竹不同组织的转录组测序数据[10],绘制了毛竹HSP90基因家族各成员的组织特异性表达图谱热图(图7A)。结果表明,在自然条件下,6个结构复杂的基因,包括PH02Gene05953、PH02Gene48597、PH02Gene39947、PH02Gene37282、PH02Gene21535、PH02Gene01254,在各组织中的表达量非常微弱,而4个结构相对简单的基因在花序中表达强烈,在其它组织中表达较弱,表现出强烈的组织特异性表达模式。RT-PCR的检测结果(图7B)也证实:6个结构复杂的基因在幼苗期的组织中几乎检测不到表达(数据未呈现),而4个结构相对简单的基因表现出明显的组织特异性表达模式。值得关注的是,组织特异性表达模式与聚类分析及基因结构表现出很强的关联性。

图7 毛竹HSP90基因家族成员在不同组织中的表达量

3 讨论

在原核与真核生物中,HSP90是一类高度保守的分子伴侣蛋白,广泛参与信号转导,细胞周期及其它重要的生物学过程[12]。目前,在动物和真菌中,HSP90的功能已被广泛报道,而植物中的报道相对落后。随着多种植物基因组序列的公布,一些模式植物,如拟南芥[13]、水稻[14],一些重要的蔬菜作物,如番茄(Solanumlycopersicum)[15]、辣椒[16](Capsicumannuum)、黄瓜[17](Cucumissativus)中的HSP90基因家族相继被报道。

毛竹是一种广泛分布在南方的亚热带经济树种,其基因组已被测序2次,该数据的释放有利于深入分析在逆境中起重要作用的HSP90基因家族,为进一步深入探索毛竹抗逆特性提供理论依据。本文从毛竹基因组中共鉴定出11个HSP90家族基因,比模式植物拟南芥[13](7个)、水稻[14](9个)、杨树(Populus)[18](10个)多,比地中海橄榄树[19](Oleaeuropaeasubsp.Europaea,12个)少,HSP90成员个数可能与物种的抗逆性有一定相关性。多数二倍体的葫芦科作物含5~7个HSP90成员,而四倍体的笋瓜(Cucurbitamaxima)含10个HSP90成员[17],毛竹中HSP90成员的个数与四倍体笋瓜的个数最接近。理化特性分析显示毛竹中HSP90成员均为酸性蛋白,这与拟南芥、水稻、杨树和番茄中的研究结果相吻合,表明植物中HSP90的理化特性非常保守。同时,本文中鉴定到的3对HSP90旁系同源基因分别位于不同的scaffold上,表明毛竹中HSP90基因的扩张主要是由于区域重复导致的。进化树和表达量的结果显示,毛竹中结构相似的HSP90成员聚在一组,且结构相似的基因表达特性非常相似,表明进化不仅影响了毛竹HSP90成员的功能,也影响了其结构[20-21]。阐明毛竹HSP90家族成员在各种逆境胁迫以及生长发育过程中的生物学功能还需要大量的直接证据佐证。

猜你喜欢

毛竹元件基因组
“植物界大熊猫”完整基因组图谱首次发布
我国小麦基因组编辑抗病育种取得突破
宏基因组测序辅助诊断原发性肺隐球菌
节骨草和毛竹苗
寒 秋
敲竹杠
如何读懂色环电阻
非线性元件的处理
上海风云“东邪”谁属
Protel 99se网络表装载中纠错探索