APP下载

mRNA 三级结构中局部碱基对参量与蛋白质折叠速率的相关性

2022-05-11赵瑞峰李瑞芳程永霞宋鑫伟

关键词:多态参量碱基

赵瑞峰,李瑞芳,程永霞,宋鑫伟

(内蒙古师范大学 物理与电子信息学院,内蒙古 呼和浩特 010022)

蛋白质在生命活动中起到不可或缺的作用。蛋白质只有折叠成特有的空间结构才具有生物活性、行使其特定的生物学功能,而蛋白质分子从非折叠态到折叠态是一个动力学和热力学过程,当折叠过程中出现错误折叠,就会导致生物体产生疾病[1-2],因此研究蛋白质的折叠过程十分必要。目前,对于蛋白质折叠速率的研究已经有了一些较成熟的理论方法,早期研究基于蛋白质的三级结构,紧接着提出了蛋白质二级结构对蛋白质折叠速率的影响因素,然后出现了许多基于氨基酸序列对蛋白质折叠速率影响的研究[3-6]。

目前关于RNA 一级结构和二级结构的研究相对成熟,而有关RNA 三级结构的研究相对较少。RNA在折叠过程中,通过双螺旋区的成核作用、二级结构单元间的“缩合”,最后形成具有生物学功能的三维构象。为方便探究RNA 的三级结构,研究者们设计出了3dRNA 和RNAcomposer 等RNA 三级结构的预测软件[7-11],并利用这些预测软件预测了RNA 的三级结构,通过3DNA、Curves+等对所预测的三级结构进行分析研究[12-13],例如对大沟和小沟、同轴堆叠等特征的研究[14-16]。考虑到蛋白质的共翻译折叠过程,李瑞芳等[17-18]从mRNA 的二级结构出发分析了mRNA 二级结构对蛋白质折叠速率的影响,发现mRNA 二级结构对蛋白质折叠速率有很重要的影响。而mRNA 的二级结构通过氢键及其他相互作用折叠成mRNA的三级结构,mRNA 三级结构会直接影响到蛋白质的各级结构,因此认为mRNA 三级结构对蛋白质折叠速率也会有更直接的影响。本文利用3dRNA 和3DNA 软件对mRNA 三级结构进行预测,提取其中的局部碱基对参量,研究其与蛋白质折叠速率的相关性,探究mRNA 三级结构中局部碱基对参量对蛋白质折叠速率的影响。

1 材料与方法

1.1 数据集

本文从整理得到的蛋白质折叠数据库中通过去除冗余选取出100 个蛋白质作为研究样本,蛋白质折叠速率的数据来源于蛋白质折叠速率的相关文献[4-6]。本文对选取的100 个蛋白质进行了不同类型的分类,按照蛋白质折叠类型,可分为56 个二态蛋白质和44 个多态蛋白质;按照蛋白质的二级结构,可分为22 个全α 类蛋白质,39 个全β 类蛋白质和39 个混合类(α/β)蛋白质。

1.2 RNA 三级结构的局部碱基对参量

选用3dRNA 软件对RNA 三级结构进行预测。3dRNA 是基于RNA 一级结构和二级结构并使用最小二级结构元素构建RNA 三级结构的一种自动化方法[7-9]。该软件有四种不同类型的任务,本文选用第三种类型的任务(带优化的3dRNA)去预测RNA 的三级结构,首先为每个最小二级结构元素找到三级结构的模板,将一组或多组模板组装在一起,再对每个组装的结构进行优化。此类型任务与其他类型任务相比,预测结果较为精确。随后将基于3dRNA 预测出的结果导入3DNA 中进行分析,从分析结果中提取出局部碱基对参量,并对局部碱基对参量进行研究。局部碱基对参量由六个量组成,即三个平移量:两碱基原点x轴相对位移(Shear)、两碱基原点y轴相对位移(Stretch)和两碱基原点z轴相对位移(Stagger)以及三个旋转量:两碱基平面绕x轴旋转夹角(Buckle)、两碱基平面绕y轴旋转夹角(Propeller)和两碱基平面绕z轴旋转夹角(Opening)。这六个参量定量的定义了一对碱基中一个碱基相对于另一个碱基的空间排列[19],其零值描述了规范的Watson-Crick 碱基对,非零值分别描述碱基对在x轴、y轴和z轴方向的变形。这些参量是通过将一个基准参考系映射到另一个基准参考系的刚体变化来计算的[13],其中参量Shear 和Stretch 定义了平均碱基对平面中两个碱基原点分别在x轴、y轴的相对偏移量[12];Stagger 定义了平均碱基对两个碱基原点在z轴的相对偏移量;Buckle 和Propeller 指碱基对内两个碱基平面之间绕x轴和y轴旋转的夹角[20-22];Opening 指两个x轴之间相对于碱基对平面的平均法线夹角[12]。局部碱基对参量Shear、Stretch 和Opening与氢键、接近度相关联[12]。以此为基础,本文首先对所选蛋白质相应mRNA 的局部碱基对参量进行统计计算,再根据碱基对的不同,对每个蛋白质相应mRNA 的各个局部碱基对参量求平均值;在此基础上,详细分析mRNA 三级结构中各个局部碱基对参量对蛋白质折叠速率的影响。

对于mRNA 中的每一类碱基对,计算了其中的上述6 个参量值,并计算出每个蛋白质相应的mRNA中每类碱基对所对应的每个参量的平均值,计算方法为

其中表示某个蛋白质第i个碱基对的第j个局部碱基对参量的平均值,i表示碱基对类型,它的取值范围为[1-32],具体取值定义见表1。j分别取1、2、3、4、5、6,且Shear=1、Stretch=2、Stagger=3、Buckle=4、Propeller=5、Opening=6,Nijk表示该蛋白质第i个碱基对的第j个局部碱基对参量的第k个值,n表示该蛋白质第i个碱基对的第j个局部碱基对参量值的个数。

表1 局部碱基对类型取值表Tab.1 Value of local base-pair

依据公式(1)计算了所选蛋白质相应mRNA 三级结构中各个参量的平均值后,考虑到二态蛋白质与多态蛋白质的折叠方式不同,二者相应mRNA 三级结构的局部碱基对参量对蛋白质折叠速率可能有不同的影响,因此将所选蛋白质按照蛋白质的不同折叠方式进行分类,并在两类蛋白质中分别计算出每个蛋白质在每一个碱基对类型下的各个参量的平均值。考虑到蛋白质二级结构的不同,又将所选蛋白质分为全α 类、全β 类和α/β 类蛋白质,并分别计算这三类中每个蛋白质相应mRNA 三级结构的各个参量的平均值。

1.3 回归分析

利用回归分析得出各局部碱基对参量的平均值与蛋白质折叠速率的关系,并记录回归结果中MultipleR和SignificanceF的值。MultipleR是复相关系数,又称相关系数,用R表示,反映了各参量的平均值与蛋白质折叠速率之间相关性的强弱;SignificanceF对应的是显著性统计量,一般情况下等于弃真概率P值,即样本为假的概率,本文用P值来检验计算结果的置信度。

2 计算结果分析

2.1 mRNA 三级结构中局部碱基对参量对蛋白质折叠速率的影响

RNA 的三级结构是由RNA 一级结构通过碱基配对将核苷酸链折叠成RNA 二级结构,再通过氢键和其他三级相互作用再折叠形成的。RNA 三级结构的一些重要参量如局部碱基对参量是否会对蛋白质折叠速率产生影响?为了探究这个问题做了如下分析:当100 个蛋白质相应mRNA 三级结构的局部碱基对参量数据按照不同碱基配对方式分类后,分析得到每种碱基对的各种参量与蛋白质折叠速率的相关性结果如表2 所示。由于计算结果较多,为了更好地体现结果的生物学意义,表2中只呈现具有相关性的结果。

表2 整体蛋白质折叠速率与各个碱基对中各参量的关系Tab.2 Relationship between the folding rates and parameters in each base-pair for overall proteins

表2 结果显示,碱基对A-A 的Shear 参量、碱基对A+G、A-G 的Propeller 参量以及碱基对A+U 的Stretch、Opening 参量均与蛋白质折叠速率呈正相关,而碱基对A+C 的Shear 参量、碱基对A-C、C-A 的Stretch 参量均与蛋白质折叠速率呈负相关。

2.2 局部碱基对参量对不同折叠类蛋白质折叠速率的影响

前面基于所有蛋白质研究了mRNA 三级结构的局部碱基对参量对蛋白质折叠速率的影响。为了研究局部碱基对参量对不同折叠类蛋白质折叠速率的影响差异,本节将蛋白质分为二态蛋白质和多态蛋白质,分析了每类蛋白质相应mRNA 三级结构中局部碱基对参量与蛋白质折叠速率的相关性,结果见表3 和表4。

表3 数据显示,在二态蛋白质中,蛋白质折叠速率与碱基对A-G 的Shear 参量、碱基对A+G的Stagger 参量、碱基对C-C 的Buckle 参量和碱基对A+G、A-G 的Propeller 参量均呈正相关,与碱基对G-A 的Shear 参量、碱基对C-A、A-C 的Stretch 参量和碱基对U+G 的Buckle参量均呈负相关。分析表4 数据发现,在多态蛋白质中,碱基对A+U、G+U 的Stretch 参量、碱基对U+C 的Propeller 参量和碱基对U+G 的Stagger 参量均与蛋白质折叠速率呈正相关。

表3 二态蛋白质折叠速率与各个碱基对中各参量的关系Tab.3 Relationship between the folding rates and parameters in each base-pair for two-state proteins

表4 多态蛋白质折叠速率与各个碱基对中各参量的关系Tab.4 Relationship between the folding rates and parameters in each base-pair for multistate proteins

2.3 局部碱基对参量对不同二级结构类蛋白质折叠速率的影响

前期研究结果表明,同一个参量对不同二级结构类蛋白质的折叠速率有不同的影响。将所选蛋白质分为全α 类蛋白质,全β 类蛋白质和α/β 类蛋白质,在每一类蛋白质中分析了mRNA 三级结构的局部碱基对参量与蛋白质折叠速率的相关性,结果见表5—7。

表5 数据显示,蛋白质折叠速率与碱基对C-U 的Shear 参量、碱基对G+A 的Opening参量以及碱基对C+A、U-A 的Buckle 参量均呈正相关,与碱基对A+A 的Opening 参量以及碱基对A-C、C+G 的Stretch 参量均呈负相关,其中碱基对C+A 的Buckle 参量和碱基对A-C 的Stretch 参量与蛋白质折叠速率均呈显著相关性。从表6 的数据中可以看出,蛋白质折叠速率与碱基对A+U 的Stretch 参量以及碱基对U+C、U+U 的Buckle 参量均呈正相关。表7 数据显示,蛋白质折叠速率与碱基对A+U、C-U 的Stretch 参量、碱基对C+G、G+G 的Propeller 参量以及碱基对A+U、C+G 的Opening 参量均呈正相关。

表5 全α 类蛋白质折叠速率与各个碱基对中各参量的关系Tab.5 Relationship between the folding rates and parameters in each base-pair for all-α proteins

表6 全β 类蛋白质折叠速率与各个碱基对中各参量的关系Tab.6 Relationship between the folding rates and parameters in each base-pair for all-β proteins

表7 混合类蛋白质折叠速率与各个碱基对中各参量的关系Tab.7 Relationship between the folding rates and parameters in each base-pair for α/β proteins

2.4 局部碱基对参量对蛋白质折叠速率影响的变化关系图

为了更直观地描述mRNA 三级结构中局部碱基对参量对蛋白质折叠速率的影响趋势,作出了蛋白质折叠速率随局部碱基对参量的变化关系图(图1)。

通过图1(a)可以看出,在二态蛋白质中蛋白质折叠速率随碱基对U-G 的Stretch 参量的增大而减小,但在多态蛋白质中其变化趋势正好相反。在二态蛋白质中,对比图1(b)和图1(c)发现蛋白质折叠速率随碱基对U-G、U-A 的Stretch 参量的增大而减小,即Stretch 参量抑制蛋白质的折叠;蛋白质折叠速率随碱基对U-G 的Stagger 参量、碱基对U-A 的Propeller 参量的增大而增大,即Stagger、Propeller 参量均对蛋白质的折叠起促进作用。通过图1(d)、图1(e)、图1(f)对比多态蛋白质中蛋白质折叠速率随参量的变化关系,发现蛋白质折叠速率随碱基对C-C、G-U 的Propeller 参量、碱基对U-A 的Stretch 参量以及碱基对G-U 的Buckle 参量的增大而增大,而随碱基对C-C、U-A的Buckle 参量的增大而减小。

图1 各参量对蛋白质折叠速率的影响趋势图Fig.1 Change of the protein folding rates with parameters

3 讨论

本文选取了mRNA 三级结构的局部碱基对参量来研究其对蛋白质折叠速率的影响,利用3dRNA 和3DNA 得到了不同蛋白质相应mRNA 三级结构中各个参量的具体数据。再根据碱基配对方式的不同进行分类,并利用回归分析了每类碱基对中各种参量与蛋白质折叠速率的相关性。

在表2 数据中发现碱基对A+U 的Stretch 参量与蛋白质折叠速率具有极显著相关性,意味着碱基对A+U 的Stretch 参量会更大程度地促进蛋白质的折叠。对比表3 和表4 数据可知,在二态蛋白质中,一些碱基对的Shear 参量对蛋白质折叠速率有影响,Opening 参量对蛋白质折叠速率没有明显影响;但与二态蛋白质相比,多态蛋白质中一些碱基对的Shear 参量对蛋白质折叠速率没有明显影响,Opening 参量对蛋白质折叠速率有影响;在两种不同折叠类蛋白质中,蛋白质折叠速率均受到其他四个参量(Stretch、Stagger、Buckle 和Propeller)的影响,其中相应碱基对的Stagger 参量与Propeller 参量均促进蛋白质的折叠,且蛋白质折叠速率与相应碱基对的Stagger 参量具有显著相关性,表明在二态蛋白质和多态蛋白质中局部碱基对参量Stagger 对蛋白质的折叠速率有重要影响。对比表5—7 的数据发现,在不同二级结构类蛋白质中,局部碱基对参量Stretch 对蛋白质折叠速率均有影响,其中相应碱基对的Stretch 参量在全α 类蛋白质中抑制蛋白质的折叠,在混合类蛋白质中对蛋白质的折叠起促进作用,对于全β 类蛋白质来说,局部碱基对参量Stretch 在碱基对A+U 中促进蛋白质的折叠,在碱基对U+C 中抑制蛋白质的折叠,说明局部碱基对参量Stretch 也是影响蛋白质折叠速率快慢的一个重要因素;在全α 类蛋白质中碱基对C+A 的Buckle 参量和全β 类蛋白质中碱基对U+U 的Buckle 参量均与蛋白质折叠速率具有显著相关性,但在混合类蛋白质中对蛋白质折叠速率无明显影响,说明在不同二级结构类中局部碱基对参量Buckle 对蛋白质折叠速率会产生不一样的影响。对比图1(d)和图1(f)发现,在多态蛋白质中,局部碱基对参量Buckle 在碱基对C-C 中抑制蛋白质的折叠,而在碱基对G-U 中促进蛋白质的折叠,表明不同碱基对的同一参量对蛋白质折叠速率有不同的影响。另外,相关研究表明Buckle、Propeller 和Opening 的平均值越高,碱基对偏离理想平面几何构型的程度越大,表现出的构象柔性越大[23],而大的构象柔性有利于蛋白质的折叠,这个结论很好地支撑了本文中旋转参量对蛋白质折叠速率影响的研究结论,但在个别碱基对中上述三个参量与蛋白质折叠速率呈负相关,这是由于碱基对的不同影响了二者的相关性。

猜你喜欢

多态参量碱基
应用思维进阶构建模型 例谈培养学生创造性思维
太阳黑子自动识别与特征参量自动提取
参差多态而功不唐捐
中国科学家创建出新型糖基化酶碱基编辑器
基于含时分步积分算法反演单体MgO:APLN多光参量振荡能量场*
基于双偏振雷达参量的层状云零度层亮带识别研究
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
《C++面向对象程序设计》中引用类型的教学实践
基于STM32的智能发电机电参量测量装置的设计