APP下载

新冠病毒相关蛋白TMPRSS2结构与功能的生信分析及表达载体构建

2022-08-08徐本锦李卓禧严荣荣陈晓聪汤文婷侯艳香宋彬妤杨娅男刘晓梁余骏骁

中国药理学通报 2022年8期
关键词:表位残基糖基化

徐本锦,李卓禧,范 蕾,李 璟,严荣荣,杜 淼,宣 焱,门 杰,陈晓聪,汤文婷,侯艳香,宋彬妤,杨娅男,刘晓梁,余骏骁,刘 玲

(山西医科大学汾阳学院 1.医学检验系、2.基础医学部、3.山西省汾阳医院检验科、4.科技中心,山西 汾阳 032200)

2019年,新冠病毒(SARS-CoV-2)的出现及其在世界范围内的迅速传播造成了严重的全球公共卫生安全事件[1]。截至2021年6月17日7时01分,全球累计确诊病例超过17 778万例,累计死亡病例384.8万例。SARS-CoV-2是单股正链RNA病毒,颗粒呈球形或多形性,直径80~120 nm,其核酸与核衣壳蛋白紧密包装在病毒颗粒中,病毒膜表面有刺突[2]。人类感染该病毒后常表现为上呼吸道感染、干咳、中低度发热、呼吸困难、肺炎、多脏器衰竭,严重者可致死。新冠肺炎疫情(COVID-19)在全球范围的大肆传播,迫切需要深入研究病毒传播和感染的分子机制。

跨膜丝氨酸蛋白酶2(transmembrane serine proteinase 2,TMPRSS2)属于II型丝氨酸蛋白酶(type II transmembrane serine protease,TTSPs)家族成员[3]。人类TMPRSS2基因定位于染色体21q22.3,N端有跨膜区,C端有“催化三联体”(丝氨酸-组氨酸-天冬氨酸)结构域,此外,还包括低密度脂蛋白受体结构域 (low-density lipoprotein receptor domain,LDLR)和清道夫受体结构域(scavenger receptor domain,SR)[4]。人类TMPRSS2蛋白在呼吸道细胞表面大量表达,可切割ACE2蛋白(angiotensin-converting enzyme 2)和刺突蛋白(spike glycoprotein),对于冠状病毒侵染宿主细胞起着至关重要的作用[5],是开发新冠病毒抑制剂和治疗药物的关键靶点。SARS-CoV-2的感染依赖于TMPRSS2的活性,高表达TMPRSS2的细胞在病毒侵染时会产生更高的病毒损伤[6]。TMPRSS2通过切割ACE2和S蛋白,激活了S蛋白,使SASR-CoV-2更容易进入细胞。研究发现,TMPRSS2的关键残基(H296、S441和S460)与SARS-CoV-2 S蛋白裂解位点的侧翼残基相互作用[1, 7],因此,TMPRSS2在SARA-CoV-2进入宿主细胞过程中发挥重要作用。TMPRSS2在肺和肠道中的高表达使得这两个器官更容易受到SARS-CoV-2的侵袭[8]。

为进一步揭示TMPRSS2在病毒入侵过程中的作用机制及其结构与功能特性,本文利用生物信息分析手段对TMPRSS2蛋白的生物学特性进行了系统分析,同时对该蛋白进行了同源性分析和进化分析,此外,还构建了TMPRSS2蛋白的原核表达载体。本研究有助于阐明TMPRSS2在SARS-CoV-2侵染人体细胞中的作用机制,对于研发靶向该蛋白的抑制剂和抗病毒药物具有重要意义。

1 材料与方法

1.1 材料质粒pET-22b为本室保存,DNA分子量标准、感受态细胞及质粒DNA提取试剂购自全式金;限制性内切酶购自NEB;氨苄西林和IPTG等常规生化试剂购自国药。

1.2 运用相关网站分析TMPRSS2蛋白的理化性质、翻译后修饰位点、信号序列、分子构型及B/T细胞表位等功能特点。

1.3 多序列比对与进化分析从UniProt网站下载12条TMPRSS2蛋白序列,用Clustal×2及MEGA7.0进行序列比对及系统进化树分析。

1.4 载体构建及蛋白表达对质粒pET-22b和TMPRSS2基因用XhoI与NdeI同步双酶切,回收酶切产物,将目的基因与载体进行连接,将连接产物转化Top10和BL21感受态细胞后进行PCR验证。

2 结果

2.1TMPRSS2蛋白的理化性质TMPRSS2由492个氨基酸组成,其中酸性氨基酸(Asp+Glu)有35个,碱性的氨基酸(Arg+Lys)有39个,Ser含量最高(0.089),其次是Gly(0.087)(Tab 1),分子量53.86 ku,理论等电点8.12,是一个碱性蛋白。该蛋白分子式为 C2387H3654N650O709S33,原子总数为7 433,分子消光系数为118 145 L·mol-1·cm-1,不稳定系数为41.94;在哺乳动物网织红细胞中的半衰期约为30 h,在酵母中>20 h,在大肠杆菌内>10 h,脂肪族氨基酸指数72.70,总平均亲水系数-0.248。

Tab 1 Amino acid composition of TMPRSS2 protein

2.2TMPRSS2蛋白跨膜结构预测结果显示,该蛋白第M1-K83肽段位于细胞膜内,A84-W106肽段处于跨膜区,K107-G492肽段位于细胞膜外。跨膜螺旋残基数的期望值约21.818,N-term位于膜细胞质侧的总概率为0.948。因此TMPRSS2蛋白存在1个跨膜螺旋区,属于跨膜蛋白(Fig 1)。

2.3TMPRSS2蛋白卷曲螺旋预测结果显示,基于3种不同的窗口宽度(14、21、28)没有检测到卷曲螺旋结构(Fig 2)。

2.4TMPRSS2蛋白亲/疏水性分析预测结果显示,TMPRSS2蛋白的平均亲水系数为-0.248,残基E178,K340和T341的亲水性最强,Score值为-2.733;残基A98的疏水性最强,Score值为2.378,且亲水远多于疏水氨基酸。因此可以推测其蛋白为亲水性蛋白(Fig 3)。

2.5TMPRSS2蛋白磷酸化位点预测预测显示,TMPRSS2含有49个可能的磷酸化位点,其中Ser、Thr及Tyr磷酸化位点分别有25个、14个和10个(Fig 4),这些位点及其相应激酶如Tab 2。

Tab 2 Phosphorylation sites of TMPRSS2 protein and corresponding kinases

Fig 1 Transmembrane structure prediction of TMPRSS2 protein

Fig 2 Coiled coil analysis of TMPRSS2 protein

Fig 3 Hydrophilic/hydrophobic analysis of TMPRSS2 protein

Fig 4 Phosphorylation site of TMPRSS2 protein

2.6TMPRSS2蛋白糖基化位点预测结果显示,TMPRSS2蛋白存在3个的N-糖基化,分别是N128,N213和N249(Fig 5A);有12个O-糖基化,分别是S5、S61、S71、S79、S163、S204、S232、S233、S250、T31、T67和T447(Fig 5B)。

Fig 5 Glycosylation sites prediction of TMPRSS2 protein

unsp indicates an undetermined kinase

2.7TMPRSS2蛋白的功能位点分析TMPRSS2蛋白有3个活性位点,分别是H296、D345和S441,它们构成了一个电荷中继系统。通过查阅文献发现,目前已报道多个人源TMPRSS2蛋白的突变位点(Tab 3)。

Tab 3 Mutation sites of TMPRSS2 protein

2.8TMPRSS2蛋白的亚细胞定位和信号序列预测亚细胞定位分析显示,人源TMPRSS2蛋白主要表达在细胞的内质网膜(0.444)、线粒体(0.333)、细胞质(0.111)和细胞核(0.111)。信号序列预测显示,该蛋白不含信号序列,说明它不属于分泌蛋白。

2.9TMPRSS2蛋白多序列对比在线检索与人源TMPRSS2蛋白序列同源性较高的其它11种动物:大猩猩,黑猩猩,南方豚尾猕猴,东非狒狒,家猫,山羊,鸭嘴兽,袋熊,树鼩,西班牙猞猁以及中华鳖。结果显示,TMPRSS2蛋白在哺乳动物间的保守性很高,12条序列中完全相同的残基(*标示)占0.329,性质相似的(:标示)占0.128,性质微弱相近的(.标示)占0.073。与人源TMPRSS2序列一致性最高的是黑猩猩,高达0.980,其次是大猩猩,为0.974;人与东非狒狒和南方豚尾猕猴的序列一致性分别为0.886和0.878,与中华鳖的序列一致性最低,为0.616(Fig 6)。

2.10 系统进化分析对上述“2.9”构建进化树,结果显示,黑猩猩和大猩猩与人三者聚为一支,置信度为100;东非狒狒与南方豚尾猕猴聚为一支,置信度为100;家猫与西班牙猞猁聚为一支,置信度为100。山羊单独聚为一支,与人的亲缘关系最远(Fig 7)。

2.11TMPRSS2蛋白的二级结构预测TMPRSS2蛋白含有α-螺旋(Hh)80个,占0.162 6;延长链(Ee)124个,占0.252 0;β-转角(Tt)65个,占0.132 1;无规卷曲(Cc)223个,占0.453 3(Fig 8)。

2.12TMPRSS2蛋白三级结构建模利用相关构建TMPRSS2蛋白的三级结构模型,结果只显示D144-D491位、G103-A490位,以及S167-R489位的三级结构(Fig 9)。

2.13 B/T细胞抗原表位预测

2.13.1B细胞表位分析 B细胞表位分析有助于减少和合成多肽片段的范围与数量,提高试验效率。利用IEDB对该蛋白进行B细胞抗原表位预测,筛选阈值设定为0.50。结果显示,可能含有13个B细胞抗原表位,分别为S5-K80、L105-S122、T125-P154、Y161-I256、A262-L263、E299-P305、Q317-A324、H334-N343、M372-L373、E388-S394,T407-L419,Q431-S441,G462-Y469(Fig 10)。

2.13.2T细胞表位分析 本文运用以下两种方法对TMPRSS2蛋白的T细胞表位进行分析:其中HLA-A*02:01限制性CTL表位,阈值为25,检测出1个限制性CTL表位;HLA-DRB1*0401辅助性T细胞表位,阈值设为26,检测出6个HLA-DRB1*0401辅助性T细胞表位。

2.14TMPRSS2的蛋白-蛋白互体分析TMPRSS2与其他10个蛋白存在互作,分别是跨膜丝氨酸蛋白酶4(TMPRSS4)、血管紧张素转化酶2(ACE2)、转录调节因子ERG(ERG)、ETS易位变异体4(ETV4)、ETS易位变异体1(ETV1)、雄激素受体(AR)、溶质载体家族45成员3(SLC45A3)、同源框蛋白Nkx-3.1(NKX3-1)、DNA依赖性蛋白激酶催化亚基(PRKDC)和多聚腺苷二磷酸核糖聚合酶-1(PARP1)(Fig 11)。

Fig 6 Multi sequence comparison of TMPRSS2 protein

Fig 7 Phylogenetic tree based on TMPRSS2 protein sequence

Fig 8 Prediction of secondary structure of TMPRSS2 protein

Fig 9 Schematic diagram of tertiary structure and similarity waveform of homologous proteins

Fig 10 Prediction of B cell antigen epitopes of TMPRSS2 protein

Fig 11 Analysis of interaction network of TMPRSS2 protein

2.15 pET-22b-TMPRSS2原核表达载体的构建

2.15.1质粒pET-22b与TMPRSS2基因片段的酶切及菌落PCR验证 对质粒pET-22b单酶切(NddeⅠ)及同步双酶切,反应体系为100 μL,电泳结果与预期相符(Fig 12A)。双切酶TMPRSS2基因片段进行NdeⅠ和XhoⅠ双酶切(Fig 12B),通过菌落PCR鉴定阳性克隆(Fig 12C)。

2.15.2pET-22b-TMPRSS2质粒的验证及转化 用NdeI和XhoI对重组质粒进行双酶切,电泳检测后结果符合预期(Fig 13A)。将重组质粒转化感受态细胞Top10,涂布LB平板(Amp+)后37 ℃培养12 h(Fig 13B左)。将验证后的重组质粒转化感受态细胞BL21(Fig 13B右),用于表达目标蛋白。

Fig 12 Double enzyme digestion of pET-22b and TMPRSS2 gene fragment and colony PCR verification of positive clones

Fig 13 Double enzyme digestion verification and transformation of recombinant plasmid

3 讨论

SARS-CoV-2入胞的第一步是刺突蛋白S与受体ACE2识别,在宿主蛋白TMPRSS2的催化下完成病毒粒子与宿主细胞的膜融合。研究表明,SARS-CoV-2之所以不同于SARS-CoV,就在于它能更快地利用TMPRSS2。当SARS-CoV-2入侵时,TMPRSS2对S蛋白的S2亚基上进行酶切[1],这个切割点后露出一段疏水残基,并迅速嵌入宿主细胞膜。随后,伸展的S蛋白会折叠起来,像拉链一样迫使病毒的外膜与细胞膜融合。

本文生信分析显示,TMPRSS2为亲水性跨膜蛋白,说明其可能作为膜受体或膜离子通道起作用。TMPRSS2由492个氨基酸组成,分子量53.86 ku,等电点8.12,是一个碱性蛋白,这与其含有较多正电荷残基相契合。TMPRSS2蛋白的不稳定性与亲水性,为离子交换分离纯化、体外探究该蛋白的功能奠定了理论基础[11-12]。TMPRSS2蛋白在哺乳动物间保守性很高,与人源TMPRSS2序列一致性最高的是黑猩猩(0.980 0),次是大猩猩(0.974 0),暗示该蛋白在功能上的重要性。进化分析显示,黑猩猩、大猩猩与人亲缘关系最近,三者聚为一支,置信度为100;山羊单独聚为一支,与人的亲缘关系最远。

糖基化和磷酸化是两种重要的蛋白质翻译后修饰方式。TMPRSS2是抗病毒药物设计的重要靶点蛋白,有3个潜在的N-糖基化位点和12个O-糖基化位点。高度亲水的糖基,对于蛋白质的理化性质和生理功能具有重要影响。TMPRSS2蛋白糖基化位点的改造可进一步影响该蛋白的半衰期、靶向性、以及稳定性,有助于研制针对TMPRSS2蛋白的抗病毒药物。蛋白磷酸化修饰主要参与细胞内信号转导等生物学过程,而糖基化修饰可使不同蛋白质拥有不同的标记,从而改变多肽的构象,因此通过干预磷酸化和糖基化修饰位点将有望抑制病毒对宿主的侵染[13]。

TMPRSS2具有3个功能结构域:N端LDL受体A类结构域(C113-C148),其次是SRCR(G153-V246),最后是跨越I256-Q487的C端肽酶[7]。当TMPRSS2与ACE2共表达时,TMPRSS2能够切割ACE2并激活S蛋白,促进S蛋白与ACE2相互识别从而介导病毒入侵[14],因此,TMPRSS2在病毒入侵过程中发挥了“助攻”作用,TMPRSS2与ACE2的高表达可提高SARS-CoV-2的入侵能力[15]。研究发现[1, 16],TMPRSS2抑制剂可明显抑制SARS-CoV-2 S蛋白进入表达TMPRSS2的细胞系,而促进TMPRSS2的表达则可取消这种抑制作用,这就说明SARS-CoV-2 的S蛋白依赖于TMPRSS2启动,TMPRSS2的表达能够促进SARS-CoV-2的摄取[17]。

二级结构预测发现,TMPRSS2二级结构中占比最高的是无规则卷曲,该结构对TMPRSS2的整体构象和活性有着极其重要的作用,是构成酶活性部位和特异功能部位的重要结构[18]。本研究还建立了TMPRSS2蛋白在D144-D491、G103-A490、S167-R489位点的三级结构模型,为进一步设计和筛选TMPRSS2蛋白的潜在抑制剂和靶向药物奠定了结构基础[3]。表位预测显示,TMPRSS2蛋白具有13个B细胞抗原表位,这一结果对于找到有着相似免疫保护功能及抗原特异性却无完整蛋白毒性的抗原片段,具有很大帮助。此外,TMPRSS2的T细胞表位,这有助于细胞免疫机制研究及基因疫苗或亚单位多肽的开发。

功能位点分析显示,TMPRSS2蛋白有多个重要位点,例如R255、I256和S441,三者均处于预测的胰蛋白酶位点之内,同时I256和S441还位于Tryp-SPc位点之中。R255Q的突变会导致TMPRSS2彻底失去酶切活性[9]。此外,本研究结果显示S441还是一个潜在的磷酸化位点,同时也是B细胞抗原表位的关键残基。有报道称,S441作为TMPRSS2的关键残基与SARS-CoV-2 S蛋白裂解位点的侧翼残基具有相互作用[1, 7],S441R的突变会导致TMPRSS2活性丧失[9]。以上结果进一步印证了TMPRSS2蛋白协助病毒入侵的重要功能,同时为研发靶向TMPRSS2的抑制剂奠定了基础。

综上所述,本研究对TMPRSS2蛋白进行了全面的生物信息学分析和过表达载体构建,研究结果为了解TMPRSS2的生物学功能、明确SARS-CoV-2入侵人体细胞的分子机制奠定了基础,同时有助于揭示和完善TMPRSS2蛋白的结构和作用机理,对发掘其潜在抑制剂和研制靶向药物具有重要意义。

猜你喜欢

表位残基糖基化
汉滩病毒糖蛋白免疫反应性表位研究进展
人分泌型磷脂酶A2-IIA的功能性动力学特征研究*
基于各向异性网络模型研究δ阿片受体的动力学与关键残基*
多房棘球蚴葡萄糖转运蛋白抗原表位生物信息学预测a
Streptomyces sp.DJ菌株产生的角蛋白酶的序列分析
PD-1/PD-L1 的糖基化修饰对肿瘤免疫治疗影响的研究进展
“残基片段和排列组合法”在书写限制条件的同分异构体中的应用
间日疟原虫传播阻断疫苗新型候选抗原Pvs48 T.B 细胞表位的预测与分析
揭示玉米黑粉菌新的致病机制(2020.4.21 植物微生物最前线)
乙型肝炎病毒B和C基因型S蛋白特异性CTL表位保守性分析