APP下载

何首乌糖基转移酶基因的克隆、生物信息学及表达分析

2021-10-12蔡启忠周良云刘长征

中草药 2021年19期
关键词:何首乌密码子糖苷

蔡启忠,周良云,刘 露,刘长征,王 浩,钟 磊,杨 全

广东药科大学中药学院 国家中医药管理局岭南药材生产与开发重点研究室 国家中药材产业技术体系广州综合试验站广东省南药规范化种植与综合开发工程技术研究中心,广东 广州 510006

糖基化是自然界中广泛存在的重要修饰反应之一。糖基转移酶(glycosyltransferase,GT,EC 2.4.x.y)是催化糖基化反应的一类酶[1],在生物体内广泛存在的超基因家族[2],在酶催化反应中具有高效性和立体选择性[3],对植物的各种生命活动及次生代谢产物的形成上都具有重要影响[4]。随着植物糖基转移酶及催化底物谱的不断探索与发现,糖基化工具酶库不断扩充,反应类型不断丰富,糖基化反应将变得更绿色与经济,甚至使某些化学法难以糖基化的反应得以实现[5]。在糖基转移酶的研究与开发利用中,针对不同糖基酶的催化特点,有针对性的对其底物识别的特异性进行探索,从而发现特异性催化的糖基转移酶,系统性的总结其催化特点,进而建立糖基化的新方法,与化学合成进行优势互补,取长补短,以低成本、更绿色的手段来合成糖苷类化合物。

何首乌Polygonum multiflorumThunb.为蓼科多年生草本植物,主要以块根入药,是我国著名的传统中药。何首乌中含二苯乙烯类、蒽醌类、黄酮类、磷脂类、多糖类主要活性化学成分[6]。目前何首乌的单组分药理研究主要集中在对二苯乙烯苷的研究上。研究表明二苯乙烯苷具有抗衰老、抗动脉粥样硬化、抗高血脂、抗肿瘤、抗炎、清除自由基、保肝等方面的生物活性[7-8]。

目前,从何首乌中分离得到了多种以二苯乙烯类结构为母核的糖苷,在何首乌中主要以2,3,5,4′-四羟基二苯乙烯-2-O-β-D-葡萄糖苷的形式存在,是二苯乙烯苷元侧链结合一个单糖基,这意味着何首乌中存在相应的糖基转移酶参与何首乌二苯乙烯苷的糖基化修饰,且主要在2 位上形成O-糖苷。研究催化特定位点糖苷化的酶,不仅能阐述何首乌中二苯乙烯苷的O-糖基引入机制,也有助于阐明何首乌中活性成分的生物合成途径。迄今为止尚未有将何首乌中获得的糖基转移酶作为工具酶用于结构多样的糖苷化合物生物合成的报道。因此,挖掘并研究何首乌糖基转移酶并应用于多种结构类型的天然产物特定位点糖苷的酶法合成,具有重要的理论研究与实际应用价值。

1 材料与试剂

1.1 材料

何首乌植物采自广东省肇庆市德庆县大桥村,经广东药科大学杨全教授鉴定为蓼科植物何首乌P.multiflorumThunb.。取其根、茎、叶组织样品,液氮速冻后置-80 ℃保存备用。

1.2 菌株、载体及试剂

原核表达载体pET-28a(+)由实验室传代冻存;克隆和表达大肠杆菌Transl-T1、Transetta(DE3)与无缝连接试剂盒pEASY-Uni Seamless Cloning and Assembly Kit 均购自北京全式金生物技术有限公司;BamH I 限制性内切酶购自NEB 公司;植物多糖多酚总RNA 提取试剂盒购自北京天根生化科技有限公司;KOD-Plus-高保真酶购自日本TOYOBO 公司;PrimeScript™ II 1st Strand cDNA Synthesis Kit、胶回收试剂盒、PrimeScript™ RT reagent Kit with gDNA Eraser、TB Green™Premix Ex Taq™ II 均购自日本TaKaRa 公司;引物合成及基因片段测序由广州擎科生物技术有限公司完成。

2 方法

2.1 何首乌总RNA 的提取

取-80 ℃冻存的根、茎、叶组织样品,按照植物多糖多酚总RNA 提取试剂盒(Tiangen)操作说明提取何首乌总RNA,利用Nano-100 微量分光光度计检测RNA 浓度和纯度,1.0%琼脂糖凝胶电泳检测RNA 的完整性。

2.2 何首乌糖基转移酶基因(PmUGTs)的全长cDNA 克隆

本研究基于实验室已获得的何首乌转录组数据[9]筛选了4 条PmUGTs基因序列(Gene ID 分别为Unigene0051938、Unigene0017806、Unigene0027873与Unigene0034969),基于无缝克隆原理设计以上序列的特异性扩增引物(引物序列见表1)。按照KOD-Plus-Neo 扩增试剂盒说明(TOYOBO)进行,以反转录产物为模板,扩增PmUGTs基因片段。扩增反应体系为:cDNA 1 μL,KOD-Plus-Neo(1 U/μL)1 μL,10×PCR Buffer for KOD-Plus-Neo 5 μL,dNTPs(2 mmol/L)5 μL,MgSO4(25 mmol/L)3 μL,上、下游引物(10 μmol/L)各1.5 μL,ddH2O 补足至50 μL。反应程序:94 ℃预变性2 min;94 ℃变性30 s,60 ℃退火30 s,72 ℃延伸40 s,35 个循环后;72 ℃延伸10 min。1.0%琼脂糖凝胶电泳检测PCR 产物,胶回收PCR 产物。按照无缝克隆说明,将PCR 产物与BamH I 限制性内切酶酶切后的pET-28a 载体连接;转化到Transl-T1 菌株中,在含卡那霉素抗性的平板上进行筛选,挑取单菌落进行菌落PCR 检测,选取5 个阳性菌液送广州擎科公司测序验证。

表1 引物序列Table 1 Primer sequences

2.3 PmUGTs 的生物信息学分析

使用EMBOSS 在线软件与CodonW 1.4.2 软件对PmUGTs核苷酸序列进行密码子偏好性参数分析,包括同义密码子相对实用度(relative synonymous codon usage,RSCU)、密码子使用频次、密码子适应指数(codon adaptation index,CAI)、有效密码子数(effective number of codons,ENC)、GC 含量百分比、密码子末尾 GC 含量百分比(GC3s);利用ExPASy Proteomics Server 在线软件Protparam 对4 个PmUGTs基因编码蛋白分子式组成、蛋白质分子质量、理论等电点及稳定性等理化性质进行分析;Cell-PLoc 2.0 进行亚细胞定位;使用 SignalP 5.0 sever 预测跨膜结构域;通过EXPASY-SOPMA 在线预测蛋白质的二级结构;利用SWISS-MODEL 在线软件构建PmUGTs 蛋白的三级结构模型;使用Autodock 4.2.3 软件对推测底物进行分子对接模拟实验;将PmUGTs编码的氨基酸序列在NCBI 中进行蛋白BLAST 分析,利用DNAMAN软件与其他物种的UGT 氨基酸序列进行同源性分析;并通过 MEGA 6.0 软件构建neighbor-joining 系统进化树,采用泊松校正法计算进化距离,Bootstrap 重复次数为1000 次。

2.4 PmUGTs 基因的原核表达

挑选测序验证后的转化子,过夜培养,提取pET-28a-PmUGTs重组质粒,转化Transetta(DE3)感受态大肠杆菌中培养,在含卡那霉素抗性的平板上进行筛选,挑取单菌落进行菌落PCR 检测,选取5 个阳性菌液送广州擎科公司测序验证。挑选序列正确菌株,按1∶100 比例加入到适量含有50 μg/mL卡那霉素的LB 液体培养基中,37 ℃,200 r/min振荡培养至600 nm 吸光度(A600nm)达0.6~1.0;加IPTG 至终浓度0.4 mmol/L,20 ℃,200 r/min 培养12 h,诱导产生PmUGT 重组蛋白。经诱导表达的培养物,以5 500 r/min 离心15 min 收集菌体,用ddH2O 清洗菌体2 次后,将菌体悬浮于缓冲液(50 mmol/L Tris-HCl,1 mmol/L EDTA,10%甘油,1 mmol/L PMSF)中,超声破碎(750 W 功率,超声5 s,间歇5 s,工作5 min)。细胞破碎液于4 ℃,13 000 r/min,离心15 min,去除细胞碎片。取上清加入6×loading buffer 混匀,沸水浴5 min,13 000 r/min 离心5 min,上样10 μL 进行10% SDS-PAGE电泳,电泳结束后将胶置于考马斯亮蓝中染色1 h,用脱色液将背景色脱去,检测蛋白表达情况。

2.5 PmUGTs 基因的组织特异性表达分析

利用qRT-PCR方法检测何首乌PmUGTs基因在不同组织中的表达水平。取-80 ℃冻存的根、茎、叶组织样品,每个器官取3 个生物学重复,提取其总RNA,用反转录试剂盒PrimeScript™ RT reagent Kit with gDNA Eraser(TaKaRa 公司)将以上总RNA反转录生成单链cDNA。使用TB Green™PremixEx Taq™ II(TaKaRa),在CFX96 Touch(BioRad)仪上进行扩增。选取何首乌PP2A基因[9]作为目标基因定量表达的内参基因,通过primer BLAST 在线设计扩增引物,引物序列见表1。扩增体系中含10 μL SYBR®Green Pro Taq HS Premix(2×)、上下游引物(10 μmol/L)各0.4 μL、cDNA 2 μL,ddH2O补至总体积为20 μL,每个体系设3 次技术重复。反应程序:95 ℃预变性30 s;95 ℃、5 s,60 ℃、30 s,40 个循环后,进行溶解曲线分析。采用2-ΔΔCt方法进行相对定量分析,用SPSS 23.0 进行各组间方差分析,并用GraphPad Prism 7.0 作图。

3 结果与分析

3.1 PmUGTs 基因全长cDNA 克隆

以逆转录cDNA 为模板进行扩增后,4 条基因的扩增产物在2000~1000 bp 内,如图1所示。构建的pET-28a-PmUGTs重组载体经测序结果显示,克隆的目的片段与何首乌转录组数据中的基因序列一致,基因分别命名为PmUGT1、PmUGT2、PmUGT3、PmUGT4。

图1 PmUGTs 基因PCR 扩增产物Fig.1 PCR amplified production PmUGTs

3.2 PmUGTs 基因的生物信息学分析

3.2.1 PmUGTs 密码子偏好分析及其蛋白理化性质分析、亚细胞定位、跨膜区域分析 运用EMBOSS在线软件与CodonW 1.4.2分析PmUGTs进行密码子偏好参数分析,结果见表2、3,得出PmUGT1、PmUGT2、PmUGT3、PmUGT4的ENC 值分别为57.242、49.211、51.597、56.674,均值为53.681(远大于20 而偏向61),表明该密码子偏好性较弱;此外,所得的CAI 值分别为0.350 0、0.351 0、0.408 3、0.324 2,均值为0.358 4(远低于1.0),进一步说明PmUGTs对密码子的偏好性较弱;PmUGTs的GC与GC3s 含量均大于50%,表明该开放阅读框(ORF)序列中AT 含量小于GC 含量,且PmUGTs偏好使用以G/C 结尾的密码子。PmUGTs密码子RSCU 值分析如表3所示,其中24 个密码子RSCU 值大于1,是PmUGTs的偏好密码子;GCC、AUC、AGG、AGC、ACC、UAC 的RSCU 值大于1.5,即为高频率密码子;其中ACC(2.12)的RSCU 值大于2,表明PmUGTs对该密码子具有极强偏好性。

表2 PmUGTs 核苷酸序列特征分析Table 2 Analysis of nucleotide sequence of PmUGTs from P.multiflora

表3 PmUGTs 密码子RSCU 值分析Table 3 RSCU value analysis for PmUGTs from P.multiflora

使用在线软件Protparam 分析PmUGTs 的蛋白理化性质,结果如表4所示,得出PmUGT1、PmUGT2、PmUGT3、PmUGT4 的相对分子质量分别在56 940、54 780、54 305 和54 620;等电点(PI)分别在5.97、5.30、5.73、5.91;且均为亲水性蛋白;除PmUGT3 外(不稳定系数=32.84<40),其他蛋白皆为不稳定蛋白(不稳定系数>40)。使用亚细胞定位软件Cell-PLoc 2.0 预测出PmUGT1、PmUGT4定位于细胞膜中,PmUGT2、PmUGT3 则定位于细胞膜与叶绿体中。SignalIP 5.0 sever 在线软件分析得出PmUGTs 均不存在跨膜区域。

表4 PmUGTs 蛋白理化性质分析Table 4 Physicochemical property of PmUGTs protein from P.multiflora.

3.2.2 PmUGTs 蛋白二级和三级结构分析 预测结果如表5所示,PmUGTs 蛋白的二级结构由大部分的无规则卷曲(random coil)与α-螺旋(α-helices)组成,推测两者为蛋白主要二级结构元件;延伸链(extended strand)和β-折叠(β-turn)则分布于整个蛋白中。根据同源建模的原理,使用SWISS-MODEL对蛋白三维结构进行预测,三维结构如图2所示。PmUGT1、PmUGT2、PmUGT3、PmUGT4 蛋白同源建模使用的模板分子及其同源性分别为2pq6.1.A[10],36.19%;6l8x.1.A[11],33.93%;2pq6.1.A,52.22%;6lzx.1.A[12],27.86%。

图2 PmUGTs 蛋白的三级结构Fig.2 Tertiary structure prediction of PmUGTs

表5 PmUGTs 蛋白的二级结构Table 5 Secondary structure of PmUGTs protein from P.multiflora.

3.2.3 PmUGTs 氨基酸序列与系统进化树分析 将PmUGTs 氨基酸序列在BLASTP 中进行比对后,选择相似性高的氨基酸序列在DNAMAN 8.0 软件中进行多重序列比对,结果如图3所示,PmUGTs 与其他物种UGT 相似性为42.26%,N 端同源性较C端低。供比对的UGTs 都存在一段由44 个氨基酸组成 的 PSPG 盒 (plant secondary product glycosyltransferase box),其中还包含一段高度保守的氨基酸序列HCGWNS。选择不同植物的UGT 构建系统发育树分析,结果如图4所示,PmUGT1、PmUGT3 聚在同一支,PmUGT2 独在一支,三者与拟南芥的糖基转移酶蛋白距离较近;而PmUGT4与蒺藜苜蓿距离则较近。

图3 PmUGTs 与其他植物糖基转移酶序列比对结果Fig.3 Multiple sequence alignment of PmUGTs and UGT from other plant species

图4 PmUGTs 蛋白氨基酸序列的系统发育树Fig.4 Phylogenetic tree of amino acid sequence of PmUGTs

3.2.4 PmUGTs 蛋白与底物分子对接 根据SWISS-MODEL 进行同源建模可知,PmUGT1 和PmUGT3、PmUGT2、PmUGT4 分别以蒺藜苜蓿的UGT85H2、罗汉果的UGT74AC1、垂序商陆的PaGT3 作为模板构建蛋白三维模型。使用autodock 4.2.3 对PmUGT1 和PmUGT3、PmUGT2、PmUGT4分别与其分子模板主要的反应底物(鹰嘴豆芽素A、罗汉果醇以及白藜芦醇)进行分子对接模拟实验。结果表明(图5),鹰嘴豆芽素A 与PmUGT1 的Ser191、Ile84 [(抑制常数,Ki)=44.07 μmol/L,(结合自由能,ΔGbind)=-5.94]和PmUGT3 的ASN78、ASP80(Ki=8.59 μmol/L,ΔGbind=-6.91)通过氢键对接实现互相作用(氢键键程都在0.25 nm以内),推测以上残基可能是PmUGT1、PmUGT3识别鹰嘴豆芽素A 并作用的关键残基;罗汉果醇对PmUGT2 的ILE260、ASP244 与ASN484(Ki=9.94 μmol/L,ΔGbind=-6.82)通过5 个氢键对接(氢键键程在0.28 nm 以内),同理,以上残基可能为PmUGT2 识别罗汉果醇的关键残基;白藜芦醇对PmUGT4 的PRO422、GLY398 与GLY424(Ki=22.48 μmol/L,ΔGbind=-6.34)通过3 个氢键连接(氢键键程在2.3A 以内),即以上残基可能为白藜芦醇与PmUGT4 相互作用的关键残基。

图5 PmUGTs 与相应化合物配体的分子对接Fig.5 Molecular dockings of PmUGTs and relevant ligands

3.3 PmUGTs 的原核表达

使用pET-28a 作为原核表达载体,利用同源重组原理构建pET-28a-PmUGTs 重组表达载体,转化到Transetta(DE3)感受态大肠杆菌中诱导相关表达蛋白。SDS-PAGE 结果如图6所示,pET-28a-PmUGTs 经诱导后,与含目的基因的未诱导蛋白以及不含目的基因的空白载体诱导蛋白进行对比,在50 000~70 000 诱导样品6~10 皆存在明显的蛋白条带,与所预测PmUGT1、PmUGT2、PmUGT3、PmUGT4 的相对分子质量56 940、54 780、54 350和54 620 结果相近,所以图6中红色箭头所指4 个蛋白条带分别为PmUGT1、PmUGT2、PmUGT3 与PmUGT4 的重组蛋白。

图6 PmUGTs 重组蛋白SDS-PAGE 电泳图Fig.6 SDS-PAGE analysis of the expression of recombinant PmUGTs

3.4 组织特异性表达分析

利用qRT-PCR 分析PmUGTs基因在何首乌根、茎、叶中的相对表达水平。结果如图7所示,PmUGT1、PmUGT3 与PmUGT4中均呈现叶表达水平最高,茎次之,而根则最低的趋势。根据显著性差异分析得出,PmUGT1 与PmUGT3基因在茎与根的相对表达量相对于叶均下调,且具有显著性差异(P<0.05);PmUGT4基因的根相对于叶、茎的相对表达量均下调,分别呈现极显著性差异(P<0.01)与显著性差异的结果;而在PmUGT2中,茎相对于根与叶的相对表达量均下调,分别有极显著性差异与显著性差异的结果。

图7 PmUGTs 在何首乌不同组织中的相对表达水平Fig.7 Relative expression level of PmUGTs gene in different tissues

4 讨论

何首乌中存在着丰富的糖苷类化合物,如二苯乙烯苷类、黄酮苷类以及蒽醌苷类成分等,暗示着其中具有多种相应催化的糖基转移酶。至今仍未发现关于何首乌糖基转移酶的报道,为此,本研究以前期实验室获得的转录组测序数据为基础,成功从何首乌叶片中克隆出了4 条糖基转移酶基因,并分别命名为PmUGT1、PmUGT2、PmUGT3、PmUGT4。对PmUGTs的密码子偏好模式进行分析,发现其CAI 与ENC 均值为0.358 4 与53.681,表明PmUGTs的基因密码子偏好性较弱;但对ACC 密码子具有极强偏好(RSCU>2.00);且其GC3s 均>50%,该结果不符合大部分双子叶植物密码子偏好使用A/U结尾的特征,可能是在进化过程中产生突变,但是其具体原因还有待进一步研究。PmUGTs基因编码的蛋白C 端结构域均可发现一段含有糖基转移酶识别(WAPQV)、结合供体分子位点(HCGWNS)的PSPG box 保守序列[13-16],且该PSPG box 的第22、23 与44 位氨基酸种类一般会影响GT 的供体分子类型[17-18],PmUGTs 在以上位点皆分别为色氨酸、天冬氨酸与谷氨酰胺,由此可推测PmUGTs 的糖基供体极可能为UDP-葡萄糖。GT 根据其结构特性一般可分为GT-A 和GT-B 2 种折叠类型[19]。其中GT-B 型是由2 个正对的β/α/β 类Rossmann 折叠区域构成[20],一个为N 端结构域,另一个则为C 端结构域,且N 端同源性较C 端相比低,二者之间还有一个结合底物的口袋[20-21],观察本实验所预测的4 个PmUGTs 蛋白三维构型均与GT-B 型相符合。另外,本研究通过将PmUGTs基因与pET-28a质粒构建原核表达载体,诱导重组蛋白的表达,经过SDS-PAGE 验证得pET-28a-PmUGTs 重组蛋白成功表达。何首乌中的糖苷类成分生物合成仍存在许多未知,因此,为探究何首乌糖苷类成分的主要合成部位及可能存在的作用,本实验采用qRT-PCR 的方法研究PmUGTs基因在何首乌各组织中的相对表达情况。结果显示PmUGTs在何首乌各组织中存在特异性表达,总体而言,PmUGTs 在根中皆表现出较低的表达量。张伦等[22]研究表明,何首乌块根中二苯乙烯苷含量在6 到10月逐渐升高,10月达到峰值,然后一直到12月都逐渐降低,本研究qRT-PCR 实验所使用的样品采收于11月,所得结果与同时期二苯乙烯苷的含量逐渐减少相呼应,可能由于盛花期由10月开始,随后进入果熟期,此时营养生长已停止,糖基转移酶基因的表达量也随之降低。

由于糖苷类化学成分的重要性以及相关研究技术的发展,截止2020年11月,Carbohydrate Active enZymes(CAZy)数据库中已分类有111 个糖基转移酶家族(GT1~111)[16,24],其中GT1 为最大家族[24],可以催化萜类、生物碱类、黄酮类、苯丙素类以及木脂素类的糖基化[25]反应。一般通过分析GTs 对底物偏好的生化数据,使用系统发育树可以很好地对新发现的GTs 的底物特异性进行预测[26-27]。不仅如此,随着GT 酶结构的研究深入,还可以将已知的模板蛋白所能催化的受体底物,通过计算机模拟进行目标蛋白的底物预测[28]。经文献报道[10-12],UGT85H2 是蒺藜苜蓿的一种重要的糖基转移酶,是PmUGT1、PmUGT3 蛋白同源建模所用分子模板,能够对鹰嘴豆芽素A 等化合物反应生成糖基化产物;同时,UGT74AC1 与PaGT3 分别对罗汉果醇与白藜芦醇都具有糖基化作用,分别为PmUGT2、PmUGT4 蛋白同源建模所用分子模板。根据该结果,本实验利用autodock4 软件与PmUGTs的三维构象分子模板的反应底物分别进行模拟对接实验,结果得出PmUGT1 与PmUGT3、PmUGT2、PmUGT4 上的残基分别可以与鹰嘴豆芽素A、罗汉果醇以及白藜芦醇以氢键连接发生互相作用,且所得Ki、ΔGbind指数均在合理范围之内;且根据前文可知PmUGTs 均以UDP-葡萄糖作为糖基供体。由此可推测:PmUGT1 可催化鹰嘴豆芽素A 的5 位羟基,4’位甲氧基生成糖基,形成5,7-二羟基-4’-甲氧基异黄酮-5-O-β-D-葡萄糖苷与5,7-二羟基-4’-甲氧基异黄酮-4’-O-β-D-葡萄糖苷2 种产物;PmUGT3可催化鹰嘴豆芽素A 的5,7 位羟基生成糖基,形成5,7-二羟基-4’-甲氧基异黄酮-5-O-β-D-葡萄糖苷与5,7-二羟基-4’-甲氧基异黄酮-7-O-β-D-葡萄糖苷2种产物;而PmUGT2 可催化罗汉果醇的11、23、24位羟基生成糖基,形成罗汉果醇-11-O-β-D-葡萄糖苷、罗汉果苷IA1(CAS:88901-46-6)、罗汉果醇-23-O-β-D-葡萄糖苷;PmUGT4 则可催化白藜芦醇3,5,4’位羟基生成糖基,形成虎杖苷(CAS:27208-80-6)、白藜芦醇-5-O-β-D-葡萄糖苷与白藜芦醇-4’-O-β-D-葡萄糖苷3 种产物。以上结果可为后续进一步对PmUGTs 功能机制的研究提供理论基础。

利益冲突所有作者均声明不存在利益冲突

猜你喜欢

何首乌密码子糖苷
制何首乌引起药品不良反应1例报道
密码子与反密码子的本质与拓展
10种藏药材ccmFN基因片段密码子偏好性分析
香菇何首乌降血脂
甜叶菊及其糖苷的研究与发展探索
利用烷基糖苷迁移和扩张共轭亚油酸囊泡pH窗口
固体超强酸催化合成丁基糖苷
制何首乌中二苯乙烯苷对光和热的不稳定性
何首乌不同炮制品对H2O2致PC12细胞损伤的保护作用
茶树CsActin1基因密码子偏性分析