APP下载

谷氨酸棒杆菌中胞嘧啶碱基编辑工具的PAM拓展

2023-10-25刘佳慧刘叶花尔并王猛

生物技术通报 2023年9期
关键词:碱基谷氨酸突变体

刘佳慧 刘叶 花尔并 王猛

(1.天津科技大学生物工程学院,天津 300457;2.中国科学院天津生物工业技术研究所,天津 300308)

碱基编辑技术(base editing)是通过将碱基脱氨酶及其他功能元件与CRISPR/Cas系统相结合,在引导RNA(guide RNA, gRNA)的指引下,实现对基因组上目标位置胞嘧啶或腺嘌呤的碱基替换[1]。碱基编辑具有不产生双链切割、不需要外源模板且不依赖染色体同源重组的优势,成为真核及原核生物中一种强大的基因组编辑工具。

近年来碱基编辑技术不断发展壮大,目前已开发的 DNA 碱基编辑器种类主要包括:可介导C至T替换的胞嘧啶碱基编辑器[2-3]、介导A至 G替换的腺嘌呤碱基编辑器[4]、介导C至G或C至A替换的糖基化酶碱基编辑器[5],以及融和胞嘧啶碱基编辑器与腺嘌呤碱基编辑器的双功能碱基编辑器[6]等。此外,先导编辑(prime editing)是一种较新的全能型碱基编辑技术,可实现对各种类型的碱基序列进行替换[7],但目前该工具在原核生物中编辑效率较低[8],未得到广泛应用。除上述碱基编辑器种类的扩展以外,碱基编辑技术的编辑效率、编辑窗口大小以及脱靶等问题也在不断的得到优化[9]。但是,CRISPR/Cas系统存在自身的PAM(protospacer adjacent motif)依赖性,如最常用的SpCas9(Streptococcus pyogenes Cas9),具有NGG PAM要求,这限制了结合SpCas9碱基编辑技术的可编辑位点范围,因此,释放PAM序列限制是提高基因组目标位点覆盖度的有效方法。通常采用的优化方式是利用识别不同 PAM的SpCas9 突变体或不同种类的Cas蛋白。现已报道多种识别不同PAM的Cas蛋白应用于真核或原核生物的碱基编辑中,极大地促进了基因组可编辑位点的覆盖范围,其中天然Cas蛋白包括Cpf1(也称为Cas12a, TTTV PAM)、ScCas9(Streptococcus canis Cas9, NNG PAM)、CjCas9(Campylobacter jejuni Cas9, NNNNRYAC PAM)等,SpCas9突变体包括SpCas9 VQR(NGA PAM)/VRER(NGCG PAM)、xCas9 3.7(NG、NNG、GAA、GAT、CAA PAM)、SpCas9-NG(NG PAM)、SpCas9-NRCH/NRTH/NRRH、SpG(NGN)、SpRY(近乎PAMless, NRN>NYN PAM)等[10-13]。

谷氨酸棒杆菌(Corynebacterium glutamicum)是一种重要的食品级微生物,已被广泛用于各种氨基酸、有机酸等的工业化生产[14]。本研究团队及合作者前期在谷氨酸棒杆菌中开发了一种多元自动化的碱基编辑方法MACBETH(multiplex automated Corynebacterium glutamicum base editing method),实现基因组目标位点C到T的替换[15],随后又对该技术从编辑覆盖度、碱基编辑种类、碱基编辑框、碱基编辑实验条件、多位点碱基编辑等多方面进行了优化[16-19]。尽管前期的工作已将PAM较为宽松的突变体xCas 3.7,SpCas9-NG应用于碱基编辑工具的PAM拓展中,但基因组编辑结果的稳定性较差、编辑效率偏低,而结合SpCas9 VQR/VRER的碱基编辑工具,虽然编辑效率较高,但这两种碱基编辑工具的PAM识别范围仍然有限[16],因此,谷氨酸棒杆菌碱基编辑工具的PAM仍然需要进一步拓展。本研究拟结合近年来最新报道的Cas9突变体,进一步对谷氨酸棒杆菌中的胞嘧啶碱基编辑工具进行PAM拓展,同时也为谷氨酸棒杆菌中基于CRISPR/Cas系统的其他基因组编辑工具的PAM拓展提供有力的参考。

1 材料与方法

1.1 材料

1.1.1 菌种和质粒 本研究所用菌株和质粒均为作者所在实验室保存和构建,结合各种Cas9蛋白或突变体的碱基编辑器的表达质粒详见表1,其构建所需的引物详见表2,含基因组靶标序列的gRNA质粒均由质粒pgRNA-ccdB作为模板,替换20 bp gRNA靶标序列构建获得。

表1 本文用到的质粒与菌株Table 1 Plasmids and strains used in this study

表2 本文质粒载体构建用到的引物Table 2 Primers for plasmids construction used in this study

1.1.2 酶、引物及相关试剂盒 Q5 High-Fidelity DNA聚合酶、T4 DNA连接酶、各种限制性内切酶购自纽英伦生物技术有限公司。大肠杆菌感受态细胞制备试剂盒购自TaKaRa公司。2×Es Taq Master Mix(Dye)购自康为世纪有限公司。质粒小量抽提试剂盒、普通DNA产物纯化试剂盒购自天根生化科技有限公司。重组试剂盒ClonExpress®MultiS One Step Cloning Kit购自南京诺唯赞生物科技有限公司。PCR引物由擎科生物科技有限公司合成。

1.1.3 培养基 LB培养基(g/L):蛋白胨10,氯化钠10,酵母粉5。NCM培养基(g/L):磷酸氢二钾17.4,氯化钠11.6,葡萄糖5,蛋白胨5,酵母粉1,柠檬酸三钠0.3,七水合硫酸镁0.05,山梨醇91,调pH至7.2。BHIS 培养基(g/L):BHI(brain heart infusion)18.5,山梨醇91,调pH至7.2。LBHIS 培养基(g/L):蛋白胨5,BHI 18.5,氯化钠10,山梨醇91,酵母粉2.5。制备固体培养基时添加2%的琼脂粉。

1.2 方法

1.2.1 gRNA的设计 本研究所选用的gRNA序列均由CHOPCHOP gRNA设计网站设计得出,设计参数为gRNA长度20 nt,PAM根据所需设置,其他参数为软件默认参数。详见表3。

表3 本文所用到的gRNATable 3 gRNAs used in this study

1.2.2 质粒构建 质粒pnCas9-Sc++(D10A)-AID的构建:ScCas9++蛋白编码基因由金斯瑞公司合成,按照谷氨酸棒杆菌密码子偏好性进行优化;以合成基因为模板,用引物ScD10A-1F/1R扩增得到相应片段;以质粒pnCas9(D10A)-AIDTS为模板,用引物ScD10A-2F/R、ScD10A-3F/S-3R、ScD10A-4F/4R扩增获得其他载体片段;将上述片段进行多片段同源重组连接,再转化至E.coli DH5α中,经酶切及测序验证后,获得正确质粒。

质粒pnCas9-SpG(D10A)-AID的构建:SpG突变区域基因片段由公司合成;以合成基因为模板,用引物SpG-1F/1R扩增得到相应片段;以质粒pnCas9(D10A)-AIDTS为模板,用引物SpG-2F/2R、S-3F/S-3R、SpG-4F/4R扩增获得其他载体片段;将上述片段进行多片段同源重组连接,再转化至E.coli DH5α中,提取质粒后经酶切及测序验证后,获得正确质粒。

质粒pnCas9-SpRY(D10A)-AID的构建:SpRY突变区域基因片段由公司合成,以此为模板,用引物SpRY-1F/1R扩增得到突变体的片段;再以质粒pnCas9(D10A)-AIDTS为模板,用引物SpRY-2F/2R、S-3F/S-3R、SpRY-4F/4R分别扩增获取其他片段;将上述片段经同源重组连接,转化至E.coli DH5α,质粒酶切和测序验证后,得到正确的质粒。

含不同gRNA靶标位点序列的质粒构建:合成含gRNA靶标序列的上下游引物,同时上下游引物的5′端添加用于形成黏性末端的4 bp序列,经退火结合后,与质粒pgRNA-ccdB 通过Golden Gate方法连接构建,具体方法可参见文献[15]。

1.2.3 谷氨酸棒杆菌的转化 将在BHI液体培养基中过夜(约16 h)培养的C.glutamicum ATCC 13032菌液以初始OD600=0.3转接到含异烟肼(isonicotinyl hydrazide, INH)、Tween80、DL-苏氨酸和葡萄糖的NCM培养基中。在OD600为0.8-1时,制备C.glutamicum ATCC 13032感受态细胞,具体方法参见文献报道[20]。

单质粒转化:取1 μg 质粒加入80 μL C.glutamicum ATCC 13032感受态细胞中,在电压为1.8 kV电转两次后立即加入1 mL提前预热的BHIS培养基中,在46℃的金属浴锅中温浴6 min。摇床30℃,220 r/min培养2 h后,涂布于含5 μg/mL Cm抗性的LBHIS固体培养基平板上,30℃静置培养2-3 d,直至长出单菌落。

双质粒转化[15]:取2 μg pnCas9(D10A)-AIDTS质粒(或pnCas9-SpRY(D10A)-AID、pnCas9-Sc++(D10A)-AID、pnCas9-SpG(D10A)-AID)和1 μg gRNA质粒加入到80 μL C.glutamicum ATCC 13032感受态细胞中,在电压为1.8 kV电转两次后立即加入1 mL提前预热的BHIS培养基中,在46℃的金属浴锅中温浴6 min。然后放置30℃,220 r/min的摇床中培养2 h,将培养后的菌液涂布于含15 μg/mL Kan和5 μg/mL Cm抗性的LBHIS固体培养基平板上,放置在30℃培养箱中培养2-3 d,直至长出单菌落。

1.2.4 谷氨酸棒杆菌的培养及碱基编辑 种子培养:挑取生长良好的单菌落接种于每孔装有600 μL LBHIS液体培养基(含15 μg/mL Kan和5 μg/mL Cm)96孔板,30℃,800 r/min培养24 h。诱导培养:将种子培养液按初始OD600=0.2的接种量转接于每孔装有600 μL的LBHIS液体培养基(含1 mmol/L IPTG,15 μg/mL Kan和5 μg/mL Cm)的96孔板中,30℃,800 r/min培养16 h。

1.2.5 碱基编辑比例分析 将诱导编辑后的菌液,用各自引物(距离靶标位点上下游约150 bp处设计引物)和2×Es Taq Master Mix(Dye)进行菌液PCR,将PCR产物送Sanger测序。借助EditR网站[21]分析Sanger测序峰图结果,汇总整理编辑效率。

1.2.6 生长曲线测定 挑取生长良好的单克隆(每种3个平行)转接于5 μg/mL Cm抗性的LBHIS液体培养基中,过夜培养16 h;第2天以此为种子液以初始OD600=0.2的接种量转接至5 μg/mL Cm抗性的LBHIS液体培养基中,分别在培养0、3、6、9、12、24、30 h时取样,通过分光光度计测定其OD600值,并记录。

2 结果

2.1 结合不同Cas9蛋白的胞嘧啶碱基编辑工具的构建

谷氨酸棒杆菌为高GC含量的菌株,为了能够覆盖更多的基因组位点,选择了3种新型PAM宽松的Cas9蛋白对谷氨酸棒杆菌中的胞嘧啶碱基编辑器进行优化,包括近乎PAMless的SpRY突变体(NRN>NYN PAM)、识别NGN PAM的SpG突变体,以及识别NNG PAM的ScCas9++蛋白。构建了双质粒碱基编辑系统,其中一个质粒表达不同的nCas9(D10A)蛋白与胞嘧啶脱氨酶(activation-induced cytidine deaminase, AID)的融合蛋白(图1-A),另一个质粒可转录生成靶标不同基因组位点的gRNA序列(图1-B)。相比单质粒的碱基编辑系统(将上述融合蛋白与gRNA表达框构建在一个质粒上),gRNA质粒的单独构建,能够方便本研究中不同碱基编辑器之间的交叉使用,降低构建工作的冗余,同时,基于之前的研究结果,单质粒编辑系统与双质粒编辑系统的编辑效率并无明显差异,不会对测试结果产生影响。本研究中所测试的gRNA序列详见表3,靶标序列均为基因组内源序列,可以覆盖NRN、NNG所有的PAM种类。另外,为了研究结合不同Cas9蛋白的碱基编辑工具是否会对谷氨酸棒杆菌的生长产生影响,测试了含不同碱基编辑工具菌株的生长曲线,并以含pXMJ19TS空质粒的菌株作为对照(图1-C)。结果表明,含不同碱基编辑工具的菌株与对照菌株相比,生长曲线并没有明显差异,这表明结合不同Cas9蛋白的碱基编辑工具不会对谷氨酸棒杆菌的生长产生影响。

2.2 结合SpRY(near-PAMless)的胞嘧啶碱基编辑工具的编辑效率测试

将包含SpRY突变体的碱基编辑质粒与覆盖NRN PAM的gRNA质粒分别转化至谷氨酸棒杆菌13032中,并进行编辑,通过对编辑后菌液的靶标区域进行Sanger测序,同时结合EditR在线分析软件对编辑结果进行评估。从编辑结果来看(图2),结合SpRY突变体后,碱基编辑框没有发生明显的改变,仍为PAM 序列上游 -16 - -20 位。针对所测试的PAM类型,相比nCas9(D10A)-AID,nCas9-SpRY(D10A)-AID展示出了更宽松的PAM识别,除对CAT、CAC、TAA PAM的位点完全没有编辑外,对其他的NRN种类的PAM位点均出现了不同程度的识别,其中对AGA PAM位点的编辑效率最高,达到85%,而原始nCas9(D10A)-AID在该位点未发生编辑。但是,nCas9-SpRY(D10A)-AID整体编辑效率偏低,所测试的全部32种PAM类型中,仅4种PAM位点的最高编辑效率高于50%(AGA、TGG、CGG、GGG PAM),13种PAM位点的最高编辑效率低于20%。对原始NGG PAM位点的识别,相比nCas9(D10A)-AID,nCas9-SpRY(D10A)-AID编辑效率下降17.5%-80%,最高编辑效率仅为59.3%,而nCas9(D10A)-AID最高编辑效率高达100%。

2.3 结合SpG(NGN PAM)的胞嘧啶碱基编辑工具的编辑效率测试

将结合SpG突变体的碱基编辑质粒与覆盖所有NGN PAM的gRNA质粒分别共转化至谷氨酸棒杆菌13032中,然后进行碱基编辑、编辑结果分析。如图3所示,结合SpG突变体后,碱基编辑框没有发生明显的改变。与nCas9(D10A)-AID相比,nCas9-SpG(D10A)-AID能够实现对所有测试的NGN PAM基因组位点的编辑,其中对AGT PAM位点的编辑效率最高,达到83.7%,而原始nCas9(D10A)-AID并没有在该位点进行编辑。对于原始NGG PAM位点的编辑,nCas9-SpG(D10A)-AID相比于nCas9(D10A)-AID,编辑效率下降9.3%-55.9%,编辑效率最高达到76.3%。虽然nCas9-SpG(D10A)-AID的PAM识别范围不如nCas9-SpRY(D10A)-AID的PAM识别范围广,但nCas9-SpG(D10A)-AID对NGN PAM的基因组位点的整体编辑效率要优于nCas9-SpRY(D10A)-AID。在测试的16种PAM类型中,有6种PAM位点的编辑效率最高超过50%(AGT、AGA、AGG、GGG、TGT、CGC PAM),仅有1种PAM位点的编辑效率低于20%,此外还有10种PAM位点的编辑效率高于nCas9-SpRY(D10A)-AID的编辑结果。

图3 nCas9-SpG(D10A)-AID的碱基编辑结果Fig.3 Base editing results of nCas9-SpG(D10A)-AID

2.4 结合ScCas9++(NNG PAMs)的胞嘧啶碱基编辑工具的编辑效率测试

ScCas9为SpCas9的直系同源蛋白,可实现对NNG PAM的识别,ScCas9++突变体为ScCas9蛋白基础上基于其他直系同源蛋白进化得到的突变体,可以进一步提高基因组编辑。将结合ScCas9++蛋白的碱基编辑质粒与覆盖所有NNG PAM的gRNA质粒分别共转化至谷氨酸棒杆菌13032中,然后进行碱基编辑、编辑结果分析。如图4所示,结合ScCas9++后,碱基编辑框没有发生明显的改变。相比nCas9(D10A)-AID,除对TCG,CTG PAM的基因组位点没有编辑外,ScCas9++(D10A)-AID可实现对其他测试NNG PAM的基因组位点编辑,大部分位点基因组编辑效率均较高,对CAG和GAG PAM的基因组位点编辑效率最高达到100%,而原始nCas9(D10A)-AID在该位点的编辑效率低于10%。对原始NGG PAM位点的编辑, 相对于原始的nCas9(D10A)-AID,突变体nCas9-SpG(D10A)-AID的编辑效率没有明显下降,甚至个别位点编辑效率要高于nCas9(D10A)-AID。在测试的16种PAM类型中,除4种PAM位点的最高编辑效率低于20%以外,其他PAM位点的最高编辑效率均高于70%。

图4 ScCas9++(D10A)-AID的碱基编辑结果Fig.4 Base editing results of ScCas9++(D10A)-AID

3 讨论

作为近年来新兴的基因组编辑工具,碱基编辑工具凭借着自身强大的优势,逐渐在真核及原核微生物领域中得到广泛的应用,包括应用于功能基因失活、蛋白进化、多基因调控、分子存储等领域[1]。本团队与其合作者率先在重要的工业生产菌株谷氨酸棒杆菌中开发了多元自动化的碱基编辑工具,并将该技术进行了多方面的应用,包括对代谢途径关键基因进行多基因组合失活或单基因突变,提高谷氨酸或赖氨酸的产量[15-16];结合自动化操作平台,快速构建94个转录因子的基因失活文库,成功率达到100%[15];开发了基于碱基编辑工具的新型染色体原位多基因表达调控技术(base editor-targeted and template-free expression regulation, BETTER),实现了谷氨酸棒杆菌中最高10个基因的同时表达调控[23]。另外,近期本研究团队与合作者结合碱基编辑工具以及靶向全基因组的gRNA混合文库,开发了全基因组扰动文库构建与筛选技术,作为示例,以基因编码区提前生成终止密码子的方式,构建了谷氨酸棒杆菌的全基因组基因失活文库,并实现了特定性状下的功能基因发掘[24]。但受限于原始Cas9的PAM限制,结合原始Cas9的胞嘧啶碱基编辑工具,仅能失活88.0%的谷氨酸棒杆菌13032的基因组基因。尽管前期研究尝试应用xCas9 3.7 以及 Cas9-NG突变体将NGG 的PAM限制释放至NGN,这样可以将基因组失活基因覆盖率提高至99.2%,仅有24个基因不能被失活,但是结合xCas9 3.7 以及 Cas9-NG突变体的碱基编辑工具,对基因组位点编辑效率不稳定,仅能实现对部分NGN PAM位点的编辑[16]。因此,在谷氨酸棒杆菌中对PAM位点的拓展仍需要进一步优化。PAM位点的拓展,可以极大地提高基因组可编辑位点的范围,不仅有利于失活更多的基因,同时对蛋白质的理性/非理性突变、代谢通路的表达调控等均具有重要的意义。

对PAM序列的拓展,主要通过采用识别不同PAM的SpCas9突变体或者其他Cas蛋白来实现。其中,SpG与SpRY突变体是基于原始SpCas9蛋白结构,在PAM相互作用区域(PAM interacting(PI)domain)引入不同突变获得的PAM限制宽松的两种突变体,其中SpG突变体包含6个氨基酸突变位点(D1135L/S1136W/G1218K/E1219Q/R1335Q/T1337R),PAM识别释放至NGN PAM,而SpRY突变体则是在SpG基础上再引入L1111R/A1322R/ A61R/N1317R/R1333P五个位点突变获得的突变体,PAM限制释放至近乎PAMless[12]。SpG与SpRY突变体一经开发便引起众多关注,在哺乳动物细胞、植物以及微生物领域均有报道应用。Qiao团队在乳酸乳球菌中通过结合SpG、SpRY突变体对其开发的碱基编辑工具的PAM进行了拓展,其开发的CRISPR-cDBE(SpGn)可以实现对V(T/A/C)GG、NGM(A/C)、K(T/G)GT PAM的识别,而CRISPR-cDBE(SpRYn)则可以实现对NGV(G/A/C)、TGT、W(T/A)AG、H(T/A/C)AA、D(T/A/G)AY(C/T)、R(A/G)CG、D(T/A/G)CA、B(T/C/G)CC、V(A/C/G)CT、V(A/C/G)TS(G/C)、R(A/G)TA、M(A/C)TT PAM的识别[25]。本研究中,结合SpRY的胞嘧啶碱基编辑工具在谷氨酸棒杆菌中,除对CAT、CAC、TAA PAM的基因组位点完全没有编辑外,对其他的NRN种类的PAM位点均有不同程度的编辑,但编辑效率整体较低,并且对原始NGG PAM的基因组位点编辑效率下降较明显。因此结合SpRY突变体的碱基编辑工具未能在谷氨酸棒杆菌中实现对PAM的有效拓展及基因组稳定编辑。而结合SpG的胞嘧啶碱基编辑工具在谷氨酸棒杆菌中可实现对所有NGN PAM的识别,且编辑效率优于结合SpRY突变体的碱基编辑工具。另外,本研究将ScCas9++蛋白应用于谷氨酸棒杆菌碱基编辑工具的PAM扩展中,且可以实现对大多数NNG PAM基因组位点的高效编辑,对NGG PAM位点的编辑效率也要优于SpRY、SpG突变体。经统计,结合原始SpCas9蛋白以及上述3种突变体,目前可以实现对NNN PAM中的35种PAM进行识别,仍有29种PAM不能覆盖。

除了对PAM序列的拓展外,碱基编辑工具基因组编辑范围的扩展还可以通过扩展或改变碱基编辑窗口来实现,例如本研究团队及合作者通过改变gRNA靶标序列的长度,实现了对谷氨酸棒杆菌碱基编辑窗口的扩展(可实现PAM上游-15位、-21位的编辑)[16];通过构建BE3型胞嘧啶碱基编辑器,可以实现谷氨酸棒杆菌碱基编辑窗口的改变(PAM上游-11- -19位)[17]。另外,脱靶问题也是碱基编辑工具面临的重要问题,后续研究将针对本文新优化的碱基编辑工具进行进一步的脱靶评估,可通过引入增强Cas蛋白保真性的突变位点进一步降低脱靶效率。

4 结论

本研究在谷氨酸棒杆菌中构建结合不同种类的Cas9蛋白的胞嘧啶碱基编辑系统,编辑效率结果显示,碱基编辑系统结合SpRY突变体,可以实现多数NRN PAM位点的识别,但总体编辑效率较低;结合SpG突变体,虽然可以将PAM限制释放至NGN,但对原始NGG PAM位点的编辑效率有所下降;结合ScCas9++蛋白,可实现对大部分NNG PAM位点的编辑,整体编辑效率较高。

猜你喜欢

碱基谷氨酸突变体
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来4名新成员
生命“字母表”迎来4名新成员
基于正交设计的谷氨酸发酵条件优化
N-月桂酰基谷氨酸盐性能的pH依赖性
问:如何鉴定谷氨酸能神经元
CLIC1及其点突变体与Sedlin蛋白的共定位研究
拟南芥干旱敏感突变体筛选及其干旱胁迫响应机制探究
SHP2不同突变体对乳腺癌细胞迁移和侵袭能力的影响