APP下载

新型DNA碱基编辑器的研究进展

2022-10-31张雅玲王锌和李构思曾栋昌祝钦泷陈乐天刘耀光

华南农业大学学报 2022年6期
关键词:编辑器碱基位点

张雅玲,王锌和,李构思,曾栋昌,祝钦泷,陈乐天,刘耀光

(亚热带农业生物资源保护与利用国家重点实验室/岭南现代农业科学与技术广东省实验室/华南农业大学 生命科学学院, 广东 广州 510642)

基因编辑技术是指能够对特定染色体区段或基因进行核苷酸碱基的定点重组、敲除和定点插入/替换的技术。作为21世纪生命科学领域最重要的突破性、革命性技术之一,基因编辑技术的开发与应用被迅速地推广至包括人类在内的动植物基因功能、遗传改良和疾病治疗等领域,极大地推动了生物学各个学科的发展,使生物基础科学和应用科学进入了前所未有的广度和深度。基因编辑技术的发展始于序列特异识别元件与核酸酶的融合,历经3个发展阶段且越来越简洁高效:第1代是锌指核酸酶(Zinc finger nucleases,ZFNs)基因编辑系统,它由负责识别特定序列的锌指蛋白和负责切割的核酸内切酶FokⅠ组成,其中,锌指蛋白包含多个串联的、能识别3个特异连续碱基对的锌指结构[1-4];第2代是类转录激活因子效应物核酸酶(Transcription activator-like effector nucleases,TALENs)基因编辑系统,它由识别单个碱基对的转录激活因子类效应子(Transcription activator-like effector,TALE)基序串联形成序列识别模块,融合核酸内切酶FokⅠ后对特异片段进行定向切割[5-7];第3代是由成簇的规则间隔短回文重复系列(Clustered regularly interspaced short palindromic repeat,CRISPR)及CRISPR相关核酸酶蛋白(CRISPR-associated protein,Cas)组成的新型基因编辑系统,CRISPR/Cas系统主要包含单链引导RNA(Signal guide RNA,sgRNA)和Cas核酸酶组成,Cas核酸酶能在sgRNA的引导下定向切割双链DNA[8]。以CRISPR/Cas9为代表的CRISPR/Cas系统载体构建简单,编辑效率高,成本低且能实现同时多靶点编辑,因此成为目前使用最为广泛的基因编辑工具[9-11]。核酸酶FokⅠ或Cas蛋白都能切割DNA序列产生双链断裂(Double-stranded break,DSB),生物体内的DNA发生DSB后会启动内源修复,其中,最主要的修复方式是非同源末端连接(Non-homologous end joining,NHEJ)修复[12-13]。当存在同源DNA模板时,该DSB也能被同源定向修复途径(Homologydirected repair,HDR)修复。NHEJ介导的修复响应迅速高效但容易出错,大概率会在切割位点附近产生碱基的随机插入或缺失突变(Insertions and deletions,Indels),并破坏靶基因功能;同源重组途径可以产生精准的修复,但是效率低,目前尚难以广泛使用[12-13]。因此,CRISPR/Cas系统对目标片段的编辑具有不可控的随机性,可以破坏基因功能,但不能对单个碱基进行精准替换编辑。然而,许多人类疾病的发生或作物重要农艺性状的改变是由单碱基变异引起的[14-15],开发高效、精准的单碱基替换编辑系统对基因治疗或作物育种研究非常重要。为了更加精准地编辑特定片段或碱基,DNA碱基编辑系统应运而生。目前已有多种DNA碱基编辑器被开发,包括能将C·G至T·A转换的胞嘧啶单碱基编辑器(Cytosine base editors,CBEs)、能将A·T至G·C转换的腺嘌呤单碱基编辑器(Adenine base editors,ABEs)、C·G至G·C颠换的糖基化酶单碱基编辑器(Glycosylase base editors,GBEs)、能同时实现同一位点的C·G至T·A和A·T至G·C转换的双碱基编辑器(Dual base editors,DBEs)、适应所有碱基之间转换的引导编辑器(Prime editors,PEs)以及线粒体DNA编辑器。DNA碱基编辑器的开发为植物基因组功能解析和作物精准育种提供了强有力的技术支撑,本文着重总结上述DNA编辑器最新研究进展及优化历程,介绍它们在作物遗传改良中的应用,并对碱基编辑技术今后的发展进行了展望。

1 DNA碱基编辑器

1.1 胞嘧啶单碱基编辑器(CBEs)

1.1.1 CBEs的建立 单碱基编辑系统是基于CRISPR/Cas9系统开发的更为精准的碱基替换系统。CRISPR/Cas9系统工作时,sgRNA和Cas9核酸酶蛋白形成复合体,Cas9蛋白在sgRNA的引导下,找到编辑受体基因组的目标靶点位置并与之结合形成三元复合体,随后Cas9核酸酶的2个核酸酶结构域HNH和RucV-like分别在前间区序列邻近基序(Protospacer adjacent motif,PAM)上游3 nt的位置对互补链和非互补链进行单链切割,形成了平末端DSB位点。为避免Cas9核酸酶介导的双链切割,哈佛大学David Liu团队将Cas9蛋白的第10位(天冬氨酸Asp→丙氨酸Ala,D10A)和第840位氨基酸(组氨酸His→丙氨酸Ala,H840A)进行点突变,获得了能被sgRNA引导并结合DNA但核酸酶功能丧失的dCas9(Catalytically dead Cas9),开创性地将dCas9与仅作用于单链DNA的高活性大鼠胞苷脱氨酶rAPOBEC1融合表达,首次开发出了不依赖DNA双链断裂且无需同源模板就能够实现定向转换C·G至T·A的胞嘧啶碱基编辑器BE1,编辑窗口是PAM上游-17~-13位之间约5 nt的区段[16]。BE1的基本工作原理是dCas9-rAPOBEC1融合蛋白在sgRNA的引导下结合至靶点位置,rAPOBEC1将编辑窗口区内胞嘧啶C脱氨基转换成尿嘧啶U,在后续的DNA复制或修复过程中,U被识别为胸腺嘧啶T,互补链中相应位置的鸟嘌呤G也被转换为腺嘌呤A,因此产生了C·G至A·T的定向转换。Komor等[16]研究发现BE1在人源H293T细胞中编辑效率仅为0.8%~7.7%,远远低于体外试验(25%~40%),猜测是体内尿嘧啶DNA糖基化酶(Uracil DNA glycosylase,UDG)会识别错配的U·G,催化去除U后启动碱基切除修复(Base-excision repair,BER)过程,将U·G恢复为C·G。基于这一猜测,该团队将尿嘧啶DNA糖基化酶抑制蛋白(Uracil DNA glycosylase inhibitor,UGI)融合到BE1,开发出第2代碱基编辑器BE2,成功将细胞内C·G至T·A编辑效率提高至20%。真核生物的错配修复机制(Eukaryotic mismatch repair,MMR)可以利用新合成DNA链上的切口识别错误碱基并进行切除和重新合成,为了进一步操纵DNA碱基修复过程,该团队尝试恢复dCas9蛋白的HNH核酸酶结构域的切割活性,Cas9缺刻酶(Nickase Cas9,nCas9)能在互补链上产生单链切口,从而诱导激活MMR或BER途径,使错配的U·G被优先修复为U·A,进而获得目标突变T·A,这一方式构建的编辑系统即为第3代碱基编辑器BE3(图1a)。与BE2相比,BE3在人类细胞中的C-T编辑效率(约37%)提高了2~6倍,编辑窗口仍为PAM上游-17~-13位[16]。这一系列极具创新的研究成果迅速点燃了生物科学领域科研工作者的研究热情,基于BE3进行优化或改进的单碱基编辑器版本层出不穷,编辑对象由人类细胞推广至各类动植物和微生物。

图1 CBE、ABE和GBE碱基编辑器原理Fig. 1 Schematic diagrams of CBE, ABE and GBE systems

1.1.2 CBEs的优化 CBE系统的优化和改造主要涉及以下5个方面:1)优化UGI的拷贝数、增加游离的UGI分子或利用胞嘧啶脱氨酶对底物序列的偏好性,降低非目的编辑产物。Komor等[17]通过在BE3系统中融入第2份UGI构建了第4代碱基编辑器BE4,该系统的C·G至T·A转换效率增加了约50%,且减少了一半的非C至T副产物。Komor等[17]将BE4与DSB末端保护蛋白Gam融合,成功构建了与BE4相比C·G至T·A编辑能力不变而Indels发生频率大幅减少的BE4-Gam系统。Wang等[18]通过共表达BE3系统和游离的UGI分子获得了增强型碱基编辑器(Enhanced base editor,eBE),该系统在抑制非目的Indels和替换编辑的同时,有效提高了B E 3的编辑准确度。Geheke等[19]和Zhang等[20]通过改造人类胞嘧啶脱氨酶hAPOBEC3A创建了eA3A-BE3,强化了其对TC序列的偏好性,能高效引起TC模块中C的突变而不编辑其他C,在减少了非目的编辑的同时缩小了编辑窗口。

2)优化碱基编辑器的表达、融合其他功能性分子,提高CBE编辑活性。在BE4的表达核两端融入核定位信号后,新系统BE4max编辑效率较BE4提升了1.3倍,通过优化祖先序列的密码子增强表达构建的AncBE4max展现出比BE4max更优越的编辑能力[21]。Zafra等[22]通过优化BE3、BE4-Gam和xBE3的密码子和增加额外的核定位信号,开发FNLS系列CBE,进一步大幅提高了编辑效率,编辑窗口内的C·G至T·A转换率提升了15~150倍。Zhang等[20]将DNA修复相关蛋白Rad51的单链DNA结合结构域融合到nCas9和脱氨酶之间,构建了具有超高编辑活性、更宽编辑窗口的CBE系统hyBE4max、hyA3A-BE4max和hyeA3A-BE4max。

3)筛选高特异性Cas9蛋白和胞嘧啶脱氨酶变体,降低sgRNA依赖/非依赖性脱靶效应。Rees等[23]通过对Cas9核酸酶已知功能位点的突变,增强其DNA特异性,创建了脱靶效应降低的高保真型BE3系统(High-fidelity BE3,HF-BE3)。Lee等[24]在大肠埃希菌中建立了定向进化技术,筛选获得了对靶序列具有高特异性的Sniper-Cas9,降低了脱靶效应。Wang等[25]利用胞嘧啶脱氨酶的抑制序列结构域(Deoxycytidine deaminase inhibitor,dCDI)开发可抑制脱靶位点编辑的变形式碱基编辑系统tBEs,降低了识别基因组特定DNA序列定位的定位器产生的Cas9/sgRNA依赖性脱靶效应和对该特定基因组DNA序列进行编辑的效应器产生的Cas9/sgRNA非依赖性单链DNA脱靶效应。

4)改造或更换胞嘧啶脱氨酶,扩大或缩小编辑窗口。Kim等[26]构建了CBE新系统YE1-BE3、YE2-BE3、EE-BE3和YEE-BE3,将BE3的编辑窗口核苷酸从5个缩小至1~2个,证实了胞嘧啶脱氨酶结构域的突变会强烈影响编辑窗口大小。通过循环排列nCas9策略构建的CP-CBEmax将编辑窗口核苷酸从4~5个扩大到8~9个,并减少了副产物的生成[27]。Nishida等[28]利用七鳃鳗激活诱导胞苷脱氨酶(Activation-induced cytidine deaminase,AID)同源蛋白PmCDA1创建了新的CBE系统Target-AID,编辑窗口为PAM上游第18位碱基附近3~5个碱基(集中在第16~20位)。Ma等[29]则在单碱基编辑系统TAM(Targeted AID-mediated mutagenesis)中融合了人类AID变体hAIDx(Haid P182X),编辑活性窗口为PAM上游-16~-12位碱基。美国斯坦福大学Michael Bassik团队开发的CRISPR-X系统可以实现PAM下游+20~+40位窗口内平均突变效率为20.6%。

5)筛选识别不同PAM序列的Cas蛋白,拓宽CBE靶向序列范围。Kim等[26]构建了识别PAM序列为NNGRRT的SaBE3、识别NGA的SpVQRCas9、识别NGAG的SpEQR-Cas9、识别NGCG的SpVRER-Cas9和识别NNNRRT的SaKKH-Cas9,使CBE系统能编辑的靶序列范围扩增了2.5倍;该团队还创建了可以识别包括NG、GAA和GAT在内的多种PAM序列SpCas9变体(xCas9)[30]。Nishimasu等[31]创建了识别NG PAM位点的SpCas9-NG。Li等[32]构建了特异识别PAM序列TTTV(V为A/C/G)的dCpf1-BE,编辑窗口为PAM序列下游第8~13位(PAM位点计为1)。

1.1.3 在植物中开发的高效胞嘧啶碱基编辑器 CBE在动物细胞被成功开发后,在植物中也得到了广泛测试和改良。早期的BE3系统在植物中编辑效率(0~40%)较低[33-34];BE4在植物中的编辑效率(0~60%)得到一定的提升,但总体偏低且不稳定[35-36];BE4max使得CBE在植物中的编辑效率提高至0~80%[37]。Target-AID在植物中实现了编辑效率4%~90%的高效编辑,编辑窗口(C2~C12)也得到拓展[38-39]。BE3、BE4和BE4max中使用的是rAPOBEC1或pamCDA1脱氨酶,它们对靶点序列环境有较强的偏好性,不能实现稳定编辑,在植物的较多靶点中存在编辑效率为0的情况。

Zong等[40]将人源胞嘧啶脱氨酶hA3A替换成rAPOBEC1后,实现了不受靶点序列环境影响的高编辑效率(6%~80%)。Wang等[41]通过增加核定位信号拷贝数(F4NLS)提高了rAPOBEC1在植物中的编辑效率;该团队还建立了一种基于靶向差异sgRNAs的代理报告系统(Discriminated sgRNAs based SurroGate system,DisSUGs),编辑效率比常规编辑方法提高了3~5倍[42]。华南农业大学刘耀光团队根据水稻密码子偏好优化evorAPOCBEC1、evoFERNY、evoCDA1和hA3A的核酸序列,并将它们与Cas9n-NG(识别NGN-PAM靶点)变体融合,开发出一套植物高效广靶向胞嘧啶碱基编辑器PhieCBEs;与BE4对照相比,PhieCBEs的平均编辑效率提高了3~8倍,消除了碱基序列环境的偏好性,展现出稳定的编辑能力[43]。

1.2 腺嘌呤碱基编辑器(ABEs)

1.2.1 ABEs的建立 人类致病性的SNPs中需要被纠正的A·T至G·C类型占总数的48%,CBEs碱基编辑器虽然可以实现C·G至T·A的碱基编辑,但可替换的碱基类型非常有限,限制了碱基编辑器的应用范围。Gaudelli等[44]在2017年开发了可以实现A·T至G·C转换的ABEs,扩大了碱基编辑的范围;研究发现自然界中存在的腺嘌呤脱氨酶只在游离腺嘌呤、游离腺苷、RNA中的腺苷或错配的RNA-DNA异源双链中脱氨,不能以双链DNA或单链DNA作为底物对A碱基脱氨,因此不能将自然界中存在的腺嘌呤脱氨酶直接运用于碱基编辑系统中。由于大肠埃希菌RNA腺苷脱氨酶TadA不需要小分子激活且作用于多核苷酸,该团队以TadA作为改造对象进行人工驯化,通过易错PCR、DNA重排等策略对野生型TadA的氨基酸位点进行随机突变,经过7轮的改造成功开发出可以作用于单链DNA的ABE系统ABE1.2至ABE7.10;在哺乳动物细胞中,A·T至G·C的平均编辑效率由ABE1.2的3%提高至ABE7.10的58%[44]。ABE开发的过程实现了重大突破,对获得和利用特定功能酶有重要的借鉴意义。

1.2.2 ABEs的优化 由于自然界中缺乏可以直接作用于DNA的腺嘌呤脱氨酶,优化策略主要是在TadA7.10的基础上进行,如优化密码子、更换核定位信号、更换识别不同PAM的Cas核酸酶等。Koblan等[21]通过使用GenScript公司优化的密码子序列,将SV40 NLS换成bipartite NLS(bpNLS),并在TadA7.10的N端增加bpNLS,优化出编辑效率比ABE7.10进一步稳定提高的ABEmax。Huang等[27]将预测结构比SpCas9更接近R-loop ssDNA的4个SpCas9变体CP1012、CP1028、CP1041和CP1249分别融入ABEmax系统,扩大了ABE系统的编辑窗口;将识别不同PAM序列的SpCas9变体VRQR(PAM:NGA)、VRER(PAM:NGCG)、xCas9(PAM:NG)和Cas9NG(PAM:NG)融入ABEmax系统,拓展了ABEmax在基因组的可编辑范围。此外,利用不同菌株来源的Cas9蛋白,如SaCas9(PAM:NNGRRT)、SaCas9-KKH(PAM:NNNRRT)和ScCas9(PAM:NNGN)等 在ABE7.10或ABEmax的基础上试验,拓展了基因组的编辑范围[45-46]。

前期对ABE的改良主要是在ABE7.10的基础上进行,包括替换核定位信号、优化ABE7.10的密码子以及使用不同Cas9变体拓展PAM的靶向范围,这些均没有实质性提高TadA脱氨酶的活性。2020年,Richter等[47]通过噬菌体辅助连续进化系统(PACE)筛选到在ABE7.10的基础上增加8个新突变位点的突变体TadA8e,其脱氨活性及与Cas蛋白的兼容性均大幅提高;与ABE7.10相比,利用TadA8e构建的ABE8e(图1b)碱基编辑活性增加了590倍。Lapinaite等[48]对ABE8e的超高分辨率冷冻电镜结构分析结果显示,ABE8e催化DNA脱氨的速度比早期的ABE7.10和miniABEmax快约1100倍,超高的脱氨速度增强了ABE碱基编辑的有效性和适用性,扩大了ABE的应用范围。

1.2.3 在植物中开发的高效腺嘌呤碱基编辑器工具 在水稻、拟南芥、小麦、油菜等植物中,ABE系统也得到了广泛测试和改良。Li等[49]在ABE7.10的基础上通过优化脱氨酶密码子、调整脱氨酶和NLS的位置、使用不同的NLS个数等策略优化组合,最终获得植物腺嘌呤碱基编辑器PABE-7,其在小麦和水稻中的编辑效率比ABE7.10提高了1.1倍。中国科学院上海植物逆境生物学研究中心朱健康团队开发了ABE-P1(ABE7.10)、ABE-P1S(只含TadA*)、ABE-P2(ABE-SaCas9)、ABE-P3(VQRABE)、ABE-P4(VRER-ABE)、ABE-P5(SaKKHABE)、ABE-P6(xCas93.6)、ABE-P7(xCas93.7)、ABE-NG(Cas9-NG)、ABE-NG-S(只含单个TadA*7.10)、ABEmax-nCas9/nCas9-NG(ABEmax)等,在一定程度上提高了植物编辑效率、拓展了靶向范围[37,50-53]。Zeng等[35]在水稻中对Cas9n-ABE、xCas9n-ABE、Cas9n-NG-ABE和eCas9n-NGABE测试后发现,ABE7.10的编辑效率较低。在拟南芥中使用pRPS5 A启动子驱动ABE7.10可以实现有效编辑,而使用p35S和pYAO启动子的未发现有效编辑[54];ABE-xCas9、ABE-nCas9-NG也在拟南芥中实现了有效编辑,但效率均不高[55]。可见,植物中ABE系统ABE7.10的编辑活性并不高,这也证明了TadA*7.10的脱氨活性较低。

高效腺嘌呤碱基编辑器ABE8e在动物细胞中报道后,植物科研工作者对ABE8e也开展了广泛的研究。Tan等[56]根据水稻密码子偏好性优化TadA8e、单链DNA结合DBD的核苷酸序列,并将它们分别与2种识别NGN-PAM(PAM-less)的SpCas9n变体编码基因SpCas9n-NG和SpGn以及一种识别NNN-PAM(PAM-free)的SpCas9n变体编码基因SpRYn融合,开发了一套植物高效广靶向的腺嘌呤单碱基编辑器PhieABEs(hyABE8e-NG、hyABE8e-SpG和hyABE8e-SpRY),平均编辑效率分别为67.8%、73.9%和78.5%,比对照组ABE7.10(2.6%)提高了26~30倍。Yan等[57]将TadA8e、TadA9(TadA8e+V82S+Q154R)分别融合不同的Cas9变体(包括SpCas9n、SpCas9n-NG、SpRYn和ScCas9n),这些Cas9变体兼容性非常高,特别是TadA9整合SurroGate系统,多个测试靶位点的碱基编辑效率超过90%。与Cas9变体融合的TadA8e均表现出A·T至G·C的高编辑效率[58-60]。

1.3 糖基化酶碱基编辑器(GBEs)

CBE或ABE介导的碱基编辑器主要实现同类碱基间的转换编辑(嘌呤至嘌呤、嘧啶至嘧啶)。如何开发可实现碱基颠换编辑的新型碱基编辑器成了相关领域专家共同思考的问题。2020年7月,美国哈佛医学院Kurt等[61]和中国科学院天津工业生物技术研究所Zhao等[62]以背靠背的形式分别在《Nature Biotechnology》在线发表了能有效介导C-G及CA碱基颠换的新型单碱基编辑器GBEs,2项研究遵循了类似的研究思路,在CBE系统的基础上去除UGI,同时增加UDG以期获得更高的C-G颠换率,GBE的创建填补了碱基编辑器功能空缺。Kurt等[61]开发了2种碱基颠换编辑器CGBE1(图1c)和miniCGBE1,前者基于BE4max系统改造,由RNA引导的nCas9、rAPOBEC1(R33A)及大肠埃希菌来源的尿嘧啶DNA N-糖基化酶eUNG组成,其中,rAPOBEC1(R33A)有利于减少RNA脱靶、增强DNA编辑活性,后者在CGBE1的基础上去除了eUNG;这2种碱基编辑器都可以有效介导目标序列C-G碱基颠换,并减少非目的C-W(W为A/T)和indels产生;CGBE1在HEK293T细胞中的C-G颠换效率平均为14.4%,miniCGBE1则降低了indels产生的频率且伴随编辑效率(13%)小幅降低。Zhao等[62]则创建了能在大肠埃希菌中实现CA颠换的AID-nCas9-Ung(即GBE),该系统的平均编辑特异性是93.8%、编辑效率为24.1%;开发了能在哺乳动物细胞中实现C-G颠换的单碱基编辑器APOBEC-nCas 9-Ung,对靶序列第6位的C(PAM序列记为21~23)有较高的编辑特异性,CG颠换效率为5.3%~53.0%。新加坡科技研究局基因组研究所开发了nCas9融合脱氨酶及不同碱基切除修复蛋白的系列CGBE系统,其中,rAPOBECnCas9-rXRCC1的编辑效率(15.4%)最高,编辑产物纯度高达90%[63-64]。

Yuan等[65]通过改变UNG和脱氨酶的种类和相关位置,结合密码子优化,开发了OPTI-CGBEs。Koblan等[66]针对DNA修复基因的CRISPRi筛选,确定了影响C·G至G·C编辑结果的因素,开发了与机器学习模型配套的系列工程化CGBE,实现了更高效、特异的C·G至G·C颠换编辑,并通过靶点文库分析和机器学习创建了能够准确预测CGBE编辑结果的CGBE-Hive。Chen等[67]利用SpRY Cas9变体进一步拓宽了CGBE的基因组靶向范围。Sun等[63]对GBE系统进行了升级,将人类Ung换成了酿酒酵母源的Ung,融入Rad51蛋白的单链DNA结合结构域,并在APOBEC1中引入R33A突变,最终构建了GBE2.0,编辑效率达30.88%、C·G至G·C颠换编辑产物纯度为35.57%~92.92%。目前,GBE系统已经被应用到拟南芥、水稻、番茄、白杨等植物的碱基编辑中[68-71]。

1.4 双重碱基编辑器(DBEs)

2020年Li等[72]开发的双重碱基编辑器-饱和靶向内源基因突变碱基编辑器STEME(Saturated targeted endogenous mutagenesis editors),实现了植物基因的定向进化和功能筛选,揭开了双重碱基编辑器D B E研究的序幕。该团队在nCas9的N端同时融合了2种脱氨酶(胞嘧啶脱氨酶A P O B E C 3 A和腺嘌呤脱氨酶ecTad AecTadA7.10),并在nCas9的C端融合1个UGI拷贝或自由表达2个UGI拷贝,创建的STEME-1~STEME-4和Cas-NG版本的STEME-5可以在单个sgRNA的引导下诱导靶位点同时产生C·G至T·A和A·T至G·C的突变;STEME-1(图2a)在水稻原生质体中C·G至T·A编辑效率高达61.61%,而C·G至T·A和A·T至G·C同时突变的效率也高达15.50%;在20个sgRNA的引导下,STEMENG能对水稻乙酰辅酶A羧化酶OsACC编码的56个氨基酸产生接近饱和的突变,编辑效率达73.21%,并获得了抗除草剂的水稻材料[72]。随后,《Nature Biotechnology》发表了3款构建方案和功能类似的双碱基编辑器[73-75]。Zhang等[73]将胞嘧啶脱氨酶rAPOBEC1、腺嘌呤脱氨酶TadA与nCas9进行不同形式的组装融合,用具有更高诱导突变活性的hAID替换rAPOBEC1,并辅以密码子优化、NLS优化、UGI串联形式优化和linker序列优化等调整,获得了双碱基编辑器A&C-BEmax;与单碱基编辑器ABEmax和AID-BE4max相比,A&CBEmax对腺嘌呤的活性略有降低、编辑窗口一致,但对胞嘧啶的活性有所提高、编辑窗口从C3~C13扩大至C2~C17且RNA脱靶活性大幅降低。Sakata等[74]开发的Target-ACEmax选择CBE系统Target-AID作为双碱基编辑器融合基础,融合了ABE7.10。Grünewald等[75]开发的SPACE则融合了Target-AID和体量更小的miniABEmaxV82G。与同时表达2个单碱基编辑器相比,SPACE在目标位点具有更高效的双重编辑活性,Target-ACEmax的双重编辑效率与原有的单碱基编辑器编辑效率相当。

2021年,Xu等[76]开发了适用于植物的双碱基编辑器pDuBE1,利用日本七鳃鳗胞嘧啶脱氨酶同源物CDA1L-4构建了在C1~C12有较高编辑效率的C端胞嘧啶碱基编辑器CT-CBE,并在CTCBE的N端融合了TadA-8e,开发出pDuBE1,编辑效率可达87.6%,在稳定转化的植物细胞中C·G至T·A和A·T至G·C的同时转换频率高达49.7%。Xiong等[77]报道了包括多种双碱基编辑器CBE-ABE在内的植物碱基编辑工具箱,融合了AID10、nCas9和ABE8e,能够对靶序列4~8位的A或不同区域的C进行同时编辑,丰富了编码基因和非编码基因的功能研究工具。Liang等[78]将ABE与CGBE融合,开发出多功能双碱基编辑器AGBE,可以在单个sgRNA的引导下诱导同一靶位点发生A-G、C-G、C-T和C-A 4种碱基转换,大幅增加了编辑产物的多样性,有利于饱和突变文库的构建;通过全基因组和转录组测序分析,确认AGBE没有引起明显的DNA或RNA水平的脱靶效应,是高效、安全的碱基编辑工具。

1.5 引导基因编辑器(PEs)

单碱基编辑器始终有其特定的适用范围,普适性编辑靶序列是当前的技术热点。2019年Anzalone等[79]报道了一种通用的、能精确编辑基因组的引导编辑器PE1~PE3,可以在不产生DSB和不需要DNA供体的情况下,通过“搜索和替代”介导人类细胞中的小片段靶向插入、删除以及所有12种可能的碱基转/颠换。相比于CBE或ABE,PE1系统主要在sgRNA和Cas9蛋白2个方面进行了重点改造:1)在sgRNA的3′末端增加了一段RNA序列(该序列由与目标DNA链互补的引物结合位点PBS和携带编辑后模板信息的逆转录模板序列RTtemplate组成),改造后的sgRNA被命名为pegRNA;2)将切割非互补链的nCas9(H840A)与M-MLV逆转录酶融合。PE的工作原理是:pegRNA引导nCas9(H840A)在靶序列的非互补链上进行切割(即切割PAM识别链PAM上游3 nt处);随后,pegRNA的PBS序列与非互补链识别配对,M-MLV逆转录酶以携带编辑后模板信息的RT template为模板合成编辑后的新序列,新序列在切口附近形成动态平衡中的5′ flap和3′ flap结构;在修复过程中,不携带突变的5′ flap会被结构特异性内切酶优先切除,携带目的编辑序列的3′ flap得以保留,插入或删除后不能匹配的DNA双链会通过错配修复机制修复互补链,最终保留突变序列。PE1在293T细胞中的编辑效率并不高,点突变率0.7%~5.5%、indels突变率4%~17%。该团队优化了M-MLV逆转录酶部分氨基酸序位点创建了PE2(图2b),改善了热稳定性、DNA/RNA杂交紧密性、逆转录连续性,使PE1的indels编辑效率提升了2倍以上;在pegRNA下游增加了可介导互补链切割的sgRNA,获得了PE3,编辑效率(约55%)提升了1.5~4.2倍,并在PE3的基础上开发了降低indels突变率的PE3b版本[79]。这项研究受到了广泛关注,PE系统也被迅速应用到植物研究中。

图2 DBE、PE、线粒体碱基编辑器原理Fig. 2 Schematic diagrams of DBE, PE and mitochondrial base editors

2020年,Lin等[80]将PE2、PE3、PE3b进行密码子、启动子和编辑条件的优化,获得了适用于植物的引导编辑系统(Plant prime editor systems,PPEs)PPE2、PPE3和PPE3b,并成功在水稻和小麦原生质体中实现了靶位点的点突变、插入和缺失精准编辑,编辑效率0.2%~8.0%;与26 ℃相比,37 ℃高温培养原生质体可以显著提升PPE的编辑效率。随后,多个团队在水稻中开展了PE的应用试验[81-85]。Li等[81]精准编辑了水稻外源突变基因hptII和内源基因OsEPSPS,获得了精准编辑纯合和杂合植株,编辑效率分别为9.38%和2.22%。Xu等[82]在水稻细胞中实现了精准编辑,但编辑效率仅为0.05%~1.55%;测试了不同PBS长度、RT长度、编辑事件类型、nsgRNA等因素对PE编辑效率的影响。Tang等[83]在水稻稳定转化系中引入多个目标位点的精准编辑,但编辑效率不稳定。Hua等[84]改造的sp-PE2和sp-PE3均可以高效介导外源基因GFP失活位点的编辑,但对内源靶点效率很低。Butt等[85]成功在水稻愈伤组织中精准编辑了乙酰乳酸合成酶编码基因OsALS,创制了除草剂抗性的水稻材料,编辑效率为0.26%~2.00%;对株型调控基因OsIPA和OsTB1编辑后获得了相应表型。Lu等[86]在双子叶植物番茄中进行了PE编辑尝试,在再生嫩芽不同位点的编辑效率为0.0025%~1.6600%,后代稳定植株中编辑效率为3.4%~6.7%。以上研究针对PE编辑器的各个元件都进行了优化尝试,但始终未在编辑效率上获得大的突破,在植物系统中PE3、PPE3b的编辑效率并没有比PE2的高,说明在植物系统中互补链切口的引入不能提升编辑效率。Nelson等[87]发现pegRNA包含PBS和RT template的3′端,容易降解,影响了PE系统的编辑效率;在PE系统的pegRNA 3′端融合了结构化的RNA模块(epegRNA),在不增加脱靶效应的情况下,编辑效率提升了3~4倍。

为了突破PE系统在植物中的编辑效率限制,科研人员做了诸多尝试。Jiang等[88]增强了pegRNA的表达,在玉米中获得了更高的编辑效率,2个位点分别获得了53.2%和6.5%的精准点突变。Lin等[89]发现当PBS的熔解温度为30 ℃左右时,PE系统在水稻多数位点的编辑效率最高;与单个pegRNA相比,dual-pegRNA策略(设计2个pegRNA分别靶向靶序列的2条链)将编辑效率提升了3倍;上述2种方法叠加使PE效率提高至17.4倍。此外,建立了基于Tm值指导的PBS序列设计,开发了植物pegRNA设计网站PlantPegDesigner(http://www.plantgenomeediting.net),方便研究人员快速设计适合特定靶序列的高活性pegRNA。Jin等[90]通过全基因组重测序对PPE系统的脱靶效应进行了全面评估,确认了PPE系统在全基因组水平上具有高特异性。Xu等[91]在人类细胞、水稻愈伤组织和稳定系中测试发现,在反转录模板中引入同义错配碱基能提高该靶位点的编辑效率;将MMLV融合在nCas9(H840A)的N端(其他植物PEs沿用了M-MLV融合在nCas9 C端的方式)能有效提高编辑效率;引入同义错配碱基和N端融合时,构建的PE-P3-RT-M编辑效率具有倍增协同效应,在玉米和水稻上的编辑效率提高了3倍,在原低效靶点处的编辑效率提高了10倍以上。Zong等[92]针对PE系统的蛋白组分进行优化,建立了对植物更高效、适用性更广泛的ePPE(Engineered plant prime editor)系统,改进策略包括删除影响RNA/DNA结合稳定性的M-MLV RT的RNase H结构域、在M-MLV RT的N端融合M-MLV RT的辅助因子病毒核衣壳蛋白(Nucleocapsid,NC),使碱基替换、片段插入和删除的效率比PPE提高了5.8倍;ePPE系统与dual-pegRNA、epegRNA策略相结合可以提高编辑效率,利用ePPE系统获得了甲咪唑烟酸和烟嘧磺隆除草剂抗性水稻新材料。Li等[93]创制了能筛选PE编辑阳性植株的3个代理引导编辑器,即基于HygromycinY46*的代理引导基因编辑器(P E 3-H S)、基于OsALSS627I的代理引导基因编辑器(PE3-AS)以及基于HygromycinY46*和OsALSS627I的双代理引导基因编辑器(PE3-DS),精准编辑了水稻内源基因OsSPL14、OsDHDPS和OsNR2。Zou等[94]在PPE3的基础上优化pegRNA 3′末端,建立了编辑效率更高的PPE3-evopreQ1和PPE3-mpknot系统,并对水稻内源基因OsCDC48、OsALS、OsDEP1、OsEPSPS和OsROC5精准编辑。

早期的PE系统在小片段DNA精确插入或删除方面已有良好的表现,实现了最长44 bp的精准插入和80 bp的精准删除[79]。与CRISPR/Cas系统相比,PE系统对大片段的操控还不够成熟。2021年《Nature Biothechnology》发表了精确删除大片段DNA的方法PRDAR(PE-Cas9-based deletion and repair)[95]和PRIME-Del[96],这2种方法都用了类似的双pegRNA策略。PEDAR系统用功能齐全的Cas9替换了nCas9,双pegRNA在预切除DNA片段的两端产生DSB切口后,逆转录酶发挥功能,在两侧合成短的互补延伸序列,最终通过修复机制完成精准删除,在细胞系中实现了以最高60 bp序列精准替换1~10 kb的基因组片段,并在小鼠模型中去除Fah基因中1.38 kb的致病性插入并恢复了Fah在肝脏中的表达[95]。PRIME-Del则沿用nCas9设计了2个pegRNA,分别在预删除DNA片段上形成对侧缺口,实现10 kb以内任意片段大小的精准删除,并能在删除片段的同时引入短插入(最长30 bp)而不会显著影响效率或精度,编辑效率为1%~30%,显著高于CRISPR/Cas9系统;PRIME-Del的删除和插入效率较高且错误率低,还能同时实现多重删除[96]。Anzalone等[97]开发的双引导编辑系统TwinPE(Twin prime editing)融合能切除、倒位和整合DNA大片段序列的位点特异性重组酶,实现人类基因组大片段的删除、替换和倒位;5.6 kb片段的插入编辑效率为1.4%~6.8%,40 kb片段的倒位效率约9%。Wang等[98]开发的GRAND中,2个pegRNA的逆转录模板区与目标位点不同源但相互互补,可通过逆转录过程高效靶向插入20~1000 bp的DNA片段,150 bp片段插入的编辑效率高达60%,250 bp片段的插入效率达30%。Tao等[99]证明了将nick sgRNA定位在pegRNA的模板序列附近有助于针对性地删除大片段,将2个sgRNA都改造为pegRNA以实现双向prime编辑(Bi-PE),编辑效率提高了16倍、编辑产物的准确性提高了60倍。这些新技术比CRISPR/Cas系统更适用于精准、灵活的基因大片段刪除和整合。

1.6 线粒体DNA编辑器

线粒体作为真核生物最重要的细胞器之一,既是细胞的能量代谢中心,也是细胞内离子稳态调节、氧化还原稳态调节、细胞凋亡调控等重要生理过程的信号枢纽[100]。线粒体携带环形的具有半自主复制能力的线粒体DNA(Mitochondrial DNA,mtDNA),mtDNA突变或线粒体功能异常被认为与上百种人类疾病相关,如阿尔茨海默病和帕金森氏病等神经退行性疾病、心血管氧化应激损伤等[101]。如何将sgRNA转运至线粒体一直是CRISPR/Cas系统应用于线粒体碱基编辑器开发的瓶颈问题,目前尚无较好的解决方案。早期线粒体编辑器依赖于无RNA介导的核酸酶ZFNs[102]和TALENs[103-105]与线粒体靶向信号的融合,从而诱导mtDNA双链断裂,线性化的mtDNA被迅速降解。这些方法不能在mtDNA中引入特定的核苷酸突变,当应用在同质mtDNA时,会因为破坏所有mtDNA拷贝而损害生物体;当应用在异质mtDNA中时,野生型mtDNA被降解,突变型mtDNA形成比例优势产生表型漂变,可用于线粒体基因功能研究或疾病治疗研究[106-107]。伯克氏菌编码的脱氨酶DddA是一种由细胞间蛋白传递系统T6SS介导运输的细菌毒素,DddA的毒性结构域DddAtox与APOBEC酶结构接近,能催化双链DNA序列的胞嘧啶突变为尿嘧啶。Mok等[107]将DddAtox与TALE、MTS融合,开发了不依赖sgRNA的新型线粒体编辑器DdCBE(图2c),能催化mtDNA中目的序列G·C至A·T的精准编辑,在HEK293T细胞中的编辑效率为4.6%~49.0%;为避免DddAtox的毒性,将其分为2个DddAtox半体(DddAtox-N和DddAtox-C),分别导入线粒体后在靶标位点重组为活性脱氨酶;DdCBE对底物序列有严格的偏好性,主要编辑TC转换至T-T。针对这一缺陷,该团队利用噬菌体辅助连续进化(PACE)和噬菌体辅助非连续进化(PANCE)技术对DdCBE进行了升级,创建了编辑更高效、靶向更广泛的线粒体编辑器新版本DddA6和DddA11,将MTS置换成NLS后,也可以作为核DNA的碱基编辑器,大大提高了DdCBE的有效性和适用性[108]。Cho等[109]融合MTS、TALE、腺嘌呤脱氨酶TadA8e和DddAtox,构建了线粒体嘌呤编辑器转录激活因子效应物相关脱氢酶(Transcription activator-like effector-linked deaminase, TALED),DddAtox帮助TadA8e接近mtDNA,使其更容易实现对线粒体基因组的A-G碱基转换编辑;TALED在人类细胞中编辑能力高效稳定、无细胞毒性、极少线粒体或基因组脱靶效应,该技术突破了线粒体基因组A-G的碱基转换技术难关;通过调整TALED的组成部分,开发出可同时实现C-T和A-G碱基转换的工具。

Kang等[110]基于DdCBE系统组装了针对线粒体和叶绿体基因的碱基编辑系统,在生菜或油菜籽愈伤组织的线粒体中碱基编辑效率高达25%、在叶绿体中高达38%。Li等[111]改造了DdCBEs系统并将其应用至叶绿体基因编辑,使用水稻黄单胞菌中的TALE融合叶绿体信号肽CTP、UGI以及2个DddAtox半体,对光系统I中叶绿素a的保守叶绿体基因psaA进行碱基编辑,编辑效率达64%。

2 碱基编辑器在作物遗传改良中的应用

基因编辑技术发展至今,已被广泛应用于植物基因功能研究及作物遗传改良,其中大部分是基于NHEJ修复途径引起的基因敲除。然而,在实际生产应用中,控制作物性状的等位基因间往往仅存在一个或多个碱基的变异,此时便无法通过基因敲除达到创建优良等位基因的目的。碱基编辑器则能在不破坏基因功能的基础上,通过改变编码区或表达调控区的单个碱基实现等位基因间的精准替换和基因表达的精细调节,扩大了基因编辑技术在作物遗传改良中的应用范围。如在已发现的调控水稻关键农艺性状的基因变异位点当中,超过一半为单核苷酸多态性(Single nucleotide polymorphism,SNP)位点,这些位点的58%为C-T/A-G的碱基转换,可由CBE/ABE编辑器实现精准编辑[112]。GBE、PE等编辑系统理论上能与CBE/ABE编辑器互为补充,实现对所有单碱基的任意转换/颠换编辑。此外,碱基编辑器还能在编码序列人为创建终止密码子,实现基因敲除的效果。

目前,利用碱基编辑器改良作物性状的研究主要集中于水稻,并逐渐拓展到小麦、玉米、油菜、番茄、土豆、西瓜等作物[113-114]。通过改造已知的功能基因有效提高了作物的产量和抗逆性、改良了作物品质。例如,通过编辑氮转运相关基因NRT1.1B提高氮利用效率,实现了作物增产[34,49,115];通过编辑株型控制基因SPL14[50,84,115-116]、穗型控制基因DEP1[36,49]和粒型控制基因GRF3/4[117]等增加单株穗粒数和千粒质量;对在不同物种中保守存在的基因ALS进行编辑能够提高多个作物对除草剂的抗性[39-40,49,82,84,118-124];编辑抗性基因Pi-d2增强了水稻的稻瘟病抗性[118];对水稻SLR1进行改造则能降低株高[34,84],从而提高作物抗倒伏能力。在作物品质改良方面的工作目前主要围绕谷粒食味优化和营养强化展开,如通过编辑基因Waxy调节稻米直链淀粉含量[35,117,125],编辑番茄红素脱氢酶基因PDS丰富大米营养成分[32,126]。

3 存在的问题与展望

3.1 新型DNA碱基编辑器的脱靶效应及解决策略

单碱基编辑器作为研究由单碱基变异引起的遗传性状的重要工具,其靶向特异性或脱靶效应受到广泛关注。宗媛等[127]将碱基系统的脱靶分为传统的可预测脱靶、全基因组范围内不可预测脱靶和转录水平脱靶。研究表明,单碱基编辑器会导致大量无法预测的脱靶突变[128-129]。Jin等[128]发现BE3和HF-BE3会诱导水稻的全基因组产生不依赖于sgRNA的C-T转换突变,这些突变主要富集在转录的基因区域且无法预测;ABE脱靶效应则不明显,表明脱靶效应可能与胞苷脱氨酶或UGI等组分有关。Zuo等[129]建立了新型脱靶检测技术GOTI(Genome-wide off-target analysis by two-cellembryo injection),并对小鼠受精卵转化系进行全基因组测序分析,确认了BE3存在严重的脱靶效应且部分靶点出现在抑癌基因上,带来了临床安全隐患。Grünewald等[130]发现,单碱基编辑器在编辑DNA后还会造成大量的RNA突变。Zhou等[131]的研究也证实了相关结论,他们以人类细胞系为模型发现,BE3、ABE7.1都显著提升了mRNA的突变率。Li等[132]的研究表明,用高效腺嘌呤脱氨酶TadA8和TadA9组装的ABE系统同样也会引起DNA和RNA的随机脱靶突变。这些研究为单碱基编辑器的开发和应用带来更多的思考,开发的版本主要采用蛋白质生物工程技术筛选保留胞嘧啶脱氨酶的催化活性、降低DNA和RNA脱靶效应[133-135]。2022年赖良学团队将脱氨酶与Cas9蛋白的引导系统分离,创制了脱氨酶与转录激活因子类效应子(TALE)融合、Cas9蛋白与sgRNA融合的新型碱基编辑系统TaC9-ABE/CBE,可以完全消除Cas9依赖性脱靶而不影响靶向编辑效率[136-137]。Jin等[135,138]开发了基于水稻原生质体和突变体植株的高通量碱基编辑器特异性评价方法;Kim等[139]开发了鉴别人类细胞中碱基编辑脱靶位点的改良版Digenome-seq。相比于动物基因功能研究或人类疾病治疗研究,碱基编辑的脱靶效应对植物应用研究的影响小一些,这是因为:1)脱靶是否引起了突变表型可以通过后代的分离分析来确认,很大程度上可以锁定研究基因与突变表型的关系;2)脱靶效应若带来了负向影响,在育种过程中将被自然或人为淘汰,若带来正向影响,也能帮助基础研究或推进育种[140-141]。

Wei等[142]通过GOTI分析发现,线粒体编辑器DdCBE在小鼠胚胎的核基因组上产生了大量的单核苷酸变异脱靶位点,原因是线粒体定位信号不能完全正确靶向线粒体,对细胞核也有一定的靶向效应。Lei等[143]的研究成果也证实了这一结论,该团队在人类HEK29T细胞系中评估发现,部分核基因组脱靶效应依赖于单侧TALE序列,部分则不依赖于TALE序列但与维持细胞三维结构的CTCF结合基序存在某种关联;利用融入核输出信号、抑制核内DdCBE编辑活性等优化策略改造了DdCBE,降低了核基因组的脱靶水平。

3.2 结论与展望

碱基编辑技术能实现基因修正或变异,在生物学基础研究、疾病研究和作物遗传改良应用上前景广阔,因而核酸编辑器的研究持续火爆,越来越多功能明确的优化版本被开发、应用到全新的科学领域。PE系统在植物或人类细胞系中的脱靶编辑效应都非常低,几乎不引起pegRNA非依赖型的全基因组范围内脱靶,而pegRNA依赖型的脱靶效应可通过优化引物设计避免[90,92,98,144]。PE系统与其他编辑系统相比,适用范围更广、脱靶效应更低。因此,开发具有更高编辑效率、更强编辑能力(长序列编辑)的PE系统,有望进一步挖掘基因编辑工具在基因治疗、功能研究上的潜能,建立更安全高效、功能强大的编辑工具。

新型碱基编辑器的开发充满着机遇与挑战,如何进一步提升碱基编辑器的编辑效率、产物纯度、特异性,平衡编辑范围与编辑窗口大小,开发更安全高效、适用性更广泛的编辑工具,是该领域亟待解决的技术问题。目前,CBE和ABE的开发还不够完善,编辑效率和范围还未达到理想的程度。除了PE编辑器,所有其他种类的单碱基编辑器都受靶点位置、编辑窗口、碱基转换关系等因素的影响,难以实现任意位点、任意设计碱基的精准(无副产物碱基)编辑。因此,开发高效率长序列编辑的PE编辑器和高效的同源重组基因编辑技术,将是今后继续努力的主要目标,为进一步推动人类疾病治疗、作物遗传改良以及基础科学研究的发展做出积极贡献。

猜你喜欢

编辑器碱基位点
镍基单晶高温合金多组元置换的第一性原理研究
CLOCK基因rs4580704多态性位点与2型糖尿病和睡眠质量的相关性
基于网络公开测序数据的K326烟草线粒体基因组RNA编辑位点的鉴定与分析
司空见惯感觉烦 锁屏画面快走开
应用思维进阶构建模型 例谈培养学生创造性思维
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员
你距离微信创作达人还有多远?
一种改进的多聚腺苷酸化位点提取方法