APP下载

基因编辑技术:进展与挑战

2018-11-22卢俊南潘燕平陈映羲戴俊彪

中国科学院院刊 2018年11期
关键词:核酸酶碱基课题组

卢俊南 褚 鑫 潘燕平 陈映羲 温 栾 戴俊彪*

1 中国科学院深圳先进技术研究院 合成生物学研究所 合成基因组学研究中心 深圳市合成基因组学重点实验室深圳 518055

2 中国科学院 重大科技任务局 北京 100864

3 中国科学院深圳先进技术研究院 合成生物学研究所 定量合成生物学研究中心 深圳 518055

生命科学的迅速发展使得我们从生物遗传信息的“读取”阶段进入到后基因组时代,基因组的“改写”乃至“全新设计”正逐渐成为现实。以设计创造新生命体为目标的合成生物学在此背景下迅速发展,并在医药、制造、能源等领域显现了巨大的应用前景。基因组的从头合成和针对天然基因组的规模改造分属合成基因组学和基因编辑领域,均为当前合成生物学研究的热点。合成基因组学涉及基因组的从头设计、构建和功能表征等,属于自下而上的生物学研究策略;而基因编辑侧重于通过对现有基因组进行删除、替换、插入等分子操作,进而改写遗传信息,属于自上而下的生物学研究策略。以上两者的有机结合将极大地推动生物制造、疾病治疗等领域的革新;同时二者也将为后基因组时代,功能基因组学的研究提供强有力的技术手段。新生命体系的从头设计与合成不仅需要基因组序列的合成、拼接及转移等技术,也需要高效率、低脱靶率的编辑技术以实现在基因组上进行大规模的编辑改造。在不断的探索研究中,基因编辑技术已经从最初依赖细胞自然发生的同源重组,发展到几乎可在任意位点进行的靶向切割,其操作的简易和高效极大地推动了物种遗传改造的发展。基因编辑可为合成生命的进一步改造提供手段,为新物种的创造提供更多的可能性。

1 基因编辑的原理

基因编辑技术是对生物体 DNA 断裂的现象及其修复机制的应用。作为一种常见的分子生物学事件,在分裂活跃的哺乳动物细胞中,DNA 双链断裂(DNA doublestrand breaks,DSBs)每天会发生[1-4]。DSBs 发生后细胞可以通过多种方式进行修复,包括经典的非同源末端修复(non-homologous end joining,NHEJ),选择性末端修复(alternative end joining,a-EJ),单链退火修复(single-strand annealing,SSA)和同源重组修复(homologous recombination,HR)[4]。HR 可以进行精确无误的修复,但是需要同源模板的存在[5-7];NHEJ 则是将很大程度上没有同源性的两个 DNA 末端直接连接实现修复[7],此过程中,两个末端在大多数情况下都会发生若干核苷酸的缺失,是一种不精确的修复机制[8]。而作为辅助性的修复机制,a-EJ 和 SSA 均需要更大幅度的末端单链切除[4],这也会导致遗传信息的丢失。基于 DNA 断裂修复的原理,如果在细胞中人为提供特定的同源重组模板,待目标 DNA 自然发生或者人为诱导产生 DSBs,触发同源重组修复,就有机会把特定 DNA 序列进行删除或者插入外源基因。在不提供同源模板的情况下,利用 NHEJ、a-EJ 及 SSA 的不精确修复机制可以实现基因的突变和敲除。传统的基因编辑借助细胞内自然发生的 DSBs 实现靶向整合[9],达到基因敲除、替换等目的。然而,在真核生物细胞里面,通过自发双链断裂实现目的基因编辑的概率通常低至百万分之一[10,11]。人为使用化学诱导剂或者辐射处理等方法,或者使用转座子技术也可以实现基因的突变,但是这些突变是随机的,需要后续进行大量的筛选工作来获得所需的基因型。定点基因编辑技术是进行基因功能研究和物种定向改造的优选策略。

2 重组核酸酶介导的基因编辑技术

2.1 锌指核酸酶技术

人工核酸酶技术的发展使人为定点诱导DSBs成为现实,其中锌指核酸酶技术(zinc finger nucleases,ZFNs)就是一个里程碑式的突破,也称为第一代基因编辑技术。ZFN 由锌指蛋白(zinc finger protein,ZFP)和 FokI 内切酶的核酸酶结构域组成,前者负责识别,后者负责切割 DNA。ZFP 是自然存在的蛋白结构,其由锌指结构(zinc finger,ZF)组成,ZF 能识别特定的 3 个连续碱基对[11](图 1a),因此可通过串联 ZF 的数量调整 ZFN 的识别特异性。FokI 通过 N 端与 ZFP 连接,由于 FokI 以二聚体的形式发挥切割作用,ZFN 使用时需要成对设计[12]。作为新型基因编辑工具,ZFN 从 2001 年开始被陆续用于不同物种的基因编辑[11,13]。

2.2 TALENs 技术

ZFN 技术将基因编辑引领进了不再单纯依赖自然发生 DSBs 的时代,但其存在很大的局限性,如成本高、难以实现多靶点编辑等[11]。而 TALE(transcription activator like effector)基序的发现催生了第二代基因编辑技术——TALENs(TALE nucleases)。TALEN 的构造与 ZFN 类似,由 TALE 基序串联成决定靶向性的 DNA 识别模块,与 FokI 结构域连接而成。与 ZF 基序不同,一个 TALE 基序识别一个碱基对(图 1b),因此串联的 TALE 基序与所识别的碱基对是一一对应的关系[11]。研究发现,对于相同的靶点 TALENs 有与 ZFNs 相同的切割效率,但是毒性通常比 ZFNs 的低,另外其构建也比 ZFNs 容易[11]。然而,TALENs 在尺寸上要比 ZFNs 大得多,而且有更多的重复序列,其编码基因在大肠杆菌中组装更加困难[11]。

图1 ZFN、TALEN 及 CRISPR/Cas9 基因编辑技术

3 RNA引导的基因编辑技术

3.1 CRISPR/Cas9 技术

CRISPR/Cas 系统原本是细菌和古菌进化出来用于抵御外来病毒及质粒 DNA 的适应性免疫系统。II 型CRISPR/Cas 系统依赖于外源 DNA 片段在规律成簇的短间隔回文重复(clustered regularly interspaced short palindromic repeat,CRISPR)位点整合,其经过转录及剪切后产生短的 CRISPR RNAs(crRNAs),crRNA 与反式转录的 crRNA(trans-activating crRNA,tracrRNA)退火结合,然后引导 Cas9(CRISPR associated protein 9,Cas9)蛋白介导序列特异性的外源 DNA 降解[11,14-16]。Jinek 等[17]发现 Cas9 发挥靶向切割作用所依赖的 crRNA 和 tracrRNA 可以融合为一体,作为 sgRNA(single guide RNA)(图 1c)。随后,若干研究组陆续报道 CRISPR/Cas9 系统可用于人类细胞的靶向基因编辑[18-21]。与 ZFNs 和 TALENs 技术相比,CRISPR/Cas9 的设计要简单得多,而且成本很低,对于相同的靶点,CRISPR/Cas9 有相当甚至更好的靶向效率[11]。

3.2 CRISPR/Cas9 衍生技术

随着 CRISPR/Cas 系统的研究不断深入,Cas9 核酸酶的催化机制也被揭示[17],并且可以通过特定位点氨基酸的突变获得单链靶向剪切功能的 Cas9 切刻酶(Cas9 nickase,Cas9n)或者全失活的 Cas9(dead Cas9,dCas9),而这些不同的 Cas9 核酸酶,衍生出了适用范围更为广泛的基因编辑系统。

(1)CRISPR/Cas9-nickase 基因编辑技术。CRISPR/Cas9 系统使用的 crRNA 能容受一定程度的错配导致脱靶效应的产生,限制了 CRISPR/Cas9 系统在高精度编辑中的应用[22]。为了提高 Cas9 编辑系统的精度,Ran 等[22]巧妙利用 Cas9 D10A 突变体具备切刻酶活性的特性,设计了“一个位点,双 sgRNA 靶向”的策略,即 CRISPR/Cas9-nickase 基因编辑技术(图 2a)。其原理与 ZFN 和 TALEN 类似,两个 Cas9n/sgRNA 复合物同时靶向一个位点,分别切割其中一条 DNA 链,实现双链断裂,诱导 NHEJ 或者 HR 修复。使用这种策略,细胞系中基因编辑的脱靶效率最高可以降低近 4 个数量级。

(2)CRISPR/dCas9-FoKI基因编辑技术。同样是为了解决 CRISPR/Cas9 技术的脱靶问题,Guilinger 等[23]采用了基于 dCas9 的策略。理论上 dCas9/sgRNA 只能起到单纯的靶向引导作用,无法诱导 DNA 的断裂,类似于 ZFN 或者 TALEN 中的 DNA 结合结构域。为了实现 DNA 的切割,其引入的 FoKI 核酸内切酶的切割结构域(图 2b),与 dCas9 连接做成融合蛋白 fCas9,这与 ZFN 及 TALEN 的设计策略如出一辙。在人类细胞的基因编辑中,fCas9 的特异性比野生型 Cas9 要高出 140 倍以上。而在高度类似的脱靶位点上,fCas9 的特异性要比 Cas9n 至少高出 4 倍。fCas9 的应用将进一步丰富 Cas9 工具箱,提供更完善的基因编辑工具。

(3)基于 CRISPR/dCas9 的单碱基编辑技术。人类大多数的遗传病与基因的点突变有关[24],如果能通过精确的手段进行修复,可能会带来新的治疗策略。在提供同源重组模板的情况下,定点突变可以通过 CRISPR/Cas9 来实现,但是其诱导的 NHEJ 修复可能带来的碱基随机插入、缺失是潜在的危险因素。Cas9 的突变体 Cas9n、dCas9 无切割双链 DNA 的功能,但可以发挥寻靶定位作用;如果有能催化特定碱基转换的蛋白/结构域可用,则可参考 CRISPR/dCas9-FoKI 蛋的设计,构建 CRISPR/Cas9n/dCas9 导向的单碱基编辑技术。Liu 课题组将源自大鼠的胞嘧啶脱氨酶(APOBEC1)与 dCas9 融合(图 2c),发现其可以定点将 C 转变为 U,然后在后续的 DNA 复制或者修复作用下实现 C : G 碱基对到 T : A 的转变[24]。随后日本神户大学的 Kondo 课题组[25]及我国上海交通大学的常兴课题组[26]也报道了类似研究成果。为了实现 A : T 到 G : C 的转换,Liu 课题组采用蛋白质进化工程手段对大肠杆菌的 tRNA 腺苷脱氨酶(TadA)进行改造,他们获得的第 7 代腺嘌呤碱基编辑器(adenine base editors,ABEs)能高效介导 A : T 碱基对到 G : C 的转变[27]。即,C 到 T 以及 G 到 A 碱基之间的自由转换已经实现,将来有可能做到 4 种碱基的任意转换。

(4)基于 CRISPR/dCas9 的基因表达调控技术。除了直接对 DNA 进行编辑,CRISPR/Cas 系统在基因表达调控上也可发挥作用[28,29]。例如,利用 dCas9 无核酸内切酶活性但仍能与 DNA 结合的特点,可直接阻碍其结合 DNA 与其他因子的结合,影响基因的表达(图 2d)。如果将转录抑制因子或者激活因子与 dCas9 融合,则可以实现靶基因的抑制与激活,为基因功能研究提供灵活的操作手段。

3.3 CRISPR/Cas12a 基因编辑技术

图2 系列CRISPR/Cas9衍生基因编辑技术

CRISPR/Cas9 技术受富含 G 碱基的 PAM 序列限制,不能实现任意序列的靶向。同时 Cas9 蛋白分子量过大,某些情况下不便使用。实际上几乎所有的古细菌和众多的细菌都采用 CRISPR/Cas 机制进行免疫防御[30],其中包含多种 CRISPR/Cas 系统。已经表征过的Ⅱ类 CRISPR/Cas 系统,均属于采用 Cas9 家族核酸酶作为效应因子的Ⅱ型 CRISPR/Cas 系统,而在普氏菌和弗朗西斯氏菌属(Prevotella 和 Francisella 1)中存在另一个Ⅱ类 CRISPR/Cas 系统,其被归为Ⅴ型 CRISPR/Cas 系统[30]。2015 年,张锋团队报道 V 型系统中的 Cpf1(CRISPR from Prevotella and Francisella 1)(现称“Cas12a”)是有功能的细菌免疫机制并能在人类细胞中介导有效的基因编辑[30]。CRISPR/Cas12a 具有 CRISPR/Cas9 没有的优点[30],其中之一就是 Cas12a 需要的是富含 T 碱基的 PAM 序列,有助于其在基因组富含 A/T 碱基的物种中使用。上海科技大学的陈佳课题组将无 DNA 切割活性的 dCas12a 与大鼠源的胞嘧啶脱氨酶(APOBEC1)融合,发现其与基于 Cas9 的碱基编辑器类似,能有效地催化人类细胞中 C 到 T 碱基的转换[31]。由于识别的是富含 T 碱基的 PAM 序列,基于 Cas12a 的碱基编辑系统能与基于 Cas9 的碱基编辑系统互补,为相关基础研究及将来的临床应用提供更全面的技术条件。

3.4 基于 CRISPR/Cas 系统的RNA编辑技术

除了对 DNA 进行编辑,张锋课题组发现 CRISPR 蛋白家族的 C2c2(现称 Cas13a)可以靶向切割 RNA[32],随后他们证实 Cas13a 可在哺乳动物细胞中靶向降低 RNA 的水平[33]。利用 Cas13a 的 RNA 靶向功能,CRISPR/Cas13a系统被开发为 RNA 检测器用于疾病诊断[34]。张锋团队后续又发现了 Cas13b[35],其同样具有 RNA 靶向和编辑功能。另外,Cas13c 和 Cas13d 也具有类似功能[36]。RNA 编辑技术的建立,进一步拓展了 CRISPR/Cas 基因编辑技术的应用范围。

4 DNA介导的基因编辑工具

根据碱基互补配对原则,及引物设计原理,Oligo DNA 理论上也可以用于引导核酸内切酶靶向切割双链 DNA。类似于 ZFN 和 TALEN,可用 Oligo DNA 替代其 DNA 结合结构域,关键是需要找到 Oligo DNA 与切割结构域 FoKI 的合适连接方式。或者是寻找类似于 Cas9 的天然蛋白,本身具备核酸内切酶功能,同时能结合一定长度的引导 Oligo DNA。由于 DNA 本身有更好的稳定性,Oligo DNA 制备成本低,可以简化基因编辑的操作程序,Oligo DNA 引导的基因编辑工具有其他编辑工具不可比拟的优点,值得深入研究开发。特别是当前主流基因编辑工具全为国外专利,对今后国内基因编辑相关产品的上市不利,具备自主知识产权的基因编辑技术亟待开发。

2016 年 9 月,Genome Biology 刊登了我国南京大学研究团队研发的新型基因编辑工具:结构引导的核酸内切酶(structure-guided endonuclease,SGN)[37]。SGN 是典型的 Oligo DNA 引导基因编辑工具,本质上也是重组核酸酶的设计与应用。其 N 端是能识别 DNA 3′ 末端翘翼(3′ flap)的核酸内切酶(flap endonuclease-1,FEN-1),C 端则是 FoKI 核酸内切酶的 DNA 切割结构域(Fn1)。SGN 通过识别引导 DNA(guide DNA,gDNA)与特点靶点结合产生的 3′ flap 进行定位切割。不同于 CRISPR/Cas9 及其系列衍生技术,SGN 没有 PAM 限制,理论上可以靶向任何序列。实验结果显示 SGN 的切割活性不依赖于靶点的序列,其可用于斑马鱼基因编辑但是效率尚有很大的提升空间。SGN 作为我国科学家的原创性研究结果,其优点无疑显著,如:gDNA 非常容易获得并且可根据需要精确控制其用量;可以通过调整 gDNA 的长度将错配的可能降到最低等。

5 我国基因编辑技术发展面临的挑战与机遇

近年来,我国在基因编辑技术方面取得了瞩目的进展。但是我们要清醒地认识到,目前基因编辑,尤其是 CRISPR/Cas9 相关的核心专利基本都是掌握在其他国家手中。未来基因编辑技术及基因编辑的细胞制品等走向临床应用,以及基因编辑农作物走向市场所产生的巨大利润都会因此而受到重大损失。开发具备自主知识产权的核心技术才有可能在这场生物技术革命中获得发展,包括对现有基因编辑技术的缺陷进行修正,以及通过技术组合等,抢先获得现有基因编辑技术的改进版本和增强版。同时也借助生物信息学手段挖掘潜在的 CRISPR 核酸酶和 DNA 引导的核酸酶等,开发新型基因编辑技术。此外,基因编辑技术,尤其是 CRISPR/Cas 技术已经广泛用于各物种的基因编辑,除了常见的模式生物,如线虫、果蝇、斑马鱼、小鼠等,还有猪、狗、猴等大型动物,以及水稻、小麦等常见农作物。将现有基因编辑技术拓展到其他生物也是新的突破,尤其对于我国特有的生物资源,其过程往往涉及技术的调整和改进,一方面可以产生新的技术,另一方面可为目标生物的功能基因组研究以及遗传改良提供有效手段。

目前,CRISPR/Cas9 等基因编辑技术已经显示巨大的应用价值,但是其在编辑效率、精确度及脱靶效应等方面,以及其走向临床应用等尚有很多问题需要解决。病毒载体可应用于人类基因治疗,但是其装载容量有限,常规的 Cas9 蛋白过大,不利于使用。一方面可以从自然界寻找更小的 Cas9 蛋白,另一方面可以通过基因工程手段进行适当的删减。而在减少脱靶效应方面,除了上述提到的 CRISPR/Cas9-nickase 和 CRISPR/dCas9-FoKI基因编辑技术,还可以对 Cas9 蛋白本身进行定点突变等来增强其特异性。这些工作充满着挑战性,但也是我们发展的机遇和突破口。

近年来,我国科学家在基因编辑领域取得了长足进展。上述提及常兴课题组和陈佳课题组在碱基编辑技术上的突破,此外,哈尔滨工业大学黄志伟课题组和中国科学院生物物理研究所王艳丽课题组在 Cas/sgRNA 复合物的结构解释上也作出了突出贡献,可为基因编辑原理的理解提供重要参考。中国科学院遗传与发育生物学研究所高彩霞课题组等则在植物基因编辑上取得重要进展。中国科学院广州生物医药与健康研究院赖良学课题组、昆明理工大学季维智课题组、中国科学院神经科学研究所杨辉课题组等,利用基因编辑技术成功获得多种疾病动物模型。我国在新型基因编辑技术开发上也取得了一定突破,DNA 引导的基因编辑技术有着独特的优势,值得加大投入以解决编辑效率低等问题。

此外,合成生物学作为新近迅速发展的交叉学科,已在生物医药、能源、新材料等领域展现越来越广泛的应用潜力。基因组合成和基因编辑,涉及的操作广度、深度不同,技术体系也不同。但其本质上都是通过遗传改造,获得具有特定功能的生命体,服务科研与生产,二者有机融合是水到渠成的趋势。比如,在合成的基因组中可以引入基因编辑体系,为新生物体进一步改造及应用提供更多的可能性。SCRaMbLE(synthetic chromosome rearrangement and modification by loxP-mediated evolution)[38]是一种快速的染色体重排修饰技术,可以加速生物体的进化,其本质上是一种非定点的诱导型基因编辑技术。生物的进化往往需要漫长的历史过程,难以快速获得具备某类性状的物种。合成生物学可以通过基因组设计,引入特定的功能模块,以获得目标工程细胞;然而,基于目前的成本和技术限制,尽管可以有很多候选基因组设计,想要获得一个大容量合成细胞库并从中筛选获得最优设计的可能性不大。而 SCRaMbLE 是一种潜在的高性价比手段。Sc2.0 计划拟在合成的酵母基因组中插入约 5 000 个 loxPysm 位点[39]。该计划近期发表的系列成果[40-46]表明,SCRaMbLE 系统可以诱导获得增强型工业用酵母菌株,提目标代谢物的产量等。

当前,首个全人工合成的真核生物——Sc2.0 已经接近完成,更高等生物的全基因组合成也已经提上日程[47]。然而,超大基因组的合成尚有很多挑战。通过基因编辑对现有物种进行局部基因组改造实际为传统基因工程的升级,其不大可能实现全面的基因组改写。就目前而言,基因组合成与基因组编辑的结合将是一个十分具有潜力的研究方向,可解决目前超大基因组从头合成面临的各项困难,为合成基因组学在超大基因组物种基础研究及物种改造中的应用提供可能。这也是我国在合成生物学领域及基因编辑领域可以把握的契机。

猜你喜欢

核酸酶碱基课题组
天津大学环境科学与工程学院iSoil课题组
中国地质大学(北京)土地利用与生态修复课题组
应用思维进阶构建模型 例谈培养学生创造性思维
含季铵盐的芳酰腙配体的铜 (Ⅱ)配合物的合成和表征:体外DNA键合和核酸酶活性
原科技大学新能源开发与应用课题组介绍
金黄色葡萄球菌胞外分泌蛋白的核酸酶活性研究
多种Cas12a蛋白变体能识别不同的PAM序列(2020.4.27 Plant Biotechnology Journal)
中国科学家创建出新型糖基化酶碱基编辑器
生命“字母表”迎来新成员
生命“字母表”迎来4名新成员