APP下载

CRISPR/Cas9 系统介导的基因组编辑技术研究进展

2020-01-10

凯里学院学报 2020年6期
关键词:基因组物种蛋白

(中国海洋大学,山东青岛 266003)

基因组编辑技术是指通过特定途径在基因组靶位点实现敲除、插入、定点突变等精确编辑的技术.早期的基因编辑技术多利用同源重组打靶载体技术对细胞或活体靶基因进行编辑,编辑效率较低且存在脱靶现象.近年来,学者们开发了一系列由人工核酸酶介导的基因组编辑技术,基本解决了早期基因编辑中存在的问题.这些核酸酶作用于特定的靶位点后,利用核酸内切酶活性使DNA 双链断裂,然后采用同源重组或非同源末端连接两种不同的机制对断裂的碱基链进行修复[1],实现对靶位点的敲除、插入、定点突变等精确编辑.

目前常用的人工核酸酶介导的基因组编辑技术主要包括锌指核酸酶技术(Zinc-finger nucleas⁃es,ZFNs)[2]、转录激活样效应因子技术(Transcrip⁃tion activator-like effector nucleases,TALENs)[3]和CRISPR/Cas9 技术(clustered regularly interspaced short palindromic repeats/CRISPR -associated nu⁃clease 9,Cas9)[4].

1 ZFNs与TALENs技术

ZFNs 是第一代人工核酸内切酶,由含有串联重复的锌指DNA 结构域的转录因子蛋白ZFP(锌指蛋白)识别特异DNA.它最早在爪蟾(Xenopus lae⁃vis)的卵母细胞中应用并取得了成功[5],此后又在烟草、玉米、拟南芥、果蝇、斑马鱼及多种人类细胞中成功实现基因的定点修饰.但ZFNs 技术仍存在局限性,例如在模式生物以外的物种基因组上难以找到合适的靶位点,还存在上下文依赖效应[6],影响靶序列的识别,因此需要通过细菌双杂交技术对锌指蛋白之间的互作效应进行筛选,试验的简易性差,脱靶切割会导致细胞毒性等.由于这些缺陷存在限,ZFNs 技术没有得到很好的应用,近年来有逐渐被新技术取代的趋势.

转录激活样效应因子效应物(Transcription ac⁃tivator -like effectors,TALEs)[7]是以AvrBs3 等为代表的植物病原菌所分泌的效应蛋白,能进入植物宿主的细胞核并调控核基因的表达[8],该效应因子能特异的结合DNA 来调控基因的表达.目前,TAL⁃ENs 最基础且广泛的应用方式为基因敲除.理论上来说,TALEN 技术可适用于任意物种,可以对任一DNA 序列进行识别.以TATEN 技术介导的基因打靶取决于几个重要因素:一是采用合适的方法将TALEN 导入目的物种的卵或胚胎中,目前使用的转导方法有转染、显微注射、病毒感染等;二是TALEN 转入目的物种后,需要有效的作用于该物种的基因组,产生突变并传递给下一代.该技术的局限性主要在于操作较为复杂,组装成功后的TALEN 碱基数目极多,转导有一定的难度,且仍存在脱靶风险.

2 CRISPR/Cas系统

Ishino 等在对大肠杆菌编码碱性磷酸酶基因的研究中发现,位于该基因编码区下游有成簇间隔相连的重复序列,被同向的重复片段和非重复片段隔开[9].随着研究的推进,发现这种成簇间隔相连的重复序列广泛地存在于古菌和细菌的基因组中[10].后期研究将这种由重复片段和间隔片段串联组成的序列被命名为Clustered regularly inter⁃spaced short palindromic repeats(CRISPR)[11-12].通过对积累的病毒和质粒序列信息进行分析发现,绝大部分的古菌和接近半数的细菌的基因组或质粒中,都存在1个或多个CRISPR位点[13].

CRISPR 由一些具有高保守性的长度约为20~37 bp重复片段和嵌合于其中的长度近似的间隔片段串联而成.重复片段的序列具有二重对称性,可形成发夹结构,其数量在不同的物种中均存在不同的变化,而间隔片段和前导序列在种内差异不大,在种间存在显著差异.间隔序列与某些噬菌体或质粒的序列具有同源性,并提供给宿主细胞对抗外源基因侵染的能力,这种能力是细菌及古菌长期进化形成的获得性免疫机制[14].CRISPR 第一个重复序列上游为前导序列,长度约为550 bp,通常富含AT碱基[15];该序列的功能为启动CRISPR 序列的转录,产生的非编码RNA为CRISPR RNAs(crRNAs)[16].位于前导序列上游有1~6 个与CRISPR 相关基因,在所有CRISPR 序列中均发现了Cas1 基因,其对核酸具有亲和力,推测Cas1 基因对CRISPR 序列具有靶向作用,Cas 蛋白与crRNAs 共同参与CRISPR 的免疫防御过程.

2.1 CRISPR的作用机制

CRISPR 的作用机制可分为3 个阶段:第一阶段,当细菌受到外源DNA 序列入侵,Cas 蛋白会对外源DNA 序列进行特异性识别,CRISPR 系统会捕获一段被称为原型间隔序列的外源DNA 序列.原型间隔序列的3' 端下游通常一段碱基,具有保守性,被称为PAM(protospacer adjacent motifs)序列[17].PAM 序列一般由NGG 三个碱基构成(N 为A、T、C、G 任一碱基),也存在NAG、NNAGAA 等,其在相同CRISPR/Cas 系统中具有保守性,在不同CRIS⁃PR/Cas 系统中具有差异性.当PAM 序列被识别后,CRISPR系统将这段序列插入到前导序列与间隔重复序列之间,将外源序列DNA 插入到自身基因组CRISPR 位点的前端,形成一段新的重复序列后,将这段重复序列作为自身特异性免疫的结构基础;第二阶段,PAM 序列经转录成为前体crRNA(precrRNA),继而变为成熟的crRNA[18];第三阶段,成熟的crRNA 与(transactivating CRISPR RNA)形成tracrRNA:crRNA 二聚体,并进一步与内切酶Cas 蛋白结合形成具有特异性切割功能的复合体,当噬菌体或外源质粒DNA 再次侵染时,tracrRNA:crRNA复合体和内切酶Cas 蛋白利用两种修复机制,在靶位点对断裂的DNA 进行敲除、插入、定点突变等编辑.

2.2 CRISPR的系统分类

根据Cas 基因和识别机制及crRNA 加工方式的不同,可将CRISPR/Cas 系统区分为4 种类型.其中,对Type Ⅰ、Type Ⅱ、Type Ⅲ三种CRISPR/Cas系统的研究较为深入.

Type Ⅰ型CRISPR/Cas系统存在于细菌和古菌中,特点是包含6 个Cas 蛋白,最重要的Cas3 蛋白具有解旋酶或核酸酶的功能,但与DNA 核酸酶/解旋酶的活性有所不同.Type Ⅰ型CRISPR/Cas 系统中多个Cas 蛋白与成熟的crRNA 共同作用形成与CRISPR 相关的病毒防御复合物CASCAD(CRISPR associated complex for antivirus defense),在crRNA的介导下特异识别并结合外源核酸,再在Cas 3 蛋白的核酸酶功能下对外源核酸进行酶切、降解[19-20].Ⅰ型系统中,Cas 相关蛋白参与了pre -crRNA的成熟和对靶标DNA序列的识别.

Type Ⅲ型CRISPR/Cas 系统核心蛋白为Cas10蛋白,主要参与crRNA 的成熟和对外源入侵DNA进行切割.Cas10蛋白具有RNA活性和Type Ⅰ型中类似CASCAD 的功能[21].目前发现的Type Ⅲ型具有Type ⅢA 和Type ⅢB 两种亚型,A 型干扰的靶标为mRNA,而B 型干扰的靶标为DNA.Ⅲ型系统中,pre -crRNA 被加工为成熟的crRNA 同样需要Cas相关蛋白的作用,识别靶标DNA 序列也需多种蛋白协同作用.

Type Ⅱ型CRISPR/Cas系统是目前应用最广泛的一种,仅存在于细菌中,主要特点是核心蛋白为单亚基的Cas9 蛋白.Cas9 蛋白具有多种功能,且分子量较大.现应用较广的Cas9 蛋白主要为SpCas9和SaCas9,分别来源于化脓链球菌和金黄葡萄球菌.Ⅱ型系统中,crRNA 在RNase Ⅲ的作用下变为成熟crRNA,并与tracrRNA中的同向重复序列互补杂交成双链RNA 二聚体结构,再在体内与Cas9 蛋白进行结合后形成切割复合体,靶向地对外源基因进行敲除、插入、定点突变等精确编辑.

研究发现,现可通过人工设计将crRNA:tracrRNA 的双链RNA 结构改为单链向导RNA(Sin⁃gle guide RNA,sgRNA),长度约为100 nt,由5'端的20 nt的靶点序列和下游70~80 nt的tracrRNA组成.

2.3 CRISPR/Cas9的应用

近年来,CRISPR/Cas9 系统介导的基因编辑技术作为一个强大的基因编辑工具,因其特异性强、适应性强、操作简便、敲除效率较高等优点,在多种模式动植物中均得到良好应用.

2013年,Cong等[22]成功证明了在CRISPR/Cas9系统中SpCas9 核酸酶可由shore RNAs 进行指导并对人和小鼠细胞的内源性基因组靶位点进行精确切割,并说明可将多个引导序列编码到单个CRIS⁃PR/Cas 系统中,以便同时对基因组内的多个靶位点进行编辑.同年,Mali 等[23]利用CRISPR/Cas9 系统,通过设计特定的gRNA,在内源性AAVS1 基因座中对人239T 细胞和K562 细胞进行了定点突变.同时也证明了系统中存在多个gRNA 时,可以同时对多个靶位点进行编辑,从而证明了RNA 引导的核酸酶技术的易编程性和广泛适用性.Orel等[24]设计了Gateway 二元T -DNA 载体使Cas9 核酸酶及gRNA 在载体上共表达,并证明CRISPR/Cas9 系统可在水稻的愈伤组织中造成双链断裂,且可用sgRNA 替代tracrRNA:crRNA 双元复合体与Cas9 核酸酶结合正常行使靶向切割功能.Shan Q 等[25]以水稻中合成番茄红素的关键酶基因OsPDS 为靶基因和胁迫抗性相关基因OsMPK2、OsBADH2、Os02g23823 为靶基因分别设计了数条sgRNA,结果在水稻的原生质体中均检测到了定向突变;继而研究人员分别以OsPDS和OsBADH2为目的基因设计了数条sgRNA,结果不仅在水稻的愈伤组织中检测到了突变,同时还获得了后代纯合突变体,验证了CRISPR/Cas9 系统可以在水稻植株中对目的基因进行编辑.2019年,Ren等[26]在研究CRISPR/Cas9系统在葡萄中的应用时,对sgRNA 和Cas9 蛋白分别做出了改进.研究人员认为sgRNA 的GC 含量对编辑效率会产生影响,因此设计了4 个不同GC 含量的sgRNA,结果表明在选用的3个葡萄品种,有2个品种均显示CRISPR/Cas9 系统对基因的编辑效率与sgRNA 中GC 的含量成正比,当GC 含量为65%时,在2个品种中产生的编辑效率最高.

2.4 CRISPR/Cas9系统在的局限性及其改进

CRISPR/Cas9 系统因其强大的功能和简便性已经在许多物种中得到良好应用,但仍存在一些问题:切割位点必须位于PAM 序列上游,不能选取任意位点作为靶点;识别序列仅为20 nt 或者更短的序列,特异性有限,可能会导致脱靶率较高,使基因组上非靶点序列产生突变;sgRNA 和Cas9 蛋白的载体较大,转入相应受体的难度较大;在模式生物中应用较为良好,在非模式生物中应用还不成熟,成功编辑后的效率相差较大,且难以获得稳定遗传的后代或植株.

针对以上问题,研究人员也做出了许多尝试,如对Cas9 蛋白的改造、将tracrRNA:crRNA 整合为sgRNA 并对载体进一步优化等,CRISPR/Cas9 系统在进行应用时,对于不同靶点编辑效率差异较大,甚至在多数靶位点检测不到基因编辑.为此,首先科研人员建立了多种数据库以丰富对靶位点的筛选结果,在对靶点进行选择时,应在多个数据库中查找后进行归纳、比较,选取在基因组中单一存在的靶位点;其次还可以对sgRNA 进行优化以提高其活性和稳定性,Dang 等[27]通过延长sgRNA 序列长度和将连续胸腺嘧啶序列的第四胸腺嘧啶突变为胞嘧啶或鸟嘌呤以修饰sgRNA 结构,结果显示,基因敲除效率显著提高,CRISPR/Cas9 系统的编辑效率提高了约50%;Cas9 蛋白来自古菌,当其应用于不同物种时,应进行相应的优化,如可以根据不同物种的密码子偏好性进行优化;还可以根据目的物种选择合适的启动子,如人类细胞常选用U6 启动子(GN20NGG),而植物细胞中则应选择U6(5’-G-N(20)GG-3’)和U3启动子(5’-A-N(20)GG-3’);对Cas9 蛋白的结构进行改造,如对Cas9蛋白结合区域蛋白中的氨基酸进行改造,使Cas9成为加强型的SpCas9;对Cas9 蛋白的两个结构域进行改造使其核酸内切酶活性降低甚至丧失成为无活性dCas9等.

2.5 CRISPR/Cas9 核糖核蛋白复合物及其应用

随着CRISPR/Cas9 技术在更多物种中进行应用,科研人员研发了一种新型的导入方法,即CRISPR/Cas9 核糖核蛋白复合物(ribonucleopro⁃teins,RNP)介导的基因编辑技术.该技术直接在体外将Cas9 蛋白与sgRNA 直接预组装形成复合物,然后通过多种转导方式直接导入靶基因进行切割.该技术类似于mRNA的转染方式,避免了外源基因插入的干扰[28],不需要质粒载体,无需优化密码子和改造启动子,对靶基因的编辑更为简单直接,使编辑更容易成功.CRISPR/Cas9 RNP 可通过电穿孔、核转染、显微注射等物理方式及聚乙二醇(PEG)、聚乙烯亚胺、树枝状聚合物(dendrimers)等聚合物为基础的化学方式被运送到细胞质或细胞核中.

Woo J W 等于2015 年将该技术在拟南芥、烟草、生菜和大米的原生质体中进行了应用,实验结果显示在预期位置检测到碱基的插入和缺失,频率为8.4%~44%.Baek K 等[29]将CRISPR/Cas9 RNP 技术在莱茵衣藻进行了应用,使用电转法将RNP 导入目的基因CpFTSY 内,并对其进行了靶向敲除.通过定向深度测序检测,经编辑后的基因插入和缺失高达0.56%;因CpFTSY 基因与叶绿素有关,实验还观察到被敲除CpFTSY 基因的莱茵衣藻颜色变浅.Yueting Fan 等[30]对橡树中的两个基因FT 和TFL1 设计了5 个sgRNA,并在体外将sgRNA 和Cas9蛋白按照9:1的比例进行预组装,通过PEG 介导将RNP 导入橡树的原生质体中.实验结果表明在5 个靶位点均成功检测到突变,突变频率为3.74%~20.11%,且在每个靶点均检测到两种突变形式(+1 nt和-1 nt).

3 结语

CRISPR/Cas9 作为目前最先进的基因编辑技术,与ZFN 和TALLEN 相比应用更为广泛,因其简便性及适用性广等优势已成功在人、大鼠、小鼠、拟南芥、水稻、小麦等模式物种中得到成功应用.然而,CRISPR/Cas9 技术在基因组编辑的应用上仍处于起步阶段,对于除模式物种之外的物种,应用常有困难,如难以导入靶细胞、导入后脱靶或是引起多余突变等.要实现CRISPR/Cas9 系统在不同物种中的广泛应用,在未来仍需进一步的探索.

猜你喜欢

基因组物种蛋白
“植物界大熊猫”完整基因组图谱首次发布
牛参考基因组中发现被忽视基因
人工驯养树鼩精子发生过程中MCM7蛋白的表达
科学家找到母爱改变基因组的证据
血清HBV前基因组RNA的研究进展
回首2018,这些新物种值得关注
电咖再造新物种
世界上的15个最不可思议的新物种
Numerical study of corner separation in a linear compressor cascade using various turbulence models
疯狂的外来入侵物种