APP下载

CRISPR/Cas9技术及其在非编码RNA编辑中的应用

2019-01-16夏红飞

中国计划生育学杂志 2019年1期
关键词:基因座同源研究者

王 瑚 夏红飞 马 旭

1.国家卫生计生委科学技术研究所遗传优生中心(北京,100081);2.北京协和医学院研究生院

基因的定点修饰一直以来都是研究基因功能的重要手段之一,也注定会成为现代分子遗传学的研究热点。早期的基因定点修饰技术是基因打靶,一种基于同源重组的低效的基因修饰技术。此后,人工核酸内切酶的出现改变了这一局面。目前为止,研究者共发现了三代人工核酸内切酶。锌指核酸内切酶(ZFN)是其中的第一代,是由锌指蛋白(一种可与DNA结合的蛋白质)与核酸内切酶FokⅠ两部分融合形成的[1],可在基因组的特定位置切割DNA双链,但繁复的操作和昂贵的成本限制了广泛应用。第二代人工核酸内切酶被称作类转录激活因子效应物核酸酶(TALEN),其原理与ZFN类似,均由DNA结合蛋白与FokⅠ两部分融合而成,操作较ZFN更简便、特异性更高,在酵母细胞中应用成功后,迅速扩展到植物、动物以及人类细胞[2-3]。上述两种人工核酸内切酶均为DNA导向。此后,一种操作简便、成本低廉、作用高效的RNA导向的人工核酸内切酶 Clustered Regularly Interspaced Short Palindromic Repeats(CRISPR)/CRISPR-associated(Cas)出现[4],并迅速如狂风暴雨般席卷整个基因编辑领域。

1 CRISPR/Cas技术

CRISPR/Cas是一种细菌和古细菌的获得性免疫系统(约90%的古细菌和40%的细菌具有该系统[5]),在RNA的介导下,可以特异性切割外源遗传物质,用以抵御噬菌体或质粒的入侵。该系统的基因座由tracrRNA(crRNA)基因、Cas核酸酶编码基因和CRISPR基因座三部分构成。其中,CRISPR基因座首先被转录成前体CRISPR RNA(pre-crRNA),然后在Cas核酸酶的作用下形成成熟的crRNA,由一个间隔序列和部分重复序列组成;tracrRNA基因转录出的tracrRNA用于指导crRNA成熟;Cas核酸酶主要用于靶DNA的定点切割,也会参与crRNA的成熟。

在行使功能时,CRISPR/Cas系统可分为两部分:一是处理外来信息,获取新的间隔序列,主要由核心蛋白Cas1和Cas2完成;二是CRISPR RNA的转录和加工,以及识别和降解外源遗传物质的过程,据此又可将CRISPR/Cas系统分为TypeⅠ、TypeⅡ、TypeⅢ3种类型[6]。3种类型所含的标志性Cas蛋白种类有所不同,在crRNA的加工和目标DNA双链的切割过程以及分布中也略有差异:TypeⅠ含标志性蛋白Cas3,同时具备解旋酶和核酸酶功能,此外还含有Cas5、Cas6e、Cas7等蛋白,他们主要参与crRNA的加工,在细菌和古细菌中均有分布;TypeⅡ系统仅存在于细菌中,含有标志性蛋白Cas9,既能参与crRNA的加工,也能降解外来遗传物质;而TypeⅢ的标志性蛋白Cas10同样可以参与crRNA成熟及靶序列降解,其余蛋白如Cas6等可参与crRNA的成熟,该型大多数存在于古细菌中,只有少数细菌拥有此型[7]。

CRISPR/Cas系统在发挥作用时,主要包括如下三个阶段[6]。

第一,间隔序列的获得。本质上就是外源遗传物质的一小段DNA整合到宿主菌基因组CRISPR基因座中的过程。外源噬菌体或质粒上与间隔序列所对应的序列被称作protospacer,其5’或3’端2~5个保守的碱基被称作前间隔序列邻近基序(PAM)区[8]。宿主菌首先识别外源核酸并扫描潜在的PAM,将临近PAM的序列作为候选protospacer,随后在CRISPR基因座的5’端合成重复序列,最后将新合成的间隔序列整合到重复序列之间;这样,宿主菌便获得了间隔序列并能在该外源核酸再次入侵时发挥作用。

第二,CRISPR基因座的表达。CRISPR基因座首先被转录成pre-crRNA,之后经过一系列的剪切最终形成成熟的crRNA,这个过程需要多种Cas蛋白和核酸内切酶的参与[9]。CRISPR基因座在正常情况下表达水平很低[10],一旦有外源遗传物质入侵,其表达水平会被迅速上调[11]。

第三,干扰外来遗传物质。成熟的crRNA形成之后,与特定的Cas蛋白形成复合物,复合物结合并扫描外源DNA,crRNA的间隔序列利用碱基互补配对与靶序列结合,之后复合物能在配对的特定位置将靶序列切割。值得一提的是,在这个过程中PAM序列发挥了很重要的作用,如果没有PAM序列或PAM序列突变,即使crRNA与靶序列完美配对,复合物也无法发挥作用[12]。这也是CRISPR/Cas系统能够避免发生自身免疫的手段之一。

2 CRISPR/Cas9技术的发展进程

在上述提及的3种CRISPR/Cas系统中,由于其简易性和可操作性,TypeⅡ得到了最广泛的应用,被改造成迄今为止最有力的基因编辑工具—CRISPR/Cas9。CRISPR/Cas9来源于SF370酿脓链球菌株(SF370),Cas9蛋白是一种核酸内切酶,包括RuvC和HNH两个活性中心,在crRNA的指导下可以分别切割DNA的一条链,最终造成DNA双链断裂(DSB)。TypeⅡ型基因座上游还会表达tracrRNA,用于参与crRNA的成熟加工[13]。为了操作方便,现在普遍使用的是crRNA和tracrRNA嵌合在一起的一条RNA链,称之为单链向导RNA(sgRNA)。

在造成靶序列DSB后,细胞会利用体内的修复机制修复损伤的DNA,在修复过程中会造成碱基的突变、插入或缺失,进而有造成该基因失活的可能。利用CRISPR/Cas9的特性,研究者很快就在哺乳动物细胞中成功实现了基因编辑[14-15],随后该技术又在多种生物体内得到了应用,成功获得了多种基因修饰后的生物[16]。

利用CRISPR/Cas9系统除了能进行单基因敲除外,如向动物细胞或受精卵中同时注射多个sgRNA,就能得到多个基因敲除的细胞系或个体,相较单基因敲除后再进行交配的办法,大大节约了时间和成本。例如Zhou等[17]一次注射靶向5个免疫相关的sgRNA,一步得到不同免疫基因缺陷的小鼠。利用该系统造成DSB后,如同时提供一段携带同源臂的供体DNA,利用体内的同源重组机制,可以在基因组中定点插入一段外源序列[18]。除此之外,在基因调控、基因修复、文库筛选等领域,CRISPR/Cas9系统均发挥着重要作用。

在多次入选《Science》年度十大科学突破之后,近年来全世界的研究者对CRISPR/Cas9技术的关注达到了前所未有的高度,各项新进展、新突破也如雨后春笋般层出不穷。许多研究者的目光聚焦于编辑的精确性。不可避免的一个问题是,CRISPR/Cas9系统会有脱靶现象发生[19]。为解决这一问题,研究者发现,首先突变Cas9的RuvC活性中心,使之成为切口酶(Cas9-D10A,切割sgRNA的互补链而不是双链),配合两条距离足够近但是结合在不同DNA链上的sgRNA;这样两个相距很近的单链断裂就会造成DSB[20],而在脱靶序列处只会造成DNA单链断裂,这个修复过程很少发生突变。

同样是利用Cas9切口酶,目前已有研究者得到了单核苷酸编辑的转基因小鼠[21],他们使Cas9切口酶与胞苷脱氨酶(CD)融合在一起,复合体CRISPR-nCas9-CD能将一种核苷酸替换为另一种核苷酸,这一复合体因此也被称作碱基编辑器。这一成果在精准医疗逐步推进的今天,无疑具有里程碑式的意义。

对Cas9蛋白的改造不止于此,还有研究者通过突变Cas9令其“死亡”(dCas9),即能够靶向结合基因组中的特定位点,但是不再切割DNA;这就使其与靶基因的转录激活结构域(TAD,起分子开关作用)结合,进而调控靶基因的转录(却不会损伤靶基因)成为可能[22]。Harrington等[23]则发现了两种Cas9抑制蛋白AcrIIC1和AcrIIC3,AcrIIC1可以结合Cas9中的HNH活性中心,将Cas9限制在一种可以与DNA结合但没有内切酶活性的状态;而AcrIIC3会诱导Cas9形成二聚体,阻止Cas9结合到靶DNA上。

虽然CRISPR/Cas9系统已经得到了广泛的应用,但对其探索从未停止。CRISPR系统最初是来自于细菌和古细菌,而现在却很少有研究者再将其应用于古细菌中。原核生物中DNA损伤修复主要是靠同源重组(HDR)来完成,而非同源末端连接(NHEJ)非常罕见。事实上,HDR确实更为精密,但如果是为了突变这个基因,NHEJ会更加高效。有研究者在模式古细菌乙酸甲烷八叠球菌中引入了NHEJ机制,大大提高了利用CRISPR/Cas9对古细菌遗传学的研究效率[24]。

Cas9蛋白找到靶序列需要花多长时间,通过荧光标记Cas9分子的研究结果表明,一个Cas9分子搜索完成一个细菌基因组(400万个碱基对)需要花费6小时[25],意味着为了更快地发现靶序列,需要更多的Cas9分子。

CRISPR/Cas9系统在被应用于定点敲入时,需要提供一段每个末端都存在同源臂的供体DNA,以便封闭切割所造成的空隙。有研究者利用携带绿色荧光蛋白的donor DNA转染HEK293T细胞,研究同源臂的长度与编辑成功率的关系。结果表明,长度为33~38nt的同源臂与长度为518nt的同源臂的编辑成功率相同,均为10%~20%;而同源臂缩短至15~16nt后,成功率下降了50%。而donor DNA(不含同源臂)的长度在57~993nt时,编辑成功率在10%~50%,长度越短编辑成功率越高;超过1000nt后,成功率会降至0.5%左右[26]。

吸引最多目光的自然还是与人类健康相关领域。Tmc1是内耳中检测声波的毛细胞发挥功能所必须的一个基因,若其发生突变会导致进行性听力丧失。有研究者已利用CRISPR/Cas9技术使该突变版本失活,成功在小鼠中降低了这种听力丧失[27]。一些更为激进的科学家已经在人胚胎中开展了相关研究,MYBPC3基因突变会导致心脏病,他们成功校正了这一突变[28]。这使我们相信,利用CRISPR/Cas9技术校正人胚胎中的致病性突变已成为可能。

3 CRISPR/Cas9技术在非编码RNA编辑中的应用

非编码RNA(ncRNAs)指不具有蛋白编码功能的RNA,早期的研究者认为非编码基因不具备生物学功能,后来的研究发现这些“垃圾DNA”是具有生物学功能的。有生物学功能的ncRNA主要包括核不均一RNA(hnRNA)、核内小RNA(snRNA)、小核仁RNA(snoRNA)、微小RNA(miRNA)和长非编码RNA(lncRNA)等[29]。这些占转录组中绝大多数的ncRNA参与了生物体内包括分化、凋亡、免疫等在内的几乎所有生理、病理过程[30]。其中miRNA和lncRNA研究较多,但是利用CRISPR/Cas9技术对ncRNA编辑的报道却相对较少。

我们知道,在CRISPR/Cas9系统编辑编码基因的CDS区时,只要有个别碱基的插入或缺失,就会影响到开放阅读框,进而产生错义突变或无义突变,使整个基因失活。而在编辑ncRNA的DNA时,个别碱基的缺失可能不会使ncRNA整个失活,进而会影响到编辑效果,这也无疑增加了编辑ncRNA的难度。为解决这个问题,研究者主要采用设计两条sgRNA进行片段敲除的办法。

3.1 CRISPR/Cas9技术在miRNA编辑中的应用

miRNA是一类长约22nt,具有广泛生物活性的ncRNA,成熟过程主要为:首先,在细胞核中转录形成pri-miRNA,并由核糖核酸酶Drosha加工成pre-miRNA,随后进入细胞质,再在核糖核酸酶Dicer的剪切作用下形成成熟的miRNA[31]。

成熟的miRNA主要通过与靶基因3’UTR上的靶点进行碱基互补配对实现对靶基因的表达调控,当它与靶点完全互补时,RNA诱导沉默复合体(RISC)使mRNA降解;而当miRNA与靶点序列不完全互补时,RISC则对mRNA翻译起到抑制作用[32-33]。也有研究表明,miRNA 也会通过结合来降低lncRNA的表达量[34]。哺乳动物中,大多数编码蛋白质的mRNA都会受到miRNA的调控。

之前已有报道证实,可以利用CRISPR/Cas9系统实现多基因的敲除[17]。利用该办法,有研究者在斑马鱼中注射Cas9蛋白mRNA和位于pre-miR?126a两侧的两条sgRNA;还在其中注射Cas9蛋白mRNA和位于一个含有6个miRNA的基因簇两侧的两条sgRNA。虽然效率还不甚理想,但均实现了对单个miRNA和miRNA簇的全部敲除[35]。

为解决同时导入两条sgRNA效率不高的问题,Ho等[36]提出了将双sgRNA构建在同一个载体上的办法,他们在同一载体上分别引入了U6和H1两个启动子,使两条sgRNA同时表达,成功且高效地在细胞系中切除了一段长约5.6kb的片段。同时,他们还在HEK293、HEK293T、HCT116等细胞系中实现了Cas9和供体质粒共同敲除miRNA。他们构建了一个包括同源臂,且在同源臂之间含有为loxP-GFP-PU-TK-loxP序列的供体质粒,将该质粒与传统的表达sgRNA和Cas9蛋白的质粒共转染细胞,利用绿色荧光蛋白(GFP)和嘌呤霉素(PU)进行筛选,得到了loxP-GFP-PU-TK-loxP序列成功置换pre-miR-21的细胞系,再引入Cre重组酶,将loxP位点之间的序列删去,成功得到了premiR-21完全敲除的细胞系。

CRISPR/Cas9切割的是双链DNA,但是当编码miRNA的序列被编辑后,能否长期稳定地存在下去,有研究者就将敲除miR-17的表达载体和对照载体分别瞬时转染 HT-29和 HCT116细胞,10,20,30天之后分别检测miR-17的表达量。尽管载体逐渐消失,但是miR-17的表达量在整个过程中持续下调,这个结果在裸鼠体内也得到了验证[37],证实CRISPR/Cas9技术编辑miRNA是可靠而稳定的。

miRNA发挥生物学功能主要依赖于靶向一个或多个mRNA的“种子序列”,有研究证实在同一个miRNA家族内,数个miRNA即使拥有相同的种子序列也会有各异的生物学功能。而CRISPR/Cas9则将单独研究每个miRNA的生物学功能成为可能。miR-106a,miR-17以及 miR-93均能靶向心脏抑制基因Fog2,但是当每个miRNA单独被敲除时,便可发现它们针对Fog2的靶向效力不同,进而导致不同程度的心脏分化[38]。

此前,已有不少研究者利用CRISPR/Cas9技术构建了文库用于蛋白质功能的规模化筛选;现在,也有研究者构建了针对miRNAs的CRISPR/Cas9文库,可以靶向1594(85%)的人miRNA的茎环结构,每个miRNA都会被4~5条sgRNA靶向。利用该文库,研究者筛选出了5种在宫颈癌中上调的miRNAs和6种在胃癌中上调的miRNAs,其中有的miRNA是已知与肿瘤发生有关的,也有的是此前未知功能的[39]。

3.2 CRISPR/Cas9技术在lncRNA编辑中的应用

lncRNA长度在200nt以上,但保守性较差。lncRNA结构与mRNA类似,含有多个外显子,大多也会有5’端“帽子”结构和3’端多聚腺苷酸“尾巴”[30]。lncRNA可以作为信号分子在信号通路中起到调控作用,也可以引导蛋白招募到特定靶点,还可以与蛋白形成核糖核蛋白复合物,使多种蛋白协同发挥作用[40]。现已证实lncRNA与多种疾病均有密切关系。与miRNA相同,研究者利用同时显微注射两条sgRNA的办法,得到了一条23kb片段缺失的小鼠,缺失部分包括一条lncRNA[41]。已证明lncRNA与多种疾病有关,因此大多数研究者的目光投向了借助CRISPR/Cas9技术治疗疾病。两种lncRNA,PVT1和ANRIL被认为与膀胱癌有关,而四环素可以诱导Cas9的表达。故研究者设计靶向这两条lncRNA的CRISPR/Cas9系统,并采用四环素诱导,可以显著抑制膀胱癌细胞的增殖和迁移,并诱导细胞凋亡[42]。

除癌症外,CRISPR/Cas9也被用于研究其它疾病。Pax1和Pax9均为生骨节的早期标志,此外,lnRNA PEAT(Pax1增强子反义转录物)位于Pax1基因的上游,对该基因的表达起调控作用。利用CRISPR/Cas9技术敲除lnRNA PEAT后,突变体胚胎中骨形态发生蛋白靶基因的表达得到了适度增加,同时也上调了核糖体蛋白的表达[43]。内皮细胞的血管生成受到很多因素调控,lncRNA是其中重要因素。研究者综合利用了质谱、免疫共沉淀以及CRISPR/Cas9等技术,在肺和肿瘤患者样品中寻找调控血管生成相关的lncRNA。结果显示,MANTIS是其中调控作用最强烈的lncRNA,在组蛋白去甲基化酶JARID1B的调控下,MANTIS在特发性肺动脉高压患者和用野百合碱处理过的大鼠中表达量下调,而在人成胶质细胞瘤患者和被动脉粥样硬化食物饲喂过的食蟹猴的颈动脉中分离出来的内皮细胞中表达量上调[44]。

除人类疾病外,CRISPR/Cas9技术编辑lncRNA还有其他方面的应用。植物中lncRNA的功能大多是未知的,利用CRISPR/Cas9技术在番茄中构建lncRNA 1459的缺失突变体,与野生型相比,突变个体在果实成熟过程受到显著抑制,其中与乙烯和类胡萝卜素产生相关的基因表达量显著下调,揭示了lncRNA 1459在番茄成熟过程中的作用[45]。

同时,也不可忽略CRISPR/Cas9技术在面对lncRNA编辑时所面临的挑战。因许多lncRNA由双向启动子启动转录,或者其可能与编码基因发生重合。有研究者采用全基因组分析,系统分析了CRISPR技术是否适用于全部lncRNA。结果显示,15925个lncRNA位点中仅有38%可以安全使用CRISPR技术进行基因编辑,近2/3的位点存在各种各样的风险或问题[46]。为使CRISPR/Cas技术更广泛、更安全地应用于lncRNA编辑中,还需更多的努力和探索。

4 总结与展望

CRISPR/Cas技术自问世以来就成为了生物学研究者的“宠儿”,今天仍在迅速发展和不断完善的过程中。占转录组中绝大多数的ncRNA参与了生物体内几乎所有生理、病理过程,但是相比较编码基因,我们对ncRNA的了解仍嫌不足。作为研究ncRNA功能的重要手段之一,利用CRISPR/Cas技术构建ncRNA敲除模型必将起着不可或缺的作用。越来越多研究者的目光正在聚焦于此,相信CRISPR/Cas技术在研究ncRNA功能中注定会有着广泛的应用和重要的价值,越来越多的ncRNA也会褪去神秘面纱展现在我们面前。

猜你喜欢

基因座同源研究者
基于“乙癸同源”理论辨治股骨头缺血性坏死
常染色体STR基因座母源突变的观察分析与亲权指数计算
以同源词看《诗经》的训释三则
亲子鉴定中STR基因座来源不明突变的分析
广东汉族人群Penta D基因座off-ladder稀有等位基因分析
“铤”有“直”义的词源学解释——兼说/直/义的同源词族
用水痘病毒开发新型HIV疫苗
研究者称,经CRISPR技术编辑过的双胞胎已出生。科学将如何回应?
研究者调查数据统计
同源宾语的三大类型与七项注意