APP下载

符合工程化需求的生物元件设计

2018-02-08崔颖璐

中国科学院院刊 2018年11期
关键词:突变体元件蛋白质

崔颖璐 吴 边

中国科学院微生物研究所 微生物资源前期开发国家重点实验室 生理与代谢工程重点实验室 北京 100101

2000 年,以拨动开关(toggle switch)与合成振荡器(synthetic oscillator)为标志的基因设计研究使合成生物学走进了人们视野[1,2]。近年来,随着合成生物学的蓬勃发展,人们很快认识到,生物系统可以在定量模型指导下,用“模块化、标准化”的组成单元来设计构建人工复杂系统。其中,生物元件作为合成生物学三大基本要素之一,对其进行深入挖掘和改造已成为合成生物学领域的重要研究方向。为了方便利用模块化、标准化的“部件”拼装“机器”,2003 年,美国麻省理工学院相关合成生物学实验室成立了标准生物元件登记库(Registry of Standard Biological Parts,http://partsregistry.org),收集满足标准化条件的生物元件。截至 2018 年已有超过 20 000 个生物元件被登记,其中包括启动子、转录单元、质粒骨架、蛋白质编码区等 DNA 序列,以及核糖体绑定位点、终止子等 RNA 序列和蛋白质结构域。

天然生物元件来源于自然进化,在模块化、组装、集成等方面,难以符合特定工程需求。如果将细胞看成合成工厂,由 DNA 编码的蛋白质和 RNA 等转运、调控、催化基本元件在生命体系中体现出一定的交互性和模块性。如何让不同单元之间、单元与途径和网络之间可控、可组装,是工程化设计创建生物系统首要面临的问题。目前,大量已知功能的生物元件并未被标准化,许多元件体现出不兼容性,加之整合过程中的复杂性和整合后的可变性等因素,导致元件之间不能协调一致地工作,效率大幅降低,或无法实现设计功能。因此,设计具有良好协调行为、协同执行功能的生物系统是合成生物学的一项重大挑战,也是解决“人造生命”的重要突破口。本文简要介绍了近年来非催化元件的研究现状,重点介绍催化元件设计领域从头预测新酶结构的分子优化设计、人工金属催化酶设计、底物选择性重设计以及酶分子热稳定性设计 4 个方面的前沿研究进展,并综述了酶分子设计与工业生产的跨层次结合与技术互融,以期为合成可控、功能特定的人工生物体系提供重要线索,同时有助于推动合成生物学关键基础技术体系与工业生物过程的互作发展。

1 非催化元件设计的研究进展

自 2005 年启动子库被引入精细调控代谢途径理念后,多种宿主细胞(如大肠杆菌、酵母菌以及放线菌等)启动子库相继被开发和被设计。随着大数据和人工智能技术的发展,针对特定需求启动子序列,借助人工神经网络系统及计算机辅助设计,人工设计预测模型的训练集与测试集回归相关系数可达到98%[3]。英国剑桥大学的 Rackham 与 Chin[4]利用筛选法获得了正交的核糖体 RNA-mRNA 正交对。在细胞内,只有当两者都表达时,核糖体才能正常地识别特定的 mRNA 而产生功能蛋白。同时,他们还利用不同的正交对拓扑结构构建了更多翻译水平的逻辑门,为人工设计与宿主遗传背景正交的遗传线路奠定了基础。

目前,在生物元件方面已完成了多种不同来源的启动子、核糖体结合位点与终止子元件库的构建及预测设计,实现了强度跨度大、梯度密集的元件库。此外,越来越多新颖的元件不断被开发,如核酸开关(riboswitch)、核酸调节子(riboregulator)等顺式作用元件,以及转录激活样效应子(transcription activated-like effector,TALE)、CRISPR/Cas9 系统等反式元件,为代谢平衡优化与复杂遗传环路设计提供了坚实保障。如果将非催化元件作为“基础工具”,那么催化元件可看做“功能工具”,对实现代谢途径高效运行具有至关重要的作用。

2 催化元件设计的国际前沿进展

催化元件是合成生物学研究中重要的基本生物元件。虽然在人工合成途径组装中可以跨物种应用天然酶资源来重构特定的代谢途径,但由于自然界的固有催化特征体系,人工合成往往无法满足合成生物学的一些特殊要求,如在异源宿主中表达量低、生理条件不适应、上下游酶活性不匹配等。因此,通过对催化元件的人工设计和组装来提供具有新功能的元件成为人工合成途径构建的基础。

目前,利用定向进化策略提高催化元件活性、稳定性等方面已经获得一定成效。但由于突变体文库构建数量庞大,并需多轮进化,因而定向进化策略难以完成对序列空间的全面搜索。除此之外,突变技术中固有的密码子简并性和碱基突变倾向性使突变文库多样性受到极大限制。随着高性能计算技术发展,计算蛋白质设计技术取得了前所未有的发展,尤其在核心元件酶催化设计方面发挥出巨大作用。利用计算蛋白质设计可根据反应特性以及底物结构等特定研究,定向改造催化元件,并建立全面搜索高精度智能化文库。这极大程度降低了定向进化策略庞大突变体文库所需的材料成本、时间成本及人力成本[5]。2016 年,Nature 杂志发表了题为《全新蛋白质设计时代来临》的重要综述[6]。同年,Science 杂志也将蛋白质计算机设计遴选为年度十大科技突破之一。2017 年,美国化学会将人工智能设计新型蛋白质结构列为化学领域八大科研进展之首[7]。通过高精度、高效计算模拟技术,蛋白质分子结构、功能设计极大程度扩展了人工改造生命体的应用场景,为现代生物制造带来全新发展机遇。针对酶的催化功能特性,目前催化元件的计算设计研究主要涵盖基于结构的从头预测酶分子及后续优化设计,基于催化底物的立体选择性及位置选择性设计,基于金属催化特性的金属酶设计,以及基于功能特性的热稳定性设计等领域。

2008 年,华盛顿大学 Baker 团队提出从内而外的“Inside-out 策略”,并应用该策略设计改造了逆醛醇缩合酶[8]、Diels-Alder 反应催化酶[9]、Kemp 消除催化酶[10]等一系列酶。然而,尽管从头计算新酶设计已取得一定成功,“Inside-out 策略”依然存在不同层面的缺陷:① 策略中的模型——theozyme,不能完全反映酶催化过程的真实过渡态;② 新酶设计需要将催化活性中心与蛋白质骨架进行嵌合,而嵌合过程难免会影响蛋白质的结构和稳定性;③ 在计算过程中并未考虑长程静电相互作用及蛋白骨架“诱导-契合”的变构影响,经过循环设计和结构优化后获得的酶分子构象非常容易陷入能量势阱,在相邻位置可能存在其他极小值。因此,基于“Inside-out策略”设计的少数具有预期功能的新酶分子初始活性相对较低,需要通过进一步改造来提高酶学属性。

随着量子力学和分子动力学理论及方法学的发展,计算精度不断提升,计算尺度逐步扩大,相关算法的通量、灵敏度、选择性等也有大幅提高。因而,利用量子力学/分子动力学以及大数据分析方法可以快速定位特定功能区和协同进化位点,为合成生物学功能器件提供大量精确模板和互作模型。在基于“Inside-out 策略”获得的新酶基础上进一步推动催化元件活性大幅提升,使酶工程技术迎来发展新阶段,同时也为发展符合工程化需求的生物元件设计提供指导规律。

2.1 从头预测酶分子优化设计

通过分子动力学(molecular dynamics,MD)模拟、量子力学/分子力学(quantum mechanics/molecular mechanics,QM/MM)联用方法对酶分子催化机理分析,以及对蛋白质骨架结构进行进一步修饰可大幅提高基于从头预测方法获得新酶分子的催化活性。例如,在 Kemp 消除反应酶分子设计中,羧酸基团作为广义碱与非极性底物间相互作用。但是由于羧酸基团自由度较大,如果不能准确计算羧酸基去溶剂化效应的能量消耗及熵减,可能使羧酸基团失去广义碱功能从而导致反应无法进行。Warshel 课题组通过 QM/MM 经验价键(empirical valence bond,EVB)方法预测高活性 Kemp 消除反应突变体,其结果与实验值比较一致,但与实验速率常数推导出的能垒的相关性较弱[11]。Mayo 课题组计算迭代方法,以非活性蛋白质支架 HG-1 为起始点计算,迭代校正后获得的 8 种设计酶均表现出显著的催化活性,大幅提高了计算设计酶分子的成功率[12]。

Diels-Alder 反应是双分子成环反应,自然界中并未发现能够催化该反应的天然酶分子。2010 年,Baker 研究团队通过“Inside-out 策略”设计了 84 个可能具有 Diels-Alder 反应催化活性的蛋白,实验验证后仅余两个蛋白(DA_20 和 DA_42)具有 Diels-Alder 反应催化活性[9]。随后,Baker 团队通过 Foldit 在线蛋白质折叠游戏对从头设计的 Diels-Alder 催化酶引入骨架活性以改善骨架结构问题。多名在线贡献者重塑 DA_20 骨架,使底物与蛋白骨架充分适应调整,从而将 Diels-Alder 催化酶活性提高至少 18 倍[13]。2012 年,Roelfes 课题组在转录因子 LmrR 孔道末端引入半胱氨酸,共价连接含有邻菲罗啉或联吡啶基团的小分子进而与 Cu(Ⅱ) 配位,设计出的人工金属酶具有 97% 的对映选择性[14]。

2.2 人工金属催化酶设计

金属酶在原子转移反应中占有重要地位。自 21 世纪初开始,人工金属酶设计迅速发展,并从水解反应等天然催化反应扩展至碳-碳键连接、氧转移反应等非天然酶催化原子转移反应。例如,上述的 Diels-Alder 反应中,人工金属酶催化 Diels-Alder 反应的立体选择性和反应活性已与化学催化剂相当。此外,相对于天然酶,金属酶的底物范围明显增大[15]。2011 年,Kuhlman 课题组偶然发现,在同源二聚体界面处计算设计的 Zn(Ⅱ) 结合位点可有效催化羧酸酯和磷酸酯水解[16]。随后,他们在 rabenosyn 蛋白的 Rab4 结合域引入组氨酸与 Zn(Ⅱ) 配位,该复合体对 4- 硝基苯基乙酸酯的水解速率提升了 5 个数量级[17]。除了活性位点结构优化外,化学连接法也是人工金属酶设计的可行策略。Rovis 课题组让生物素 Rh(Ⅲ) 配位复合物与链霉亲和素结合,构建出用于活化 C-H 键的人工金属酶,催化速率提升了100 倍,并具有 93% 的对映选择性[18]。此外,正如 Alexandrova 课题组在综述中所述,金属酶进化过程除了受反应活性等因素影响外,还受金属可用性和毒性影响[15]。在这些限制因素下,金属催化剂并非一定达到其最佳催化性能。因此,利用新型金属代替固有金属催化剂改善酶的催化性质为金属酶分子设计提供了新思路。Itoh 和 Fujieda[19]在分子动力学模拟的基础上,利用铜离子取代 β- 内酰胺酶的双锌离子结合部分,制备了人工双铜氧化酶。与野生型 β- 内酰胺酶相比,这种铜取代氧化酶的三重突变体催化 4- 叔丁基羧酸酯的 kcat/KM值增加了 87 倍。

2.3 底物选择性重设计

酶催化中心的精确空间结构赋予其高度的底物特异性等特点。面对纷繁庞杂的底物谱,从自然界中筛选新酶开发的速度远不能满足当今合成生物学需求,因此改变酶的底物特异性是计算蛋白质设计中应用最广泛的方向之一[20]。

2015 年,Baker 课题组通过计算设计聚甲醛酶,将单碳甲醛分子固定至三碳单元的二羟基丙酮中,从而实现核心代谢步骤,首次通过催化元件设计指导新型代谢通路合成[21]。他们以苯甲醛裂解酶(benzaldehyde lyase,BAL)为起点,利用 RosettaDesign 以及 Foldit 重新设计 BAL 的苯甲醛结合口袋以增加其对甲醛的特异性,获得 7 个突变氨基酸组成的聚甲醛酶(Formolase,FLS)。该酶对聚甲醛反应的催化效率与原始 BAL 相比增加 100 倍。在甲酸转化为二羟丙酮磷酸盐途径中,由甲酸直接还原为甲醛难度很大。为实现甲酸转化,Baker课题组先将甲酸活化为甲酰基 -CoA,降低热力学障碍。随后通过 BRENDA 数据库搜索挖掘能够将甲酰基 -CoA 还原为甲醛的酰化醛脱氢酶,并将乙酰辅酶 A 合酶与酰化醛脱氢酶串联催化甲酸转化为甲醛。通过上述设计的聚甲醛酶,将甲酸最终转化为磷酸二羟丙酮。这项工作充分证明了酶分子底物重设计能够有效引导新型代谢途径设计。

2.4 酶分子热稳定性设计

改善酶热稳定性可提高异源宿主表达量,提高温和条件下催化元件活性,并增强酶对严苛工业条件(有机溶剂、高温、极端 pH 值等)的耐受力。在蛋白质热稳定性改造方面,使用传统蛋白质进化的方法,蛋白质熔解温度的提高通常小于 15℃。而通过对蛋白质整体结构的能量计算指导的计算机设计方法则可以突破该局限,甚至可以使蛋白质的熔解温度提高超过 35℃ 以上的水平,获得具有超热稳定性的蛋白[22]。

目前,针对酶分子热稳定性改造已发展出多种策略和算法,其预测能量与数据库值拟合程度最高相关系数(R 值)可达到 0.73(Foldx 程序)[23]。Weiss 团队利用 SCADS 策略(Statistical, Computationally Assisted Design Strategy,SCADS)对马兜铃烯合成酶进行环境能量打分,检测氨基酸侧链与周围骨架、侧链,以及所在环境的相互作用[24]。通过环境能量评估筛选 12 个打分最高的氨基酸进行突变,熔融温度由 38℃ 提升至 83℃。Janssen 课题组通过 FRESCO 策略(Framework for Rapid Enzyme Stabilization by Computational libraries,FRESCO)对柠檬烯环氧化物水解酶进行热稳定性突变体文库构建,通过结合 10—12 个单点突变,组合突变体的熔融温度从 50℃ 提高至 85℃,且酶的催化活性增强,半衰期延长大于 250 倍[25]。他们还利用 FRESCO 策略对卤代烷脱卤酶(haloalkane dehalogenase)LinB 进行热稳定性计算。12 个稳定突变叠加导致 LinB 突变体熔融温度增加 23℃,并且在 60℃ 下半衰期超过 200 倍[26]。此外,为了提高卤代醇脱卤素酶(halohydrin dehalogenase)在有机溶剂中的耐受性,Janssen 课题组利用 FRESCO 策略确定了 218 个突变点和 35 个二硫键,具有预测的稳定效应。结果显示,组合突变体(HheC-H12)熔融温度提高 28℃,对共溶剂的抗性显著增加[27]。2016 年,Fleishman 团队开发了一种联合计算策略(protein repair one stop shop,PROSS),设计带有 51 个突变的乙酰胆碱酯酶(hAChE)突变体,通过结构分析发现该突变体可以显著改善蛋白质的核心堆积、表面极性及骨架刚性[28]。与野生型相比,该突变体在大肠杆菌中表达水平高出 2 000 倍,热稳定性提高 20℃。

多肽的末端功能化对蛋白质生化性质具有非常重要的影响。通过对 C 端的特异性修饰可以使多肽的体内代谢半衰期延长、免疫原性降低或毒副作用减少。由于多肽结构的复杂性,化学修饰步骤多、产率低、难度很大。2016 年,中国科学院微生物研究所研究团队与荷兰格罗宁根大学以及 Enzypep 公司合作,采取一种“FRESCO 与一致性分析联合计算”策略对多肽酰胺酶进行了工程化改造,成功设计了一个经过高度改造的多肽酰胺酶突变体 PAM12A(包含 12 个突变点)。PAM12A 具有极高的热稳定性(熔解温度达到 76℃),并且可以在乙腈、丙酮等多种无水溶剂环境中保持数天的稳定活性[29]。实验结果表明,PAM12A 可以催化包括甲酯化、羟胺化、甲胺化、胺化在内的多种不同的多肽修饰反应,且不受多肽本身序列和 C 端原功能基团的限制。

3 酶分子设计与工业生产的跨层次结合与技术互融现状简介

近年来,合成生物学的基础理论研究及相关应用技术,如基因组测序技术、计算机设计技术等以指数增长的速率发展。值得注意的是发达国家在合成生物学知识产权领域十分活跃,连续申请了一系列覆盖领域很宽的专利,阻止他人进入相关领域[30]。而我国在合成生物学方面的研究还处于起步阶段,待解决的核心问题体现在先进的实验室前沿技术与工业生产技术对接能力相对滞后,技术融合过程缓慢。诺维信公司(https://www.novozymes.com)作为工业用酶巨头,在 2014 年占据了 44% 的市场份额,是全球工业酶制剂和微生物制剂市场的绝对领导者;而美国杜邦公司和荷兰 DSM 公司分别占有 20% 和 6% 的市场份额。全球各地区对工业酶的需求也呈现巨大差异,欧洲和北美地区需求量最大,共占据 80% 市场份额;而中国仅占 9.4%[31]。随着国家创新驱动发展战略的深入实施,生物工业发展面临重要发展机遇和投资前景。如何建立以合成生物学技术和生物-化学联合技术为核心的低成本生物制造工艺路线,同时建立促进工业生物技术发展的关键技术体系,将研究机构的研究成果与工业生物过程同时兼顾是亟待解决的核心问题。

随着先进制造产业涵盖领域与发展规模日益扩大,生物及交叉应用领域不断涌现出颠覆性创新应用,逐渐形成了产品多样化、产出能力强、市场转化活跃的产业技术创新体系。例如,β- 氨基酸具备多样的特殊生物活性,被应用于医药、食品、农牧业等多个产业。β-内酰胺抗生素、重磅药物紫杉醇(重磅抗癌药物)、西格列汀(糖尿病药物)及维生素 B5 等多种具有巨大市场销售额的明星分子均需要 β- 氨基酸作为合成单元。长期以来,β- 氨基酸的合成一直依赖于过渡金属催化的化学途径,需要昂贵的催化剂、繁琐的保护与去保护步骤以及苛刻的反应条件。而不对称氢胺化反应具备极高的原子经济性,无须附加其他辅剂,是美国化学会提出的最具“绿色化学和绿色工业”特性的十大反应之一[32]。然而,无论是人工设计的化学催化剂或是天然存在的生物催化剂都不能直接催化该反应。

中国科学院微生物研究所研究团队通过 Rosetta Design 以及高通量 MD 模拟方法对天冬氨酸酶进行了分子重设计,成功获得了一系列具有绝对位置选择性与立体选择性的人工 β- 氨基酸合成酶。该人工设计的反应体系体现了高效率、高原子经济性等巨大优势,底物浓度达到 300 g/L,实现了 99% 的转化率,99% 区域选择性,以及 99% 立体选择性,相关指标达到了工业化生产的标准[33]。该项研究成果为人工智能技术在工业菌株设计方向的成功案例。除了在科学层面取得的重要进展,该团队还积极推进科研成果的落地转化,通过与企业的合作,该项技术已经通过中试与全尺寸生产工艺验证,在近期完成了千吨级的生产线建设。相关产品有望在紫杉醇、度鲁特韦与马拉维若等抗癌,以及艾滋病治疗药物的生产过程中大幅降低生产成本。

4 结语

通过世界各国多个研究团队的共同推动努力,催化元件设计已经从简单的模式化学反应设计逐步向具有工业应用前景的催化途径设计发展。除了可用于单一催化反应之外,通过将计算设计的酶整合入复杂途径中,还可以创造出全新的代谢途径,并生产出新型的化学分子。尤其是由计算推动的催化设计领域先导研究,可为合成生物学的发展提供自然界中本不存在的全新元件,进而极大扩展生命的可设计性,同时也为回答酶催化的本质机理以及蛋白质的基本折叠规律等重要基础科学问题提供相应的支持。

猜你喜欢

突变体元件蛋白质
盐胁迫对水稻耐盐突变体sst芽苗期生长的影响
蛋白质自由
承压类特种设备受压元件壁厚测定问题的探讨
人工智能与蛋白质结构
航天搭载小麦株高突变体研究初探
新的控制水稻粒宽基因获发现
中核北方核燃料元件有限公司
一个粳稻早熟突变体的遗传分析及育种应用潜力的初步评价
带扰流孔波纹板蓄热元件的分析
宝马i3高电压元件介绍(上)