网站首页/有机动态/实验与测试/ACS Synth. Biol. | 深度学习引导的远程氨基酸残基挖掘和聚类,用于同时工程加工内切葡聚糖酶的催化活性和热稳定性
ACS Synth. Biol. | 深度学习引导的远程氨基酸残基挖掘和聚类,用于同时工程加工内切葡聚糖酶的催化活性和热稳定性

推荐一篇发表在 ACS Synthetic Biology 上的文章,文章标题是“Deep-Learning-Guided Mining and Clustering of Remote Amino Acid Residues for the Simultaneous Engineering of the Catalytic Activity and Thermostability of a Processive Endoglucanase”。其通讯作者是来自南京工业大学的吴斌研究员。在这项研究中采用了多种深度学习模型,通过聚类分析和贪婪算法的结合优化了氨基酸取代的组合最终鉴定出完全由取代残基组成的精英变体 M8(R23Q/E43Q/K91I/K191P/A198T/Q237D/V240P/S245A)。与野生型酶相比,M8 对可溶性底物羧甲基纤维素-Na(CMC)和不溶性底物磷酸溶胀纤维素(PASC)的催化效率(kcat/Km)分别提高了 10 倍和 5 倍,同时增强了最佳温度和热稳定性。分子机制分析表明,所有远端取代残基都增强了动态耦合和配位,主要影响底物袋附近三个环的构象。这些结构变化调节了底物结合和产物释放,从而有助于提高催化效率(kcat/Km)。


1




目前对过程性内源葡聚糖酶的研究主要集中在两个方向上,即通过调节碳水化合物结合模块(CBM)来增强酶的底物加工能力,和活性位点区域周围的结构优化(例如,通过调节底物结合袋内的氨基酸组成或重塑底物通道结构)。然而,仍然缺乏有效和通用的方法来识别和修改活性位点区域之外的关键调控残基。在此背景下,机器学习辅助定向进化 (MLDE) 提供了应对蛋白质工程挑战的新方法,该方法利用机器学习(ML)模型来预测携带侧链取代的变体的适应性,通过理论上重建适应度景观,能够在复杂序列空间中识别出更有希望的变体,从而有效指导实验室进化。来自枯草芽孢杆菌 BS-5 的 GH5 家族内切葡聚糖酶 EG5C-1,它在许多研究的过程性内源葡聚糖酶中表现出高催化活性。本文根据纤维素酶的特点对 DeepSequence 模型进行了再训练,并结合 MutCompute 和 ESM-1v 对酶进行了综合分析,构建了一个基于适应度评分的由 101 个突变点组成的小型变体库。通过结合氨基酸取代信息并使用分层聚类,识别了潜在的协同替代组合,并进一步应用贪婪算法来指导突变堆叠过程。最终,获得了克服传统方法中常见的活性和稳定性之间权衡的变体 M8,同时提高了对可溶性和不溶性底物的催化效率和热稳定性。此外,本文还对蛋白质结构进行了比较分析,并将其与分子动力学(MD)模拟相结合,以阐明催化效率提高的分子机制。

2

 1 用于变异预测和组合筛选的综合工作流程



考虑到内源葡聚糖酶通常具有多结构域结构,并且本研究侧重于其催化结构域(CD),作者使用 HMM 工具注释了 8,638 个 GH5 家族内切葡聚糖酶序列的结构,去除了碳水化合物结合模块(CBM)等非催化区域,仅保留催化结构域部分。随后,作者根据序列长度分布过滤掉异常序列(240-275aa)。重新训练了 DeepSequence 模型同时还引入了两个互补模型:基于原子微环境的 MutCompute 和基于蛋白质语言模型的 ESM-1v。这三种方法从不同的角度处理问题,即共同进化、局部结构环境和序列语言表示, 最终分别确定了 47 个、30 个和 45 个候选替换位点。总体而言,本文构建了一个包含 101 个独特变体的文库,并进行了定点诱变。经过多轮迭代筛选,得到最佳组合 M8(R23Q/E43Q/K91I/K191P/A198T/Q237D/V240P/S245A),其对 CMC 的特异性酶活性提高了 7 倍,对 Avicel 的水解活性提高了 4 倍。


3

图 2 EG5C-1 三维结构上所有变体的分布及野生型 EG5C-1 和变体 M8 单体内原子对的 DCCM 图谱。



为了阐明变体 M8 催化效率提高的分子机制,使用 Alphafold2 算法构建了 EG5C-1 的三维结构。然后使用 AutoDock 1.5.7 将纤维己糖 (PDB ID: 5CVY) 对接到活性位点,然后进行 100 ns 分子动力学 (MD) 模拟。所有取代位点都位于活性位点袋之外,R23Q 取代位于距底物 30Å以上的地方。事实上,动态互相关矩阵(DCCM)分析证实,远端替换显着增加了与活性位点口袋的这三个关键环区域的相关性。


4

 3 MD 模拟中环 1(残基 230-241)构象的演变



从模拟轨迹中选择 0、30、50、70 和 100 ns 的采样点,分析环 1 的构象变化,比较野生型和变异型 M8 在各时间点的构象差异。在变体 M8 中,环 1 经历了向内旋转并靠近基板。此外,在变体 M8 中,环路 1 和基板之间的距离分布变得更加集中,振荡幅度显着降低。这种变化可能归因于脯氨酸取代了位置 240 的缬氨酸,这引入了更大的刚性并限制了主链的运动,从而减少了环和基板之间的相对振荡。


5

 4 构象分析



进一步分析表明,在变体 M8 中,质子供体残基 E140 与 G(+1)位点(d1)处的 O 原子之间的距离明显更短,这可能促进更有效的质子转移。同时,亲核试剂 E228 与 G(−1)吡喃糖单元(d2)的 C1 原子之间的距离也比野生型 EG5C-1 短,可能有助于形成催化更有利的构象,从而提高亲核攻击的效率,从而提高反应速率。此外,变体 M8 表现出 E140 和 E228 与底物之间的相互作用频率显着增加,这也与其观察到的提高催化效率一致。


6

 5 MD 模拟中环 2 和环 3 构象的演变



在 0、30、50、70 和 100 ns 处对构象进行采样。正如预期的那样,在循环 2 和循环 3 中观察到显着的动态波动。对环和糖环之间的距离变化的分析表明,变体中的环多次远离糖环。增加的构象柔韧性和增强的振荡的组合有利于产物释放,这一假设得到了变体 M8 中底物的环和葡萄糖环之间较低的相互作用能的进一步支持。因此,提高产物释放效率可能是观察到的变体 M8 催化效率提高的主要因素之一。


8

 6 在元动力学模拟期间,每 10 ns 采样一次活性位点口袋内底物滑动的快照




采用元动力学系统分析了野生型 EG5C-1 与其变体 M8 之间纤维素链过程滑动行为的差异。根据 Knott 等人提出的“预滑模式”,产物结合位点(-1 至 -3)为空位,而非产物结合位点(+1 至 +3)被底物糖链占据。基于该模型,构建了 EG5C-1 和 M8 的预滑构象。在每个系统经过 100 ns 的分子动力学模拟以达到构象稳定性后,最终结构被用作元动力学模拟的起点。如图 6 所示,在 30 ns 的模拟过程中,M8 中的底物链向前滑动了四个糖环,达到了 -1 至 +1 个子位点,而野生型 EG5C-1 仅滑动了两个糖环,表明 M8 表现出更高的过程滑动效率。远端氨基酸取代调节活性位点袋的构象,有效地引导底物进入反应性更强且更适合过程催化的构象。

在这项研究中,通过基于深度学习的远程氨基酸取代挖掘和聚类,成功地提高了过程内切葡聚糖酶 EG5C-1 的催化效率和合成能力。远端氨基酸取代通过远程相互作用调节活性口袋区的构象,从而提高催化效率。使用这种方法,获得了高性能变体 M8 (R23Q/E43Q/K91I/K191P/A198T/Q237D/V240P/S245A)。与野生型 EG5C-1 相比,变体 M8 的催化效率显著提高,可溶性底物 CMC 和底物 PASC 的催化效率分别提高了 10 倍和 5 倍。使用野生型 EG5C-1 和变体 M8 的分子动力学(MD)模拟表明,远端氨基酸的变化会影响活性口袋附近三个环区域的构象,导致口袋的重塑。这种构象改变进一步调节了底物的结合模式,诱导底物采用有利于催化的 V 形构型,同时减小了催化残基与底物之间的攻击距离,从而显着提高了催化效率。

本文作者:WSJ

原文链接:

https://pubs.acs.org/doi/10.1021/acssynbio.5c00454




纳孚服务
  • 化学试剂
  • 提供稀有化学试剂现货

  • 化学试剂定制合成服务
  • 上海纳孚生物科技有限公司提供市场稀缺的化学试剂定制服务

  • 新材料现货
  • 上海纳孚生物科技有限公司代理或自产包含石墨烯产品,类石墨烯产品、碳纳米管、无机纳米材料以及一些高分子聚合物材料

  • 结构设计及定制合成
  • 可以根据客户需求对所需化合物结构进行设计改性,从而定制合成出客户所需分子式结构

  • 联系我们
  • 021-58952328
  • 13125124762
  • info@chemhui.com
  • 关注我们
在线客服
live chat