分享一篇发表在Nature Chemical Biology上的文章Massively parallel measurement of protein–protein interactions by sequencing using MP3-seq。文章的通讯作者是来自斯洛文尼亚卢布尔雅那大学Ajasja Ljubetič助理教授和美国华盛顿大学的Georg Seelig教授。
识别或者设计蛋白-蛋白相互作用(PPI)能够帮助理解这些蛋白参与的相关生物学过程,而一些正交的PPI还提供了通过调节PPI来进行治疗或者细胞改造的工具。早期的PPI研究设计主要关注单螺旋结构蛋白之间的相互作用(1x1s),而近期也有针对包含多个螺旋结构的更复杂的异二聚体之间的相互作用(2x2s)的研究。目前,已有多种方法实现对这些相互作用的检测,比如在实验上基于酵母双杂交(Y2H)的Alpha-seq方法,以及在计算模拟上基于AlphaFold2或者AlphaFold-Multimer等模型的虚拟筛选方法。在本文中,作者设计了一种基于下一代测序和Y2H的高通量方法MP3-seq来检测蛋白结构之间的相互作用,证明了它在检测多种相互作用类型上的有效性可靠性,同时利用AF-M等模型预测MP3-seq的结果,提供了一种在实验以及计算上进行PPI筛选的新策略。MP3-seq利用了传统的Y2H系统和下一代测序技术实现PPI的检测。在实验上,需要用来检测PPI的质粒库转染酵母,并使每一酵母仅带有一个质粒以便后续筛选。质粒上面包含了待测蛋白A和A’的序列信息,他们分别和DNA结合结构域(DBD)或转录活化结构域融合(AD)融合表达。当待测蛋白之间存在相互作用时,DBD和AD共同驱动下游必需基因的表达,使携带这一质粒的酵母得以生存。最后,测序技术能够帮助识别质粒上待测蛋白A和A’及其融合区域的对应序列。在分析时,作者会计算得到每一对PPI的富集情况,先将Y2H中不依赖目标蛋白相互作用的自动激活剂组合排除,之后将不同重复的结果利用DESeq2软件包进行处理并取LOG2,得到了PPI的LFC值。此外,作者将A和A’会分别融合在DBD和AD区域的两种融合情况看作两种不同的PPI形式,从而得到两个伪重复,并用DESeq2软件包处理得到一个伪重复LFC(P-LFC)。这些LFC和P-LFC的数据帮助后续识别真正的PPI。作者在已知的一组1x1s的12个蛋白形成的配体相互作用上对MP3-seq的性能进行测试,发现LFC和P-LFC都可以很好的反应已知的相互作用;同时,P-LFC和此前测定的Kd值之间有比较好的相关性。作者又在更为复杂的Bcl-2家族6种蛋白及9种de novo抑制剂的相互作用组中上进行测试,这一组此前是由Alpha-seq和生物膜干涉法表征的,而MP3-seq也能够很好的进行识别这些相互作用并提供结合信息。后续,作者在更复杂的异二聚体(DHDs)的相互作用库中测试利用MP3-seq进行大规模筛选的可行性。这一库中的成员均为三螺旋或者四螺旋结构,被中间的氢键相互作用网络连接,同时还存在螺旋发夹结构;库中337个蛋白最终形成了超过11000组相互作用。作者根据几次重复结果计算了P-LFC,并设计了相关的评分函数来寻找到其中正交相互作用子集。进一步,作者希望使用MP3-seq结果对mALb8的相互作用进行具体分析,这一组蛋白是2x2s的异二聚体,两个单体之间有三组氢键。通过设计不同类型的截断体并利用MP3-seq比较他们的相互作用,作者对其中氢键网络的重要性进行了研究,并成功设计了新的两组正交结合对。最后,作者还使用了AlphaFold2和AlphaFold-Multimer预测单独1x1或者2x2类型相互作用,并训练了新的模型来预测这些相互作用的MP3-seq LFC值,这可能给相互作用预筛选和后续实验设计提供帮助。总之,本文提供了一种能够对蛋白质-蛋白质相互作用进行大规模并行测量的工具MP3-seq。文章链接:https://www.nature.com/articles/s41589-024-01718-x原文引用:https://doi.org/10.1038/s41589-024-01718-x