机器学习模型揭示蛋白质折叠物理学
预测蛋白质折叠的数学算法也可以阐明控制这种折叠的物理原理。
我们体内的蛋白质负责从大脑功能到免疫力的一切。 这些蛋白质被编码为称为氨基酸的长序列,可折叠成复杂的 3D 结构。 计算机算法可以模拟驱动这种折叠的氨基酸相互作用。 由此产生的蛋白质结构很难确定。 一种名为 AlphaFold [2] 的机器学习算法在从氨基酸序列预测 3D 结构方面取得了突破。 哈佛大学的 James Roney 和 Sergey Ovchinnikov 现在表明,AlphaFold 可以通过参考氨基酸之间的物理相互作用来预测蛋白质折叠 [3]。 这表明机器学习可用于指导对复杂物理过程的理解和建模。
预测蛋白质的 3D 结构非常困难,因为氨基酸折叠的可能方式太多了。 AlphaFold 的计算搜索可以从一个模板开始,该模板是一种以相似蛋白质而闻名的结构。 AlphaFold 还可以使用有关同一蛋白质家族(具有相似功能和可能折叠的蛋白质)内氨基酸序列进化的信息。 该信息非常有用,因为氨基酸对之间一致的进化变化可能表明它们直接相互作用,即使它们的序列相距很远 [4, 5]。 可以通过比较不同蛋白质家族的序列来提取此信息。
来源和详细信息:
https://physics.aps.org/articles/v15/183