蛋白质序列设计的深度学习
很难设计出可以精确折叠成 3D 结构的蛋白质序列。 最近的研究表明,与传统的基于物理学的方法相比,深度学习算法可以改进蛋白质序列的设计。
ABACUS 经过训练,可以使用有关其主链结构以及附近残基的主链和 AA 的信息来预测残基中的 AA。 ABACUS 使用 Transformer 神经网络6 来执行此操作。 这种架构允许在残基之间灵活地表示和集成信息。 这些方面在本质上与先前的网络 2 相似,但 ABACUS 增加了辅助任务,例如预测二级结构、溶剂暴露和侧链扭转角。 这些输出在设计过程中没有帮助,但它们确实有助于训练并将序列恢复提高 6%。 ABACUS-R 采用称为“去噪”的迭代过程来设计蛋白质序列(图 1)。
来源和详细信息:
https://www.nature.com/articles/s43588-022-00274-5