在小说蛋白质设计算法实现突破
在过去的两年里,机器学习已经彻底改变了蛋白质结构预测。现在,三篇论文科学描述了一个相似的蛋白质设计的革命。
在新的论文,华盛顿大学医学院的生物学家表明机器学习可以用来创建蛋白质分子比以前更准确、快速。科学家们希望这一进展会给人带来许多新的疫苗,治疗,工具碳捕获和可持续的生物材料。
“蛋白质在生物学基础,但我们知道,所有的蛋白质中发现每一个植物,动物,和微生物组成远低于百分之一的什么是可能的。有了这些新的软件工具,研究人员应该能够找到解决长期存在的挑战在医学、能源、和技术,”资深作者说大卫•贝克华盛顿大学的生物化学教授医学院和接受者2021年生命科学突破奖。
蛋白质通常被称为“生命的基石”,因为他们是必不可少的所有生物的结构和功能。它们参与几乎所有细胞内发生的过程,包括生长、分裂,和修复。蛋白质是由氨基酸长链的化学物质。蛋白质的氨基酸序列决定了它的三维形状。这错综复杂的形状对蛋白质功能是至关重要的。
最近,包括强大的机器学习算法AlphaFold和RoseTTAFold一直训练预测天然蛋白质的详细形状完全基于他们的氨基酸序列。机器学习是人工智能的一种,它允许电脑学习数据没有被显式地编程。可以使用机器学习模型复杂的科学问题,人类太难以理解。
超越在自然界中发现的蛋白质,贝克的团队成员坏了蛋白质设计成三个部分的挑战和使用新的软件解决方案。
首先,必须生成一个新的蛋白质的形状。在一个纸7月21日发表在《科学》杂志上,研究小组表明,人工智能可以通过两种方式产生新的蛋白质的形状。
第一,被称为“幻觉”,类似于DALL-E或其他生殖AI工具生成输出基于简单的提示。第二,被称为“修补”,类似于现代搜索栏中自动完成功能。
第二,加快这一进程,研究小组开发出了一种新的算法生成的氨基酸序列。Sept.15中描述的问题科学,这个软件工具,叫做ProteinMPNN,运行在大约1秒。200倍的速度比之前的最好的软件。其结果优于之前的工具和软件不需要专家定制。
“神经网络容易训练,如果你有大量的数据,但由于蛋白质,我们没有尽可能多的例子。我们不得不在这些分子和确定哪些特性是最重要的。这是一个试验和错误,”项目科学家说就像Dauparas蛋白质设计研究所博士后
第三,团队使用AlphaFold,工具开发了字母表的DeepMind氨基酸序列是否进行独立评估他们想出了可能会折叠成预定形状。
“软件预测蛋白质结构是解决方案的一部分,但不能想出什么新东西,“Dauparas解释道。
“ProteinMPNN是蛋白质设计AlphaFold是蛋白质结构预测,”贝克说。
在另一篇论文中出现科学9月15日,一个团队从贝克实验室证实,新的机器学习工具的组合确实能够产生新的蛋白质在实验室运作。
“我们发现,蛋白质用ProteinMPNN被更容易折叠为目的,我们可以创建非常复杂的蛋白质组件使用这些方法”项目科学家说巴西的桂树蛋白质设计研究所博士后。
新蛋白质中有纳米环的研究人员认为可能成为部分定制的纳米机器。电子显微镜用于观察环,直径大约十亿倍小于罂粟种子。
“这是机器学习的蛋白质设计的最开始。在接下来的几个月,我们会努力改善这些工具来创建更动态和功能蛋白质,”贝克说。
参考:
王J, Lisanza年代,Juergens D, et al。支架蛋白功能网站使用深度学习。科学。2022,377 (6604):387 - 394。doi:10.1126 / science.abn2100
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。