科学家训练人工智能产生药物和疫苗
科学家已经开发了人工智能软件,可以创建的蛋白质可能是有用的作为疫苗,癌症治疗,甚至工具拉碳污染的空气。
这项研究,今天在《科学》杂志上报道,由华盛顿大学医学院和哈佛大学。本文题为“支架蛋白功能网站使用深度学习。”
“我们发现自然界中神奇的蛋白质分子,但是设计的蛋白质可以做得更多,”资深作者大卫•贝克说,霍华德·休斯医学研究所的研究员和威斯康辛大学医学生物化学教授。“在这项工作中,我们表明,机器学习可以用来设计蛋白质和各种各样的功能。”
几十年来,科学家们利用计算机工程师的蛋白质。一些蛋白质,如抗体和合成结合蛋白,被改编成药物对抗COVID-19。其他的,如酶,帮助工业生产。但是单个蛋白质分子通常包含成千上万的成键原子;即使有专门的科学软件,他们很难学习和工程师。
灵感来自于机器学习算法是如何产生的故事,甚至图像提示,团队着手构建类似的软件设计新的蛋白质。“我们的想法是相同的:神经网络可以被训练数据中的模式。一旦训练,你可以给它一个提示,看看它是否可以生成一个优雅的解决方案。结果往往是令人信服的,甚至漂亮,”主要作者约瑟夫·沃森说,华盛顿大学医学院博士后学者。
团队训练多个神经网络使用信息从蛋白质数据银行,这是一个公共存储库成千上万的蛋白质结构来自生活的所有王国。导致的神经网络惊讶甚至科学家们创造了他们。
团队开发了两种方法的设计与新功能的蛋白质。第一,被称为“幻觉”是类似于DALL-E或其他生殖人工智能工具,产生新的输出基于简单的提示。第二,被称为“修补”,类似于现代的搜索栏中的自动完成功能和电子邮件客户端。
“大多数人可以想出新的图像的猫或写一段提示如果问,但随着蛋白质设计,人类的大脑无法做电脑现在可以,”主要作者王爵说,华盛顿大学医学院博士后学者。“人类无法想象的解决方案可能是什么样子,但是我们有设置机器做。”
解释如何将神经网络产生幻觉的一种新的蛋白质,研究小组把它比作如何写一本书:“你从一个随机的各式各样的词语——总胡言乱语。然后实施等要求,在开篇,它需要一个月黑风高的夜晚。然后电脑会改变一次一个的话,问问自己“这让我的故事更有意义吗?”如果是这样,它使更改之前写一个完整的故事,”王解释说。
这两本书和蛋白质可以被理解为长序列的信件。在蛋白质的情况下,每个字母对应于称为一种氨基酸的化学基础。从一个随机的氨基酸链,软件变异序列,直到最后一个序列,编码生成所需的功能。这些最后的氨基酸序列编码蛋白质,可以制造和研究实验室。
团队还表明,神经网络可以填写缺失的片段的蛋白质结构只有几秒钟。这种软件可以帮助开发新药物。
蛋白质修复“自动完成,或者,我们开始关键特性,我们希望看到一个新的蛋白质,然后让想出其他的软件。这些特性可以绑定主题网站甚至酶活跃,”沃特森解释道。
实验室测试表明,许多蛋白质生成通过幻觉和修复功能。这包括新颖的蛋白质,可以绑定金属以及那些绑定抗癌受体PD-1。
新的神经网络可以产生几种不同的蛋白质在一秒钟。包括一些潜在致命的呼吸道合胞体病毒疫苗,或RSV。
所有疫苗工作呈现一片病原体的免疫系统。科学家们知道哪块工作最好,但创建一个疫苗,达到所需的分子形状可以是一个挑战。使用新的神经网络,团队促使计算机创建新的蛋白质,包括必要的病原体片段作为最终结构的一部分。创建任何支持结构的软件是免费的关键片段,产生一些潜在的疫苗与分子形状不同。
在实验室的测试中,研究小组发现,已知抗体RSV坚持三个时的蛋白质。这证实了新的蛋白质采用预期的形状和表明他们可能可行的候选疫苗可能促使身体产生自己的高度特定的抗体。额外的测试,包括动物,仍然是必要的。
“我开始研究疫苗的东西来测试我们的新方法,但是在中间的工作项目,我两岁的儿子被RSV感染,花了一个晚上在ER肺部清除。它让我意识到,即使是“测试”的问题我们在研究实际上是很有意义的,”王说。
“这些都是非常强大的新方法,但仍有许多改进的空间,”贝克说,他是2021年生命科学突破奖。“设计酶高的活动,例如,仍然是非常具有挑战性的。但每个月我们的方法继续变得更好!深度学习改变蛋白质结构预测在过去的两年里,我们现在正处于类似的蛋白质设计的转换。”
参考王:J, Lisanza年代,Juergens D, et al。支架蛋白功能网站使用深度学习。科学。2022,377 (6604):387 - 394。doi:10.1126 / science.abn2100
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。