我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

智能人工智能方法只提出可以合成的候选药物


想要这个新闻故事的免费PDF版本?

填写下面的表格,我们会将PDF版本的“智能人工智能方法只提出可以合成的候选药物”

听与
喋喋不休地说
0:00
注册免费收听这篇文章
谢谢你!用上面的播放器听这篇文章。
阅读时间:

本文基于尚未经过同行评审的研究结果。因此,结果被认为是初步的,应这样解释。了解同行评议过程在研究中的作用在这里.如需进一步信息,请联系所引用的来源。


制药公司正在使用人工智能来简化发现新药的过程。机器学习模型可以提出具有特定特性的新分子,可以对抗某些疾病,在几分钟内完成人类手动需要几个月才能完成的工作。


但有一个主要障碍阻碍了这些系统的发展:这些模型通常提出的新的分子结构很难或不可能在实验室中产生。如果化学家不能真正制造出这种分子,那么它的抗病特性就无法测试。


麻省理工学院研究人员的一种新方法限制了机器学习模型,因此它只建议可以合成的分子结构。这种方法保证了分子是由可以购买到的材料组成的,并且这些材料之间发生的化学反应遵循化学定律。


与其他方法相比,他们的模型提出的分子结构得分很高,有时用流行的评估方法得分更好,但保证可以合成。他们的系统还可以在不到一秒钟的时间内提出一个合成途径,而其他单独提出分子然后评估其合成器的方法可能需要几分钟。在一个可能包含数十亿个潜在分子的搜索空间中,节省的时间就会累积起来。


“这个过程重新定义了我们要求这些模型生成新的分子结构的方式。其中许多模型都是一个原子一个原子或一个键一个键地构建新的分子结构。相反,我们正在一个积木一个积木,一个反应一个反应地构建新分子,”康纳·科利说,他是麻省理工学院化学工程系、电气工程系和计算机科学系的亨利·Slezynger职业发展助理教授,也是这篇论文的高级作者。


和Coley一起第一作者高文浩,研究生,Rocío梅尔卡多,博士后。这项研究将于本周在学习表征国际会议上发表。

构建块

为了创建分子结构,该模型模拟了合成分子的过程,以确保它可以被生产出来。


该模型提供了一组可行的构建模块,这些模块是可以购买的化学物质,以及可用的有效化学反应列表。这些化学反应模板是由专家手工制作的。通过只允许某些化学物质或特定反应来控制这些输入,研究人员可以限制对新分子的搜索空间有多大。


该模型使用这些输入来构建树,通过选择构建模块,并通过化学反应将它们连接起来,一次一个,以构建最终的分子。在每一步中,随着额外的化学物质和反应的加入,分子变得更加复杂。


它输出最终的分子结构和化学物质树以及合成它的反应。


“我们没有直接设计产品分子本身,而是设计了一个动作序列来获得该分子。这样我们就能保证建筑的质量。”


为了训练他们的模型,研究人员输入了一个完整的分子结构和一组构建模块和化学反应,模型学会了创建一个合成分子的树。在看到成千上万的例子后,模型学会了自己提出这些合成路径。

分子的优化

训练后的模型可用于优化。研究人员定义了他们想要在最终分子中实现的某些特性,给定了某些构建模块和化学反应模板,模型提出了可合成的分子结构。


“令人惊讶的是,你可以用这么小的模板集复制这么大一部分分子。你不需要那么多的构建模块来生成大量可用的化学空间供模型搜索,”梅尔卡多说。


他们通过评估该模型重建可合成分子的能力来测试该模型。它能够复制51%的这些分子,并且在不到一秒钟的时间内重新创建每个分子。


他们的技术比其他一些方法更快,因为模型不需要搜索树中每一步的所有选项。高解释说,它有一组确定的化学物质和反应来工作。


当他们使用他们的模型来提出具有特定性质的分子时,他们的方法提出了比其他方法具有更强结合亲和力的更高质量的分子结构。这意味着这些分子能够更好地附着在蛋白质上,并阻止某种活动,比如阻止病毒复制。


例如,当提出一种可以与SARS-Cov-2结合的分子时,他们的模型提出了几种可能比现有抑制剂更好地与病毒蛋白质结合的分子结构。然而,正如作者所承认的那样,这些只是计算预测。


“有太多的疾病需要解决,”高说。“我希望我们的方法可以加速这一过程,这样我们就不必每次都筛选数十亿个分子来寻找疾病靶标。相反,我们可以指定我们想要的特性,它可以加速寻找候选药物的过程。”


他们的模型还可以改善现有的药物研发管道。梅尔卡多说,如果一家公司已经确定了一种具有所需特性但无法生产的特定分子,他们可以使用这个模型提出与之非常相似的可合成分子。


现在他们已经验证了他们的方法,团队计划继续改进化学反应模板,以进一步提高模型的性能。有了额外的模板,他们可以对某些疾病目标进行更多的测试,并最终将模型应用于药物发现过程。


这项研究得到了美国海军研究办公室和机器学习药物发现和合成联盟的部分支持。


参考:高伟,梅尔卡多R,科利CE。用于自底向上的合成规划和可合成分子设计的平摊树生成。arXiv.2022 doi:10.48550 / arXiv.2110.06389*预印本


本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。


广告
Baidu