我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

计算模型提供了一种方法来加速药物发现

各种各样的药。
通过应用protein-drug交互的语言模型,研究人员可以快速屏幕大图书馆潜在的药物化合物。来源:iStock。

想要一个免费的PDF版本的这个新闻吗?

完成下面的表格,我们将电子邮件您的PDF版本“计算模型提供了一个加速药物发现”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

巨大的药物化合物库可能潜在的治疗各种各样的疾病,如癌症或心脏病。理想情况下,科学家们希望这些化合物的实验对所有可能的目标,但做这种屏幕是非常耗时的。


近年来,研究者们已经开始使用这些库计算方法筛选,希望加速药物发现。然而,许多这些方法也需要很长时间,因为他们中的大多数计算每个目标蛋白质的三维结构的氨基酸序列,然后使用那些药物分子的结构来预测它会相互作用。


麻省理工学院和塔夫茨大学的研究人员已经发明了另一种计算方法基于一种人工智能算法被称为一个很大的语言模型。这些模型——一个著名的例子就是ChatGPT——可以分析大量的文本和找出哪些词(或者,在这种情况下,氨基酸)最有可能出现在一起。新模型,称为ConPLex,可以匹配目标蛋白质与潜在的药物分子,而不必执行计算密集型的步骤计算分子的结构。

使用这种方法,研究人员可以在一天之内屏幕超过1亿种化合物——远远超过任何现有的模型。

想要更多的最新消息?

订阅188金宝搏备用的日常通讯,提供每天打破科学消息直接发送到您的收件箱中。

免费订阅

”这项工作地址需要高效、准确的硅片筛选潜在的候选药物,和模型的可扩展性使大型屏幕评估脱靶效应,药物再利用,并确定药物结合突变的影响,”邦妮·伯杰说,西蒙斯教授数学、计算和生物集团在麻省理工学院的计算机科学与人工智能实验室(权力)的一个新的研究的高级作者。


丽诺尔考恩,塔夫茨大学的计算机科学教授,也是一个的资深作者本周出现的美国国家科学院院刊》上。罗希特•辛格CSAIL的研究科学家,塞缪尔Sledzieski,麻省理工学院的研究生,论文的主要作者,布莱恩·布赖森,麻省理工学院的生物工程副教授,MGH拉根研究所的一员,麻省理工学院和哈佛大学,也是一个作家。除了论文,研究人员取得了他们的模型网上其他科学家使用。

做预测

近年来,计算机科学家们已经取得了很大的进步在发展模型,可以根据他们的氨基酸序列预测蛋白质的结构。然而,使用这些模型预测一个大型图书馆潜在的药物可能与癌蛋白相互作用,例如,已被证明具有挑战性,主要是因为计算蛋白质的三维结构需要大量的时间和计算能力。


另外一个障碍就是,这些模型没有一个很好的记录消除化合物称为诱饵,非常类似于一个成功的药物,但实际上并不与目标交互。


”领域长期存在的挑战之一是,这些方法是脆弱的,在某种意义上,如果我给模型药物或小分子看起来像是真实的东西,但它在一些微妙的方式略有不同,他们将交互的模型可能仍预测,即使它不应该,”辛格说。


研究人员设计模型,能克服这种脆弱性,但他们通常只针对一类药物分子,和他们不适合大规模的屏幕,因为计算时间过长。


麻省理工团队决定采取另一种方法,基于一种蛋白质模型在2019年他们第一次发达。使用数据库超过20000的蛋白质,这个语言模型编码信息转化为有意义的数值表示的每个氨基酸序列捕获序列和结构之间的联系。


”这些语言模型,即使蛋白质序列截然不同,但可能也有类似的结构或类似的功能可以以类似的方式在这门语言当中的空间,我们能够利用使我们的预测,“Sledzieski说。


在新研究中,研究者应用蛋白质模型来找出哪些蛋白质序列的任务与特定的药物分子,这两个数值表示,转变成一个通用的、由一个神经网络共享空间。他们在已知protein-drug交互训练网络,它允许学习特定功能的蛋白质关联drug-binding能力,无需计算的任何分子的三维结构。


“有了这个高质量的数值表示,该模型可以完全短路原子表示,从这些数字预测这种药物是否会绑定,”辛格说。“这是你的优势避免需要经过一个原子表示,但数量仍有你所需要的所有信息。”


这种方法的另一个优点是,它考虑了蛋白质结构的灵活性,可以“饱满”,并承担与药物分子交互时形状略有不同。

高亲和力

使他们的模型不太可能被诱饵药物分子,研究人员还包含一个训练阶段基于对比学习的概念。在这种方法中,研究人员给模型的例子“真正的”药物和冒名顶替者,教它区分他们。


之后,研究人员对他们的模型进行了测试筛选图书馆约4700个候选药物分子的能力结合的一组51酶蛋白激酶。


从顶部,研究者选择了19个药物对测试实验。的实验显示,19支安打,12都有很强的亲和力(摩尔范围内),而几乎所有的许多其他可能的药物对没有亲和力。四个双绑定极高,sub-nanomolar亲和力(如此强大,一个很小的药物浓度,十亿分之几的顺序,将抑制蛋白质)。


尽管研究人员主要关注筛选小分子药物在这项研究中,他们现在正致力于将这种方法应用于其他类型的药物,如治疗性抗体。这种建模也可能用于运行潜在的药物化合物的毒性屏幕,以确保他们没有任何不必要的副作用在测试之前在动物模型。


“药物发现的一部分原因是这么贵是因为它具有较高的失败率。如果我们能减少失败率的前期说这种药不太可能奏效,还有很长的一段路要走,降低药物研发成本,”辛格说。


参考:辛格R, Sledzieski年代,布赖森B,考恩L,伯杰B对比学习蛋白质语言空间预测药物和蛋白质之间的相互作用的目标。《美国国家科学院刊。120 (24):e2220778120。2023;doi:10.1073 / pnas.2220778120


这篇文章被转载从以下材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。

广告
Baidu