帮助人工智能学习化学的语言
研究人员设计一种机器学习算法,预测的结果与精度远高于化学反应训练有素的化学家和显示方法,使复杂的分子,消除药物发现的一个重要障碍。
剑桥大学的研究人员已经证明,一个算法可以预测复杂化学反应的结果的准确率超过90%,表现优于训练有素的化学家。算法还显示了化学家如何使目标化合物,提供化学“地图”到所需的目的地。在两项研究结果报道期刊ACS中央科学和化学通讯。
药物发现的主要挑战和材料科学是设法使复杂有机分子的化学结合简单的构建块。问题是那些积木通常以意想不到的方式反应。
“分子通常被描述为一种艺术与试错实验意识到,因为我们理解化学反应还远远没有完成,“从剑桥大学卡文迪许实验室αLee博士说,他领导了这项研究。“机器学习算法可以更好地理解化学,因为他们蒸馏反应性化学反应从数以百万计的出版模式,化学家不能做的事情。”
李教授和他的团队使用工具开发的算法在模式识别的识别分子中基团的化学反应,通过训练模型在数以百万计的反应在专利发表。
研究人员观察了化学反应预测作为机器翻译问题。反应分子被认为是作为一个“语言”,而产品被认为是一种不同的语言。模型然后使用模式在文本中学会两种语言之间的“翻译”。
使用这种方法,该模型在预测准确率达到90%正确的看不见的化学反应的产物,而人类化学家训练的准确性是80%左右。研究人员说,该模型足够准确的探测数据中的错误和正确预测大量困难的反应。
该模型还知道它不知道什么。它产生不确定性的分数,这消除了不正确的预测准确率达到了89%。实验是耗时的,准确的预测至关重要,以避免追求昂贵的实验途径,最终以失败告终。
在第二项研究中,李教授和他的团队,与生物制药公司辉瑞合作,展示了实际的药物发现的潜在的方法。
研究人员表明,当训练在化学研究发表,该模型可以准确的预测基于实验室笔记本反应,表明模型具有学习化学和规则可以应用于药物发现设置。
团队还显示,该模型可以预测的反应会导致序列所需的产品。他们这种方法适用于不同的药物如分子,表明它预测的步骤在化学上是合理的。这种技术可以显著降低临床前药物发现的时间,因为它为药用化学家提供了一个蓝图的开始。
“我们的平台就像一个GPS化学奖,”李说,他也是一个在圣凯瑟琳学院研究员。“这告诉化学家反应是一个走或不方便,是否以及如何导航反应路线做出新分子。”
剑桥大学的研究人员正在利用这个反应预测技术来开发一个完整的平台,在药物发现桥梁design-make-test周期和材料发现:预测有前途的生物活性分子,方法让那些复杂的有机分子,选择实验,是最丰富的。研究人员目前正在致力于从模型中提取化学观点,试图理解它已经认识到人类没有的。
“我们可能赚很多化学的进步,如果我们学习什么样的模式模型观察做出预测,”彼得说事故,在合成有机化学博士生参与了两项研究。”模型和人类一起化学家将变得极其强大的设计实验,比其他都没有。”
温顿计划支持的研究物理的可持续性和史密斯Herchel基金。
引用:
菲利普Schwaller et al。分子变压器:Uncertainty-Calibrated化学反应模型的预测。“ACS中央科学(2019)。DOI: 10.1021 / acscentsci.9b00576
α李et al。分子变压器结合反应预测和retrosynthesis在医药化学空间。化学通讯(2019)。DOI: 10.1039 / C9CC05122H
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。