与机器学习化学毒性评估改善
阿姆斯特丹大学的研究人员,与同事一起在昆士兰大学和挪威水研究所开发出了一种战略评估化学品的毒性,使用机器学习。他们展示他们的方法在《环境科学与技术》杂志上的一篇文章中特殊问题“数据科学推进环境科学、工程和技术”。本研究中所开发的模型会导致实质性的改进相比传统的硅片的评估基于定量结构活性关系(构象)建模。
据研究人员介绍,使用机器学习可以大大提高分子的风险评估,在safe-by-design开发新的化学物质和评估现有的化学物质。后者的重要性这一事实说明了欧洲和美国化学机构上市大约800000种化学物质已经发展多年,但几乎没有知识的环境命运或毒性。
由于实验化学命运和毒性的评估需要多少时间,努力,和资源,建模方法已经用于预测风险指标。在特定的定量构效关系(构象)造型经常应用,相关的分子特性,比如原子排列和三维结构理化性质和生物活性。根据模拟结果(或测量数据,可用),专家分类分子分类定义例如全球协调系统的化学物质的分类和标签(gh)。为特定类别,分子然后进行更多的研究,最终更积极的监测和立法。
然而,这一过程固有的缺点,其中大部分可以追溯到定量构效关系模型的局限性。他们通常是基于非常均匀的训练集和假设一个线性结构活性关系进行推断。因此,许多化学物质定量构效关系模型不是由现有的优秀代表和他们的使用可能会导致大量的预测错误和错误分类的化学品。
跳过构象预测
在环境科学与技术发表的论文,博士sa Samanipour和合作者提出另一种评估策略,对构象预测步骤。环境分析Samanipour阿姆斯特丹大学的科学家的范t霍夫分子科学研究所博士与安东尼娅Praetorius,环境化学家研究所生物多样性和生态系统动力学相同的大学。昆士兰大学的同事们一起和挪威水研究所,他们开发了一个基于机器学习策略的直接分类急性水生生物毒性的化学物质基于分子描述符。
该模型开发和测试通过907鱼类急性毒性实验获得数据(LC50 96 h值)。新模型跳过毒性的明确的预测价值为每个化学(96 h LC50),但是直接将每个化学分为许多预定义的毒性类别。这些类别例如可以定义为特定的法规或标准化系统,与gh在本文展示类别对急性水生风险。模型解释大约90%的方差的数据用于训练集和测试集数据的80%左右。
更高精度的预测
这直接分类策略导致了五倍的减少不正确的分类策略相比,基于构象的回归模型。随后,研究人员扩大战略预测毒性类别的一套大型的32000种化学物质。
他们证明直接分类方法导致更高精度的预测实验来自不同来源的数据集,因为不同的化学家庭可以组合生成更大的训练集。它可以适应不同的预定义的类别规定的各种国际规则和分类或标签系统。在未来,直接分类方法还可以扩展到其他风险类别(如慢性毒性)以及环境命运(如流动或持久性)和显示巨大的潜力为提高in-silico化学危害和风险评估的工具。
参考:O ' brien JW Samanipour年代,里德MJ,托马斯•KV Praetorius a从分子描述符到内在鱼毒性的化学物质:化学优先级的另一种可选方法。环境科学工艺。2022年。doi:10.1021 / acs.est.2c07353
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。