蛋白质的ChatGPT预测结构
一种新的人工智能工具可以根据酶的氨基酸序列预测酶的功能,即使这些酶尚未被研究或了解甚少。研究人员表示,这款名为CLEAN的人工智能工具在准确性、可靠性和灵敏度方面超过了最先进的工具。更好地理解酶及其功能将有利于基因组学、化学、工业材料、医学、制药等领域的研究。
研究负责人说:“就像ChatGPT使用书面语言的数据来创建预测性文本一样,我们正在利用蛋白质的语言来预测它们的活动。赵家他是伊利诺伊大学香槟分校的教授化学和生物分子工程.“几乎每个研究人员在研究一个新的蛋白质序列时,都想马上知道蛋白质的功能。此外,在为生物学、医学、工业等任何应用制造化学品时,该工具将帮助研究人员快速确定合成化学品和材料所需的适当酶。”
研究人员发表了他们的发现发表在《科学》杂志上,并使CLEAN可在线访问。
随着基因组学的进步,许多酶已经被识别和测序,但科学家们对这些酶的作用知之甚少或根本没有信息卡尔沃斯基因组生物学研究所在伊利诺斯州。
其他计算工具试图预测酶的功能。通常,他们试图通过将查询的序列与已知酶的目录进行比较,并找到相似的序列,来分配酶的委托编号(表明酶催化哪种反应的ID代码)。然而,这些工具对于研究较少或未被描述的酶,或执行多项任务的酶,效果不佳,赵说。
“我们不是第一个使用人工智能工具来预测酶的委托数量的公司,但我们是第一个使用这种名为对比学习的新型深度学习算法来预测酶功能的公司。我们发现这种算法比其他人使用的人工智能工具要好得多。”“我们不能保证每个人的产品都能被正确预测,但我们可以得到比其他两种或其他三种方法更高的准确性。”
研究人员通过计算和体外实验验证了他们的工具。他们发现,该工具不仅可以预测以前未被描述的酶的功能,还可以纠正被领先软件错误标记的酶,并正确识别具有两种或多种功能的酶。
赵的团队已经做出了CLEAN访问在线其他研究人员寻求酶的特性或确定酶是否能催化所需的反应。
赵说:“我们希望这个工具能被广泛的研究团体广泛使用。”“通过网络界面,研究人员只需在搜索框中输入序列,就像搜索引擎一样,就能看到结果。”
赵说,该小组计划扩展CLEAN背后的AI来表征其他蛋白质,比如结合蛋白。该团队还希望进一步开发机器学习算法,以便用户可以搜索所需的反应,人工智能将指出合适的酶来完成这项工作。
“有很多未鉴定的结合蛋白,比如受体和转录因子。我们也想预测它们的功能。”“我们希望预测所有蛋白质的功能,这样我们就可以知道一个细胞的所有蛋白质,更好地研究或设计整个细胞,用于生物技术或生物医学应用。”
参考:余涛,崔浩,李建春,罗勇,姜刚,赵慧。基于对比学习的酶功能预测。科学.2023, 379(6639): 1358 - 1363。doi:10.1126 / science.adf2465
本文已从以下地方重新发布材料.注:材料的长度和内容可能经过编辑。如需进一步信息,请联系所引用的来源。