人类与机器:谁更好的预测蛋白质结构?
一项新的研究使蛋白质专家和一种新的人工智能程序在最近的一次人机大战中。考试吗?冠的最佳预测成功的蛋白质结构。
维南达花了20多年研究错综复杂的蛋白质,高度复杂的物质存在于所有的生物。罗格斯大学科学家一直考虑氨基酸组成蛋白质的独特模式如何确定他们是否成为从血红蛋白胶原蛋白,以及随后的,神秘的自组装的步骤,只有某些蛋白质聚集形成更为复杂的物质。
所以,当科学家想进行一个实验让人类——一个深刻的,直观的理解蛋白质设计和自组装,对人工智能计算机程序的预测能力,南达,研究员先进的生物技术和医学中心在罗格斯(CABM),是一个列表的顶部。
现在,结果看谁或者什么可以做得更好在预测蛋白质序列将结合最成功的。南达和伊利诺斯州的阿贡国家实验室的研究人员和他的同事们从全国各地,报告在化学性质这场战斗是接近,但决定性的。竞争匹配南达和几个同事一个人工智能(AI)项目已经赢了,稍稍的计算机程序。
科学家们深感兴趣蛋白自组装,因为他们相信理解它更好的可以帮助他们设计一系列革命性的产品用于医学和工业用途,比如人工人体组织创伤和催化剂新化工产品。
“尽管我们丰富的专业知识,人工智能在多个数据集一样好或更好,显示机器学习来克服人类的巨大潜力偏见,“南达说,生物化学和分子生物学教授罗格斯罗伯特。伍德。约翰逊医学院。
蛋白质是由大量的氨基酸加入。链折叠形成复杂的三维分子形状。每个蛋白质的确切形状以及它所包含的氨基酸,决定了它。一些研究人员,如南达,参与“蛋白质设计”创建序列,产生新的蛋白质。最近,南达和一组研究人员设计合成蛋白质快速检测VX,危险的神经毒气,对新的生物传感器和治疗铺平了道路。
原因在很大程度上是未知的,蛋白质会与其他蛋白自组装形成上层建筑重要的生物学。有时,看起来蛋白质设计后,比如当他们自组装成一个病毒的保护性外壳,称为衣壳。在其他情况下,出现问题时,他们自组装,形成致命的生物结构与多种疾病,如阿尔茨海默氏症和镰状细胞。
“理解蛋白自组装是取得进展的基础在许多领域,包括医学和工业,“南达说。
在这项实验中,南达和五个其他同事给出一组蛋白质和被要求预测哪些可能会自组装。他们的预测相比,由计算机程序。
人类专家,运用经验法则基于他们观察蛋白质的行为实验,包括电荷模式和水的厌恶程度,选择11蛋白质预测将自组装。计算机程序,一个先进的机器学习系统的基础上,选择了9个蛋白质。
人类是正确的六出11他们选择的蛋白质。计算机程序获得了更高的百分比,六出九它推荐的蛋白质能够自组装。
实验表明,人类专家“青睐”一些氨基酸,有时会导致他们不正确的选择。此外,计算机程序正确地指出,一些蛋白质品质,不让他们明显的选择自组装,打开门,进一步调查。
经验使南达,一次抱怀疑态度的蛋白质组装机器学习的调查,更开放的技术。
“我们努力得到一个基本的认识相互作用导致自组装的化学性质,所以我担心用这些程序可以防止重要的见解,“南达说。“但我开始真正理解,机器学习只是另一种工具,像任何其他。”
参考:巴特拉R,吕弗勒TD,陈H, et al。机器学习克服了自组装多肽的发现人类的偏见。Nat化学。2022:1-9网上公布10月31日。doi:10.1038 / s41557 - 022 - 01055 - 3
本文从以下转载材料。注:材料可能是长度和内容的编辑。为进一步的信息,请联系引用源。