人工智能裂缝蛋白质生物学的一个50岁的问题
信贷:Unsplash语。乔杜里。
阅读时间:
英国公司DeepMind无疑解决了生物学面临的最大挑战之一几十年来——“蛋白质折叠问题”——用一个人工智能系统称为AlphaFold。1
一个老的新的解决方案,复杂的问题呢?
蛋白质分子机器进行支撑生命的生理过程,在人类和其他生物。研究蛋白质组,识别蛋白质,描述和分析生物学,蛋白质组学研究领域的焦点,已近年来在以惊人的速度和先进。
广泛和多种功能的蛋白质在很大程度上是与它们的形状和结构有关。蛋白质能够自己折叠成特定的形状和结构决定如何与其他分子的相互作用。以药理学为例;几乎所有药品引起人体的目标蛋白质的影响。因此,确定蛋白质结构是蛋白质组学研究的一个基本组成部分,并有着巨大的应用。然而,这不是一个容易由于存在大量的蛋白质,和各种不同的形状可以吸收。
“我们被困在这一个问题——如何蛋白质折叠——近50年。看到DeepMind产生一个解决方案,有个人在这个问题上工作了这么长时间,这么多停止和启动后,想知道如果我们到达那里,是一个非常特别的时刻,”教授约翰·蜕皮,联合创始人兼主席CASP, 新闻稿 。
多年来,一系列的分析技术已经开发出来,试图解决这个问题,包括x射线晶体学,低温电子显微镜和质量spectrometry-based方法。然而,这些方法可以复杂,成本高昂,整个研究项目——比如博士可以用来确定一个蛋白质的结构。
AlphaFold采用人工智能预测和确定蛋白质的结构和形状,被比喻成一种蛋白质“空间图”。“我们创造了一种引起神经网络系统,训练有素的端到端,试图解释这个图的结构,而在隐式图推理的建筑。它使用进化相关序列,多重序列比对(MSA)和氨基酸残基的表示对完善这张图,“说AlphaFold的开发者。
教授约翰·蜕皮和Krzysztof忠诚建立了蛋白质结构预测的关键评估(CASP) 1993年在蛋白质结构预测催化研究。CASP选择蛋白质结构研究小组最近被确定为目标来测试他们的预测方法的准确性。得分表,称为全球距离测试(GDT),范围从0 - 100,90年通常被认为是一个“竞争力”的结果。AlphaFold得分92.4 GDT所有目标。
系统能够发展一个强有力的预测蛋白质的物理结构和可以确定一个高度精确的结构在天。
开发人员说,“我们这个系统对准公开数据组成的~ 170000蛋白质结构的蛋白质数据银行与大型数据库包含未知结构的蛋白质序列。它使用大约128 TPUv3核心(大致相当于~ 100 - 200 gpu)碾过几周后,这是一个相对温和的计算在大多数大型先进的机器学习模型用于今天。”
“这计算工作代表蛋白质折叠问题上的一个惊人的进步,在生物学50岁的大挑战。之前发生了几十年该领域的许多人会预测。这将是令人兴奋的看到的许多方面,它将从根本上改变生物研究,”Ramakrishnan Venki教授,诺贝尔奖获得者,英国皇家学会主席 在一个 新闻稿 。
扩大科学知识的前沿
“AlphaFold惊人地准确模型允许我们解决蛋白质结构我们被困在了接近十年,重振我们努力理解细胞跨膜信号传播,”说教授Andrei领袖主任马克斯·普朗克发育生物学研究所。
在他们的声明中,开发人员点头蛋白质结构预测系统未来的潜在效用大流行应对策略。描述SARS-Cov-2蛋白质的结构,和它的人类蛋白质感染宿主细胞相互作用,一直是主要的研究集中了许多团体在过去的几个月里。“今年早些时候,我们预测几个SARS-CoV-2病毒的蛋白质结构,包括ORF3a,其结构是未知的,“DeepMind说。
同时支撑这个公告的数据尚未公布,它已经获得科学界的兴奋。
“今天宣布的发展给了我们更多的信心,人工智能将成为人类最有用的工具之一在扩大科学知识的前沿,我们期待着多年的辛勤工作和发现吧!”DeepMind结论。
参考:
1。
跳投J等。使用深度学习精度高蛋白质结构预测。14技术评估蛋白质结构预测(抽象的书)。https://predictioncenter.org/casp14/doc/CASP14_Abstracts.pdf。2020年11月30日通过。
广告