蛋白质组学研究进展
蛋白质组学蛋白质组的研究是一个不断发展的领域。它提供了一个全球理解的分子过程,在细胞,组织和整个生物的生物状态。包括人类、动物和植物生物学、个性化医学和法医学在内的各个科学研究领域都受益于快速发展,这在很大程度上归功于蛋白质组学技术、数据处理能力和数据共享的进步。在本文中,我们将探讨蛋白质组学的一些最新进展及其潜在的更广泛的影响。
关键技术发展
质谱蛋白质组学
一个分析技术的多样性在蛋白质组学研究中被广泛采用,可分为低通量和高通量。几十年来,质谱法一直是高通量分析中使用最广泛的“金标准”技术。现在存在无数基于ms的蛋白质组学工作流程,具有样品制备技术、质量分析仪和数据软件管道的独特组合。从历史上看,MS-based蛋白质组学面临的一个关键问题是仪器的敏感性和特异性.
近年来,MS的前景发生了巨大变化;供应商推出了具有速度、灵敏度和特异性的MS仪器,这是以前闻所未闻的。“我们已经看到了质谱仪器灵敏度的巨大飞跃,以及液相色谱与质谱(LC-MS)耦合的进展。不久以前,蛋白质组学研究只能描述几百种最丰富的蛋白质,今天我们可以在相对快速的实验中看到数千种蛋白质。哈维·约翰斯顿博士他是英国剑桥Babraham研究所Rahul Samant团队的博士后研究科学家。最终,科学家们可以比以往任何时候都更深入地研究蛋白质组。
Matthias Mann教授他是诺和诺德基金会蛋白质研究中心蛋白质组学项目的研究主任和小组组长,慕尼黑马克斯-普朗克生物化学研究所主任,也是世界上被引用次数最多的科学家之一。当被问及MS蛋白质组学的具体突破时,Mann说,”当然是朝着数据独立采集(DIA)由Aebersold实验室首创。”他的想法得到了Johnston的响应,他选择了DIA——也被称为所有理论质谱(SWATH-MS)的连续窗口获取——在他的进步列表中,对该领域具有重要意义。
不像它的姐妹技术-数据依赖分析(DDA)- DIA片段所有在串联MS (MS1)的第一个周期中产生的前体离子在第二个周期(MS2)中,提供了一个无偏倚的分析,更大的蛋白质组覆盖范围和更高的再现性.近年来,基于dia的MS在蛋白质组学研究中的应用,特别是在肿瘤学领域,持续增长。2019年,42项针对几种不同癌症类型并利用各种生物材料的已发表研究采用了DIA-MS蛋白质组学分析.DIA还在神经科学蛋白质组学领域掀起了波澜得到了好评因为他发现了有关阿尔茨海默病的新信息。
人们正在不断探索加速基于dia的MS的方法——被称为“超快速”蛋白质组学——最近的一项研究证实了43个并确定了11个新的血浆蛋白质组生物标志物COVID-19严重性.约翰斯顿说,DIA-MS正在帮助蛋白质组学达到严格的标准化状态:“将相同的样本发送到多个蛋白质组学实验室,由于不同的工作流程、仪器、分析工具和设置等,有时你会收到相当不同的结果。然而,这种情况正在通过现代方法得到改善,尤其是DIA.”
磷酸化肽翻译后修饰位点定位与异构体分化
翻译后修饰(PTM)通过碰撞诱导解离MS/MS对磷酸化肽进行位点定位和定量是具有挑战性的,而且磷酸化肽可以表现出磷酸基的部分中性损失。下载此应用程序注意,了解电子激活的解离破碎如何显示出对不稳定pms稳健和准确量化的有前途的性能。
查看App
赞助内容
磷酸化肽翻译后修饰位点定位与异构体分化
翻译后修饰(PTM)通过碰撞诱导解离MS/MS对磷酸化肽进行位点定位和定量是具有挑战性的,而且磷酸化肽可以表现出磷酸基的部分中性损失。下载此应用程序注意,了解电子激活的解离破碎如何显示出对不稳定pms稳健和准确量化的有前途的性能。
查看App赞助内容
基于适体的蛋白质组学及其他
虽然MS已主导蛋白质组学研究领域多年,但最近出现了“第二代”蛋白质组学平台利用基于适体的技术而不是抗体。讨论这些技术,本杰明·奥斯本医生约翰霍普金斯大学医学院的研究人员说写“尽管LC-MS在蛋白质组学领域已经垄断了几十年,但显然不再是这样了。”
适体是短的单链(ss) DNA分子,能够形成独特的确认,允许它们选择性地结合到生物靶标,如蛋白质。该技术提供了特异性和选择性,在诸如生物标志物的发现,其中,MS蛋白质组学受到其动态范围的限制。约翰斯顿说:“这是典型的MS生物标志物发现领域的最大挑战,在血液中许多潜在的生物标志物可能远低于白蛋白浓度的万亿分之一。”“质谱会尝试分析每一粒干草,看看是否有针,另一方面,抗体或适体的使用就像磁铁一样。”如果没有有效的方法,白蛋白和其他高含量的蛋白质会淹没质谱分析。
最近利用基于适体的蛋白质组学的研究实例包括识别非酒精性脂肪性肝病(NAFLD)中基于蛋白质的纤维化(肝脏瘢痕)特征,NAFLD是全球肝脏疾病的最大原因之一。Corey等人在肥胖和NAFLD队列中进行了多重分析,以确定一个8种蛋白质组不同阶段的NAFLD.
基于适体的蛋白质组学被用于一种研究来自著名的弗雷明汉心脏研究的1895名女性参与者,以确定心脏重塑和心衰事件的生物标志物。17种蛋白质被发现与超声心动图特征相关,6种蛋白质与意外心力衰竭相关。利用遗传变异数据进行的进一步分析进一步支持了这些发现。
“与LC-MS技术相比,适体技术的使用似乎更少地受到细胞中绝对蛋白质拷贝数的影响。”写Orsburn。然而,直到所使用的面板能够识别更高百分比的蛋白质组,质谱蛋白质组学可能仍然是首选的方法,以适体为基础的技术作为补充方法。一个最近提出的期望蛋白测序平台该技术采用条形码DNA适体来识别肽的末端氨基酸,连接到下一代测序芯片,可能会提供一种折衷方案。然而,约翰斯顿说:“它的全部潜力需要时间才能实现。”
抗击COVID-19
与COVID-19的战斗只从检测开始,以确定谁感染了谁没有感染。为了加速有效应对,我们必须从最初的诊断转向预后:下载本白皮书,了解以下问题的答案:谁有患严重疾病的风险,是否有更好的方法来寻找和测试候选药物和/或疫苗,以及长期影响是什么。
视图白皮书赞助内容
人工智能“促进”蛋白质组学
可以说,近年来蛋白质组学的最大进步之一是基于人工智能(AI)的方法提供的“推动”。机器学习、深度学习和其他人工智能方法正在应用于蛋白质组学分析的各个阶段管道.
人工智能和药物发现蛋白质组学
人工智能(AI)在蛋白质组学中的应用已经在重塑药物发现景观。了解特定蛋白质相互作用的方式和原因对于推进细胞生物学、开发新药和确定药物如何引起治疗和不良反应至关重要。然而,这并非易事。“为了理解相互作用的蛋白质是如何相互连接的,人类或计算机必须尝试所有可能的连接组合,以找到最合理的连接组合[…]这是一个非常耗时的过程,”他说Octavian-Eugen Ganea*麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)博士后研究员。
当研究人员想要捕捉以前未知的相互作用时,进一步的复杂性就出现了可以存在于一大堆蛋白质中——比如人类的蛋白质组。Ganea将这比作拼凑一个大型3D拼图。基于人工智能的方法——尤其是深度学习——提供了一种解决方案。它们可以加速拼凑3D拼图的过程,这是Ganea研究的重点。
什么是深度学习?
作为机器学习的一个子集,深度学习包括模拟大脑行为的神经网络。这些神经网络能够从大量数据中“学习”。
有几种商业化的蛋白质对接方法,但它们依赖于候选抽样、模板和预先计算网格的特定任务特征——所有这些都在增加计算时间.Ganea和麻省理工学院的同事最近发表一种新的深度学习模型——EquiDock——可以获取两种蛋白质的3D结构,并直接识别哪些区域可能相互作用。EquiDock学习从大量~41,000个蛋白质结构中捕获复杂的对接模式,使用具有数千个动态自动调整参数的几何约束模型,直到解决任务。训练完成后,该模型将与其他四个现有的对接软件进行比较。它能够在1到5秒内预测最终的蛋白质复合物;速度比现有软件快80-500倍。
Ganea说:“药物副作用的快速计算扫描就是一个例子。”“这是必要的,以显著减少天文搜索空间,否则我们目前所有的实验能力(甚至是全球范围的聚合)都是不可行的。”他强调,将EquiDock与其他蛋白质结构预测模型相结合,将进一步帮助药物设计、蛋白质工程、抗体生成和作用机制研究等应用。Ganea说,这是一个令人兴奋的前景,也是寻找更好疾病治疗方法的“迫切需要”。
优化基于ms的蛋白质组学
基于人工智能的方法也帮助研究人员从他们的数据中获得更多的见解:“人工智能正在彻底改变我们可以从数据中得到什么,”Mann说。
质谱实验需要数据库搜索或谱库匹配来鉴定蛋白质。这为某些蛋白质被错误识别或遗漏提供了机会,并且非常耗时。这一直是DIA MS的一个特殊障碍,它依赖于通过DDA分析生成谱库。多种深度学习方法现在已经建立能够预测光谱和肽的性质。例子包括-但不限于-恭喜,DeepMass最近DeepDIA.预计预测的谱库(能够优化DIA方法)将使蛋白质组学领域朝着这个方向发展方法.
人工智能在非质谱蛋白质组学中的应用
在基于ms的方法之外,人工智能在分析蛋白质运动的编排方面也取得了进展,这是一个研究领域,对于理解以纠缠、聚集的蛋白质为特征的病理是不可或缺的阿尔茨海默病.显微镜和Förster共振能量转移(FRET) -这一领域采用的关键方法-生成需要时间和专业知识来分析的大型数据集。为了克服这一数据困难,诺和诺德基金会蛋白质研究中心的研究人员,由教授Nikos Hatzakis,最近创建的DeepFRET.DeepFRET是一种机器学习算法,可以识别蛋白质运动模式,在几秒钟内对数据集进行分类,而通常需要几天的工作。
在人工智能平台必须支持的标准、数据报告和共享方面,人工智能在蛋白质组学中的未来将需要跨组的同步性。官方的建议,比如最近发布的数据、优化、模型、评估(DOME)在蛋白质组学和代谢组学中进行和报告机器学习的建议可能有助于塑造该领域的未来。
更广泛的应用
蛋白质组学还有更广泛的应用,这些应用也受益于前面讨论的技术进步,例如法医学。发生在20世纪后半叶的“DNA革命”极大地改变了这一领域。现在,蛋白质组学似乎也将产生类似的影响.格伦登·帕克博士他是加州大学戴维斯分校环境毒理学系的兼职副教授,也是基于蛋白质的人体识别的发明者,他说,总的来说,目前蛋白质组学对法医科学的影响是有限的,这归因于技术、法律、财务和文化因素。然而,“在刑事调查和起诉中采用和采用新方法是一种根本的动力。蛋白质组学有内在的优势:蛋白质比DNA更稳定,而且像DNA一样,可以包含识别信息,”他补充道。
在核酸被降解的情况下,蛋白质组学可用于识别体液、性别、种族,并利用肌肉、骨骼和分解来估计死亡的大致时间液体样品.
Parker强调,虽然实施一直是一个挑战,“在未来,蛋白质组学有潜力显著改变证据的处理和分析方式。然而,在短期内,该领域以DNA为中心的方面确保了蛋白质组学将被用于DNA难以提供清晰、容易辩护的答案的领域。”
挑战与未来展望
民主化蛋白质组学
可以说,蛋白质组学领域面临的最大限制是其错综复杂.蛋白质组学工作流程包括复杂的技术和软件,需要熟练的人员来操作。虽然在灵敏度和速度上的惊人进步推动了研究,但它们是有代价的。约翰斯顿说:“严格执行、深度覆盖的质谱实验,特别是在复杂的生物样本上,需要大量的质谱时间。”“因此,在成本、覆盖率和样本量之间总是要进行权衡。”
这个问题限制了蛋白质组学更广泛的应用。在具体讨论法医学时,Parker说:“最终,这些因素结合起来普遍限制了创新,包括蛋白质组学在内的有前途的新兴技术没有得到充分利用。”
在过去的十年里,要求蛋白质组学“民主化”的呼声越来越高。为了提高可获得性和可持续性,已经出现了一些举措。一个例子是欧洲蛋白质组学基础设施联盟提供访问(EPIC-XS)联盟.该计划将欧洲一些领先的实验室和科学家联合起来,汇集各种技术、专业知识和数据共享。
资源并不局限于基于ms的蛋白质组学。专业知识也由KTH访问站点的细胞分析设施在抗体成像中。”这些技术库确保EPIC-XS平台能够很好地考虑蛋白质组学各个领域用户的应用,”乌得勒支大学项目经理Martina O 'Flaherty说。
去诊所的路
在蛋白质组学被确立为临床的支柱之前,有几个挑战需要克服,这些挑战取决于临床蛋白质组学的特定子应用正在讨论.
Mann说:“基于ms的蛋白质组学需要变得更加强大和易于使用,特别是如果它要大规模应用于临床的话。”“许多研究小组已经转向高流量色谱系统来实现这一目标,但这并不理想,因为灵敏度下降了。”虽然分析技术能够更深入地挖掘蛋白质组,但产生的数据量也在增长,这为临床蛋白质组学引入了一个额外的瓶颈,即从如此庞大的数据集中处理数据并制定生物学和临床假设。
此外,为了全面了解人类健康和疾病,蛋白质组学数据通常必须与其他“组学”数据相结合,如代谢组学、基因组学和转录组学。
道德的考虑也必须考虑蛋白质组学走向临床。蛋白质组分析可以提供原始诊断查询之外的信息,激发了测试。临床医生如何处理这些数据?虽然可以从临床基因组学的实施中吸取教训,但这些领域是不同的,在制定监管框架和指导方针时必须承认这一点,专家强调.
尽管目前的限制,Mann相信该领域的未来是光明的:“我预见到将继续走向临床应用,其中MS检测的固有特异性是无价的,”他总结道。
*188金宝搏备用科技网络对屋大维-欧根·加尼亚博士的死讯深感悲痛最近的传递.我们要感谢他对科学界的杰出贡献以及他对计算生物学领域的贡献。我们与那些因他的去世而受到影响的人们同在。