规模和速度在蛋白质组学数据处理
蛋白质组学可以定量分析成千上万的生物样品中的蛋白质,提供健康的生理功能和疾病状态的深入见解。而蛋白质组学还没有一个主流的分析方法采用医学,它是将促进个性化和精密医学在未来,特别是通过生物标志物的发现。然而,在这个空间的一个关键挑战是数据的规模生产。蛋白质组学的研究,特别是基于质谱(MS)的蛋白质组学分析,产生巨大的数据集需要后续分析。
针对蛋白质组学创业ProteiQ生物科学最近宣布推出InfineQ,其基于云的解决方案软件实时处理的蛋白质组学数据。188金宝搏备用与Arnoud Groen,方案和ProteiQ创始人之一,了解更多关于它所提供的解决方案以及所需的规模和速度生物标志物的发现。
莫莉·坎贝尔(MC):你能解释一下为什么MS-DIA蛋白质组学数据的分析可以特别复杂,并提供背景信息ProteiQ生物科学的发展?
Arnoud Groen (AG):回答你第一个问题,主要有两种形式的蛋白质组学研究:1)基于抗体的蛋白质组学方法和2)质谱(MS)的蛋白质组学方法。MS-based蛋白质组学比基于抗体的方法更复杂,因为增加的数量的参数需要控制,然而,它提供了更自信的识别和目标(蛋白质)的更多信息,如转录后修饰,亚型等。
MS-proteomics内,数据独立收购(DIA)女士特别复杂的比其他两个主要数据采集方法、数据采集(DDA)的依赖和选择反应监测(SRM)。
最基本的原因是失去完整的肽及其片段之间的直接连接,用于识别。比喻,将数据连接到实际的蛋白质信息的难题已成为更复杂,多次和DIA蛋白质组学的出现使得对计算机科学领域更多。
ProteiQ开始作为一个生物标志物的发现公司关注运动和健康。我们的第一个主要目标是创建一个蛋白质面板客观诊断非功能性过度延伸(NFOR)运动员。虽然这工作仍在进行中,ProteiQ仍具有较高的兴趣在这方面,它不再是我们的主要的商业模式。
这是因为我们意识到我们已经使用的技术为我们的生物标志物的发现,DIA,我们可以更广泛的应用于许多其他挑战在生命科学的研究。DIA方法和MS-based蛋白质组学具有重要和非常多才多艺的潜力,目前没有得到充分利用,特别是在生物标志物发现工作由于其表面上的复杂性。
这是一个经典的鸡和蛋的问题。我们认为这是最重要的一个方向,proteomics-based生物标志物发现需要开发以用于医疗诊断。因此,我们开发了自己的云计算处理管道DIA MS-based蛋白质组学,现在正在与女士实验室和研究小组/制药公司在其应用程序范围的医疗挑战。
主持人:InfineQ建立在吗DIA-NN。请您能告诉我们关于这个DIA-NN InfineQ如何不同?
AG:用一个比喻,DIA-NN是我们内部引擎。就像一辆车,引擎是最重要的特性之一。就像在汽车设计和制造,InfineQ添加附加功能的引擎,提高汽车的性能。例如,InfineQ增加了可扩展性的云,本机cross-run对齐在样品和改进后处理。这些特性是非常重要的对于高通量,大型队列研究。有些功能我们提前一点,像识别转录后修饰,在InfineQ可用,但尚未在DIA-NN。
DIA-NN的发展和InfineQ也不是相互孤立的。它是一个连续的合作由单一经营,改进扩展到大型队列研究的规模。
主持人:InfineQ如何实现实时处理的蛋白质组学数据?为什么这个很重要?
AG:一个直截了当的回答这个问题,研究人员不愿意等待几天或几周内处理数据。获取MS-based蛋白质组学数据已经花大量的时间,取决于大小的研究课程,但它可以在很大程度上是并行运行如女士通过购买更多的工具。然而,考虑到信号处理,这不是简单的。如果不优化算法对于高通量,只是有更多的电脑不会有帮助。
InfineQ用三种方法来解决这个问题。首先,由于云解决方案,可以并行数据处理,导致更短的数据处理时间和删除队列的大小的限制。我们使用serverless k8方法每次运行分割成多个并行处理。代码也是优化的效率和速度的处理——这已经是DIA-NN的一部分。其次,多个用户在一个实验室或研究所工作都可以做他们的工作并行云:没有必要等待彼此的工作要完成,因为单独的许可证或计算机能力的缺乏。第三,由于可伸缩性瓶颈,可以添加到其他算法提高结果的质量为用户没有任何可观察到的负面影响。
主持人:蛋白质组学分析的交付的一个主要瓶颈在诊所是所需数据加载和随后的时间进行分析。在您看来,InfineQ可帮助缓解这个瓶颈呢?
AG:样品采集后的处理时间减少的主要焦点InfineQ。说到此,获得的数据在临床的实际应用(治疗)设置仍有很长一段路要走。这时ProteiQ的主要目标是医学研究和应用之间的桥梁,通过创建一个健壮的发现管道也可以运行在监管环境中,例如临床二期研究。然而,额外的步骤和方需要将结果转化为认证的诊断测试。
主持人:你能提供任何临床蛋白质组学领域的研究人员的例子,采用InfineQ分析他们的工作是什么?
AG:InfineQ目前在公共测试版,我们正在测试两组。
第一个应用程序的技术是解决硅胶乳房植入手术相关的并发症在Bioflagz隆胸的女性的创业公司。他们正在开发一种直接面向消费者蛋白质生物标记测试更好地预测这些并发症。
主持人:你能谈谈InfineQ易用性?
AG:这是我们的关键目标之一。你可以点击“观看演示”在infineq.com上看到软件在行动:它实际上只需要三个步骤。对用户而言,所有内部工作,如校准是自动完成的。最终结果是量化的肽和蛋白质的列表,用户可以立即开始工作。
此外,我们正在做一个额外的选项为用户熟悉编码。新的应用程序编程接口将允许编程访问InfineQ并可能询问结果直接在云上。将来还会有其他功能来将直接从InfineQ允许简单的分析数据的接口。
ProteiQ Arnoud Groen、方案和创始人之一,与莫莉坎贝尔说,科普作家、技术网络。188金宝搏备用