我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

机器学习可以帮助实现更大的蛋白质组分析的深度


想要一个免费的PDF版本的这个行业洞察力?

完成下面的表格,我们将电子邮件您的PDF版本“机器学习有助于实现更大深度的蛋白质组分析”

188金宝搏备用科技网络有限公司需要您提供的联系方式联系你关于我们的产品和服务。你可以随时取消订阅这些通讯。如何取消订阅的信息,以及我们的隐私实践和承诺保护你的隐私,看看我们隐私政策

近年来,我们已经看到增加的应用人工智能(AI)的方法,如机器学习,在各种各样的生物学科。


蛋白质组学的研究领域,为细胞生物学提供了无与伦比的见解,与潜在应用包括现代医学、食品科学、农业和系统生物学。在过去的十年里,蛋白质组学研究领域拥有先进的迅速。


我们现在可以研究更多的蛋白质比以往任何时候都使用越来越小的样本量,以更高的速度和增加灵敏度。这种复杂性是归因于创新分析技术,如质谱(MS)。但是科学家们如何去更深还在他们的蛋白质组分析?


今年早些时候,188金宝搏备用执行副总裁与Rohan Thakur生命科学质谱在力量Daltonics,力量是如何帮助研究人员“更上一层楼”,在蛋白质组学达到新的高度。

自从那次谈话,力量推出小说CCS-enabled TIMScore™算法,可以利用timsTOF Pro 2, timsTOF HT, timsTOF SCP和timsTOF fleX系统,除了蒂姆DIA-NN 4 d-proteomics™软件。


了解机器学习方法和新的软件功能正在帮助蛋白质组学研究人员获得更大深度的分析,188金宝搏备用最近采访了Tharan Srikumar生物信息学的产品经理,力量Daltonics。在这次采访中,Srikumar解释了小说TIMScore算法如何克服挑战胰蛋白酶的磷酸化肽,分析讨论了蒂姆斯DIA-NN 4 d-proteomics软件的功能和改善蛋白质组学工作流程的效率。


莫莉·坎贝尔(MC):你能给我们的读者解释如何TIMScore算法和力量的客户记住了吗?


Tharan Srikumar (TS):在过去的几年里,我们已经证明,timsTOF技术适用的硬件方面,我们已经能够利用硬件与几个不同的采集方法。一个例子——猎枪蛋白质组学方法,标准数据依赖收购(DDA)并行积累串行碎片(PASEF®)方法被开发。数据独立收购(DIA),我们开发了dia-PASEF®,最近,我们已经添加了平行反应监测(人口、难民和移民事务局)prm-PASEF®作为收购目标应用程序的方法。我们没有免费软件解决方案,充分利用蒂姆斯技术进行数据分析。我们认为这是一个机会,因为我们没有利用的所有信息被提供给我们的乐器。


这条线的思想导致了我们的第一次尝试让更多的碰撞截面(CCS)的信息出现在数据。这生TIMScore,从概念上讲,是非常简单的。这个想法是如果你知道真正的价值——真正的CCS给定肽在给定的电荷状态,那么您可以比较你的测量。然后你应该能够创建一个相对分数或法官多好,测量相比,你的参考价值或你的真正价值。不幸的是,我们没有这样的信息所有潜在的多肽,是可以衡量的,所以,我们认为,下一个最好的办法是建立一个预测模型,能给我们的预期值,或真正的测量值。这是什么使TIMScore的基础,我们建立了一个机器学习CCS值预测模型。它包括所有的胰蛋白酶的肽可以饲料到模型以及其他帖子翻译修改(天车),如磷酸化。磷酸化尤为关键训练我们的模型基于多功能天车的生物学意义。因此,该模型可以预测磷酸化以及磷酸化肽CCS的具有很高的准确性和重现性。我们使用这些预测CCS的评估测量值和基于多好,我们可以更好地解决歧义识别。


的光谱识别非常明显的分裂模式,没有其他TIMScore并不增加多少价值。更多的模糊识别,识别模糊,要么因为分裂模式不够清晰,或肽质量和测量肽之间的误差识别潜力更大,我们可以使用的关系如何预测CCS匹配测量CCS。我们可以用它来说,“这是一个假肽”,如果有一个假阳性,我们不应该占它,或说,“不,这不是一个假阳性,这是一个真实的比赛,我们想要使用数据集的识别”。此外,TIMScore允许在肽增强辨别分析减少歧义识别通过添加另一个关键维度区别分析。实际上,TIMScore维度允许标准的1%错误发现阈值是基于一个二维的决心,允许访问一些真正的识别,可能得分较低但仍有效的肽。


灰板(AB):困难与胰蛋白酶的分析和磷酸化肽以前,和软件如何克服这些挑战?此外,我们为什么要捕捉天车数据的上下文中研究蛋白质组和4 d-proteomics方法如何帮助生成这些信息吗?


TS:让我们考虑一个类比。说样品,我们看到的是一个房间,我们房间的门站很近。如果我们有一个窥视孔进房间,我们得到一个非常有限的空间本身的观点,但我们可能获得一些洞察什么房间里的家具,是谁在房间里,例如。


比较这能够打开门进了房间。你有更大的空间,可以创建一个更好的描述其实现在和发生。当然,如果你能介入,你得到一个完全身临其境的体验是在那个房间里。


如果我们从一个标准的猎枪蛋白质组学方法在其他平台上,或许,甚至在我们的旧的平台,你会盯着通过窥视孔。有一个有限的观点。你可以看到也许1000 - 3000蛋白和一些10000肽。它给你一个描述,或一个想法,是什么在房间里——或者样品。


TIMScore和PASEF,我们让你有一个更大的窥视孔,或能够完全打开门,走了进去,创建一个更广泛的观点是什么。后转译修饰(天车)在生物学扮演这样一个至关重要的作用。了解多功能天车的作用——或者识别什么天车存在——在数量和细胞内,对生物学的理解是至关重要的。现在有一个更深层次的、更广泛的观点,这将转化为我们的客户获得更深的了解他们正在研究的样本。


主持人:蒂姆斯DIA-NN软件有什么功能相比,以前的软件系统?


TS:蒂姆斯DIA-NN是我们第一次软件分析dia-PASEF数据。它是基于开源的,DIA-NN软件实验室的Markus Ralser教授瓦迪姆博士Demichev。我们的项目和一个更大的重视CCS测量本身。我们也集成到不是平台,所以你有一个工作流结束时自动触发你的收购。从用户的角度来看,你设置的实验中,测量timsTOF收购PC,包括设置你的处理方法。最后的收购商旅DIA-NN被触发,并有结果几分钟后等你。


你不再需要获得所有的数据,然后把所有的文件复制到你的电脑处理,开始分析,然后回来几个小时后检查数据质量,或者列是否堵塞。你现在有一个工作流,您设置和走开。如果你需要检查数据,你能来收购后几分钟,有一个结果文件等待你。当你想要比较的数据在整个项目,或者几十或几百个样品,你感兴趣,你可以将它们分组进行分析填写任何缺失的数据使用一个概念叫“匹配运行”。的效率这一概念也增加了CCS的使用。,你有一个完整的项目视图的所有蛋白质和肽被识别和量化,在这种情况下,整个项目。


阿瑟:为你,这力量客户案例研究这部小说真的证明了影响软件可以在蛋白质组学分析吗?


TS:我们一开始用回顾性分析,接触靖Ishihama教授的实验室京都大学在哪里发表了一篇论文这是探索磷酸化以及它如何影响CCS的价值观。我们一起工作的团队的现有数据集是否有任何收益由TIMScore。我们意识到,是的,有巨大的收益!我认为,我们看到在30 - 40%的范围,取决于你看肽或蛋白质水平。


我们不仅可以识别更多的磷酸化肽在这个特定的例子中,但我们也能够识别更多的磷酸化网站在同一置信水平。,我们不仅能够识别蛋白质的肽序列被磷酸化改性,但是我们也可以确定确切的氨基酸,这事件发生磷酸化。这意味着我们没有看到模糊的识别;我们可以定位到一个非常具体的残留物,这意味着一个更好的理解生物学信号。


我们建立了不是作为一个平台,不是我们现在的一部分集成TIMScore和蒂姆斯DIA-NN。一个常见的场景,我们看到可用的或者被利用进行小型试验研究建立光谱库,也许从分级数据集或从样品池。使用TIMScore,建立一个深入肽谱库,之前做一个更大的样本使用蒂姆斯DIA-NN加以研究。


然后你做这项研究印度模式在100 - 1000的样品。我们看到试点项目与几千样本,10000岁以上,甚至更大的项目计划使用的样本。集成的工作流和不让你做的就是密切关注整个项目的进展,但也得到反馈的数据块当你前进。一般来说,我们看到我们的客户转向DIA我们促进与不是平台。


主持人:你能讨论小说的影响软件系统对蛋白质组学领域?他们在多大程度上帮助克服数据瓶颈?


TS:我们的方法比通常是非常不同的。蛋白质组学最大的瓶颈之一就是你可以每天产生数以百计的样本——当然,您需要处理这些数据。


的一个简单的路线被迁移到“云”,在那里你可以扩展需求计算。但再一次,你还等待获得整个项目之前移动到云环境中处理它,然后你仍然等待很长一段时间或支出一大笔钱的过程,迅速在云中。


一个初始的问题我们有与没有,我们为什么要等?我们都这个时候当我们获得的数据,我们可以使用过程。这是一个关键的不是平台之间的差异和一些其他的软件解决方案。


不回答你的问题关于人工智能和机器学习。这个我们看到一个非常大的增长方面,不仅为力量,但是整个领域。我想我们会开始看到预测被应用在更广泛的层面上,不仅对CCS。它已经被申请预测MS / MS谱,保留时间和许多其他方面。我想我们会开始看到所有这些被集成在一起创建更健壮的模型和更完整的模型,可以描述所有这些方面或其中许多方面。然后你到达一个阶段,你可以很自信地预测和识别的特征肽之前你已经作了测量。您可以使用这些知识来修改你将如何获得数据可能更适合你的实验设计。


另一方面我们也会改变瓶颈获取数据,分析数据,我们要创建一个新的瓶颈岗位分析。我认为这将是一个有趣的地方,保持你的眼睛。


主持人:你能讨论未来计划进一步加强软件方面的能力?


TS:我认为有一些我们没有覆盖的区域。例如,新创测序不是能力,是目前我们的投资组合的一部分,我们真的期待集成选项。我们提供不同的工作流解决方案但想继续发展。CCS预测以及所有其他的预测,我们想做的事,这是一个地方我们有很多关注,尤其是对于天车。我们目前支持磷酸化,但我们想成长,理想情况下,所有的天车,模型是否见过与否,并能够预测准确,所以我们可以利用TIMScore和其他应用程序。也有更广泛的方面质量控制、数据分析和数据可视化,我们计划产生影响。


产品经理Tharan Srikumar生物信息学在力量Daltonics,说话188金宝搏备用技术网络。

满足作者
灰板博士
灰板博士
编辑主任
莫莉坎贝尔
莫莉坎贝尔
高级科学作家
广告
Baidu