Python LipidFinder:开源工作流为小说发现脂质
阅读时间:
获得精确、优质lipidomic(或代谢组学数据集)带来了挑战。我肯定想到的一个因素是最小化的能力,或者更好的是,消除那些大量的文物,否则会阻碍你的质谱数据分析,以确保准确的解释。
有许多现有的计算工作流可以帮助研究人员处理代谢组学数据集,然而,这些往往是针对调查的脂质,或商业发达,这意味着定制和用户修改不一定是可能的。1
研究人员在教授瓦莱丽·奥唐纳组卡迪夫大学英国已经开发出一种基于Python的计算流程,根据大量数据的分析,特别针对小说脂类的识别。在一次采访中我和教授之间进行O ' donnell,她解释了原因LipidFinder和影响这个工具对她的小组的研究。
LM:你最近的出版物之一,专注于开源面向工作流的发展,LipidFinder。你能告诉我们一些关于这个新工具?
基础研究的一个关键问题,仍然没有明确的答案,是哺乳动物细胞包含多少脂质。我们的观点是,矿业的整个lipidome细胞,尤其是相关疾病条件下,将提供机会发现新脂质生物相关,最终这些可以作为生物标志物或治疗炎症的目标。
LipidFinder是由克里斯所述目前博士生在我的实验室,一个Python项目,旨在有效地清理大文件的高分辨率质谱(MS)数据。当从细胞或血浆脂质提取进行了分析使用长色谱女士以及高分辨率运行,它们包含60 k的信号,其中只有3-5K可能代表实际的脂质。其余的数据背景噪音,或垃圾,需要删除。这是一个庞大的任务,需要定制的信息工具。开放获取的工具,例如,广泛使用和优秀的XCMS,提供一些清理功能,然而这些都是能够更好地寻找已知的脂质,而不是大量的未知数。许多调查人员不需要担心这些文物,因为他们忽视了他们的分析,但对我们来说是一个重大的问题。
我们的计划可以遵循从XCMS,去除更多的文物,给更大的信心,一个是看真正的脂质。LipidFinder创新之一是优化器的工作流程,机器学习方法适用于运营商的数据,优化所需的各种参数进行有效的数据分析。工作流已经开了GitHub和开放;然而,它目前正在适应一个接口脂质地图,应该可以在这种格式在接下来的几个月。由一个伦理委员会批准,Jorge Alvarez-Jarretta博士也向LipidFinder添加额外的模块,这将改善其清理能力,我们将发布第二个版本。
LM: LipidFinder的发展的主要原因是什么?它的实现关键研究成功了什么?
的第一个版本LipidFinder最初写成一个Microsoft Excel项目大卫博士杂质煤博士后研究员,同时在我的组。那时,我们很感兴趣映射血小板lipidome和了解阿司匹林调节血小板脂质,但我们没有工具可以做这项工作。大卫有一个长期的兴趣编程和写的早期版本。用这个我们发表了一篇论文细胞代谢在2016年,这表明近似大小和多样性的血小板lipidome三个不相关的人(包括我自己)。这也允许我们地图> 100新脂质由血小板,尤其是氧化磷脂和脂肪酸。
显然,这是一个非常缓慢而低效的方法,在这段时间里我们开始在卡迪夫和计算机科学家合作,最终导致这个工作流的Python版本。我们认为这种方法是类似于基因阵列,假设生成多组数据和结果,所以发现使用这个工具需要严格的验证,如使用有针对性的方法,和MS / MS实验。后的血小板研究中,我们已经描述脂质在人类心血管疾病组和血小板lipidomic多样性进一步发展我们的研究,但这些研究尚未出版。我们热衷于解决关键问题包括:如何稳定lipidome是相同的人,随着时间的推移,什么是遗传和环境的影响在全球lipidome血小板和细胞成分的控制?
LM:有特定主题领域内,你可能没有机会探索到目前为止还是想进一步探索?
在过去的5年里,我们已经大大改变了我们的工作方式,因为高分辨率数据集的研究和挖掘lipidomes需要一个团队的方法,包括信息和统计等跨学科技能以及脂类生物。开发这种类型的方法改变了我们研究小组是如何工作的,但也提出了重大挑战。我们已经生成的几个大型数据集,需要时间和思想应用于他们,能够有效地分析和理解它们。在这个时候,我的首要任务是完成这些研究和发布我们的研究结果,虽然新的问题出现,我想确保我们不会失去焦点,并避免俯瞰我们现有的所有数据。
已经说过,我们渴望有许多主题和问题跟进。而我的主要兴趣一直居住在循环血管细胞的脂质,我们越来越感兴趣相同的脂质调节组织生物学,特别是皮肤和大脑。很可能我们的未来研究方向包括寻址的形成和表征生物活性脂质在正常伤口愈合和神经传递,但这是未来。
更多信息的临床开发脂质,炎症的属性是由O ' donnell教授和他的同事们发现,可以找到在这里。
参考
1。奥康纳,。所述,c . J。杂质煤,d。、Meckelmann s W。Hawksworth, j . I。艾伦,s M。& O ' donnell, v b (2017)。LipidFinder:计算工作流发现脂质标识eicosanoid-phosphoinositides血小板。JCI洞察力,2 (7)。doi: 10.1172 / jci.insight.91634
广告