研究表明改进方法解释高通量生物数据
分子从一系列庞大的数据来源。应用研究,目的是测量代谢组织变量条件下如遗传、饮食和环境。
反对当前的方法,应用统计分析的数据集作为一个整体,提出了工作流初始数据分割为小组由已知分子相互作用决定的。统计方法可以应用到这些群体导致更准确的结果如果分析被应用于整个数据集。
这种技术已经显示出改善脂质代谢相关基因的检测鼠标营养研究的一个例子,我们理解生化波动增加15%。
确定代谢物之间的关联,代谢过程中产生的小分子,细胞和基因对理解过程是至关重要的。然而,发现这些关系是一项复杂的任务,尤其是当集成数据,关注各种类型的分子。增加这种复杂性的大量数据进行分析,由于新的高通量实验技术的发展。
最初,分子将被应用到工作流研究前列腺癌的西兰花的好处,与食品研究所的合作研究。作为应用研究类黄酮对健康的好处,这是植物代谢物中发现各种各样的水果和蔬菜,与东安格利亚大学的合作。
通过改善我们的能力集成来自不同数据源的数据和确定代谢物和基因之间的联系,此工作流将提供一个更详细的诊断生物过程的细胞代谢和基因表达。
合著者,维克托•Jurkowski整合基因组学在TGAC组长,说:“知识分子聚集在网络可以被用来提高数据集成和解释。
“我们的方法,整合转录组和代谢组学数据将帮助解释信号来衡量组学技术来扩展我们的知识在特定的生物条件下的过程。因此,生物学家在解释数据中获益,创造更好的假设和确定基因和代谢产物参与解开感兴趣的机制。
“这是一个概念验证研究,我们正在努力提高集团一代战略interactome的空闲区域,少带注释的物种。我们应用这种和其他分子网络的方法生成的数据在诺维奇合作项目研究园。”