我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

qPortal生物医学研究提供了一种数据驱动的方法

qPortal生物医学研究提供了一种数据驱动的方法内容块的形象

希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“生物医学研究qPortal提供了一种数据驱动的方法”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

我们最近赶上图宾根大学的克里斯托弗·莫尔qPortal讨论数据管理平台,公布了上月在《PLOS ONE》杂志上。


Ruairi Mackenzie (RM):你能介绍qPortal的功能,你的动机设计吗?

克里斯托弗•莫尔(厘米):qPortal是一个基于网络平台与集成的工作流系统提供portlet,这是子页面在我们平台,方便创建大规模的实验设计和数据管理。这使得平台方便,用户可以访问该平台通过正常的web浏览器,然后设计项目和实验中,访问、管理、查看相应的数据和元数据信息和执行生物信息学分析管道通过易于使用的子页面。qPortal的设计的主要动机是为整个生命周期有一个可伸缩的系统在现代数据驱动的生物医学研究与实验设计开始和结尾的分析测量数据。


qPortal我们提供技术手段,以应对日益增长的复杂性和生物医学数据量。


此外,我们创建了一个平台,让用户去做全数字项目管理。这是符合定量生物学中心的概念(QBiC)在图宾根,成立于2012年作为一个中央平台协调数据驱动的研究从设计研究大(生物医药)数据的管理。我们预计,网络平台,如qPortal,将最先进的研究设施不可或缺的基石。


RM:为什么在现代生物医学研究是一个数据驱动的管理平台重要吗?

CM:现代生物医学研究的目的在于从大,得出生物结论高度复杂的生物数据集。因此,它已成为司空见惯的广泛利用高通量技术,产生大量的异构数据。除了前所未有的精度,方法得到更快、更便宜,导致稳步增加需要可扩展的数据管理和分析的方便手段。数量不断增长和吞吐量的组学技术,全自动化数据管理和分析的必要性是显而易见的。此外,现代研究项目通常协调内部更大的财团,暗示分布式数据生成和许多利益相关者。我们的方法便于实现的基于web的性质qPortal等中央平台项目。简单的数据共享和远程通信的背景下科学项目收到越来越多的关注和门户网站,比如qPortal,可以提供相关的解决方案。


此外,workflow-based分析模块为最终用户提供了直观的计算资源的接口可以方便地执行生物信息学的管道。这样,分布式计算基础设施的复杂性隐藏从最终用户,从而使数据分析科学家事先脚本或命令行经验。


此外,我们的数据驱动的管理平台地址计算分析的重现性的话题。事实上,近年来许多研究强烈支持这一焦点。注释的分析管道和跟踪使用参数设置来解决这个问题是至关重要的。qPortal的综合数据驱动的方法进一步发展了再现性的概念。我们的方法强烈强调正确的注释数据(数据驱动的)。虽然qPortal实现彻底的日志处理、参数和管道,qPortal也促进数据注释,这是完全可再生的研究同样重要,坚持公平原则。从广泛的元数据收集在实验前有几个优点。用户可以很容易地追溯错误研究设计或样品处理与更高的信心,好的注释可以重用实验数据在未来的研究中,和估计的统计力量之前执行实验节省时间和金钱。


目前,我们正在进一步改进分析管道通过扩展我们的工作流系统。我们将接口添加到其他工作流系统,如SnakeMake和NextFlow和集装箱码头工人和奇点的解决方案。


RM:qPortal有什么特性,这使它有别于其他门户网站如星系?

CM:qPortal和底层系统的重点是在指定的实验步骤和注释在早期和利用这些信息在整个项目生命周期,便于分析。qPortal是项目管理的一个主要方面。这包括功能寄存器和存储项目定制的实验设计和维护。这个属性定义数据驱动的方法至关重要。注释的数据是主要的焦点在整个生命周期的实验和项目。这些特性提供qPortal项目向导和项目浏览器的web应用程序。实验和样本实例代表实验设计的注册和使用将传入的数据。相比之下,显然workflow-driven星系的方法不是建立在这一概念,而是使用隐式项目管理的重点是基于文件的分析和可视化。


数据注释在两个系统是可能的,但是重点是不同的。虽然qPortal收集元数据的每一步实验中,有一个明确的重点在工作流运行在星系的注释。后者财产是至关重要的再现性以及基准不同的工作流和参数。qPortal方法开始执行广泛的元数据收集在实验前有诸多好处。首先,可以节省时间和金钱,因为之前统计力量的研究设计允许估计实验正在进行。其次,研究设计或样品处理中的错误可以追溯到更容易和更高的信心。


数据导入是必不可少的在处理包含生物医学应用。数据导入qPortal可能如使用openBIS Datamover软件。注册包括ID映射和文件格式自动识别是通过ETL脚本和是建立在实验设计和创建连接的条形码。这可能是文件类型或lab-specific,在后一种情况下通常包含额外的元数据注释注册。小,非结构化数据具体项目上传通过浏览器是可用的。星系提供了直接数据上传的功能通过web浏览器有不同定义的规则和治理作为星系提供者实例。通过加密的FTP上传更大的文件支持。此外,数据传输提供的输入数据直接从url是可能的。银河系上传提供许多常用的文件类型的自动检测。更广泛的操作输入数据,类似于我们的ETL脚本,用户可以实现工作流节点的形式。


另一个关键的区别是,qPortal工作流系统可以利用注册的实验设计信息和其他注释,例如颜色图形分析结果根据不同研究变量。


RM:你建议qPortal可以是一个生物医学研究平台作为一个整体,这个平台有什么灵活适应不同领域的研究在这一领域?

CM:在生物医学研究领域由实验可能不同,生成的数据的类型。对于这些差异,qPortal高度灵活。底层数据模型可以很容易地适应和扩展通过openBIS(瑞士苏黎世联邦理工学院的发展),占新类型的实验,测量数据类型,或元数据应通过项目生命周期跟踪。在某些情况下,用户可能需要额外的数据分析手段的新数据类型。在这种情况下,开发新的工作流hasve如果他们已经不存在。然而,这些新的工作流的集成qPortal也容易成为可能。


RM:什么级别的专业知识将qPortal用户需要在编程和脚本?

CM:用户不需要任何专业知识在编程和脚本qPortal经验。所有需要访问qPortal实例运行工作的网络连接和一个web浏览器。


RM:qPortal如何处理数据安全,这是最重要的在现代生物医学研究吗?

CM:数据安全是基本重要的特别是对临床数据。一般来说,生物医学数据通常是一定会严格管制条款关于数据安全,访问和机密性。因此,我们实现了一个两步过程安全。首先,我们要求用户注册才能登录qPortal。其次,qPortal利用开放的基于规则的权限方案生物学信息系统(openBIS)。qPortal登录后,用户只能访问自己的项目或合作伙伴的,包括相应的数据。权限控制在一个所谓的“空间”的水平。“空间”可能包括几个项目,用户可以添加到“空间”,不同的角色。如果一个最低要求的角色存在,用户将能够看到数据。

满足作者
Ruairi J麦肯齐
Ruairi J麦肯齐
高级科学作家
广告
Baidu