数字爱情——数据管理与科学的未来
最近的一篇博客文章数字科学强调了数据管理不善对科学未来的影响。这些数据和潜在影响的广度让我大吃一惊,我找到了Digital Science研究工具产品经理Nathan Westgarth,以更多地了解该公司、数据管理的重要性以及Digital Science如何解决这些问题。
AB:你能告诉我一些关于数字科学的事情吗?
内森·韦斯特加斯(西北):数字科学成立的目的是通过更好地利用技术来提高科学研究的效率。我们充满激情地相信,明天的研究将不同于今天,而且更好。因此,我们致力于把科学家放在我们所做的一切的核心,并创造真正有效的工具,以帮助改变科学的方式。我们孵化和投资有前途的初创企业,并在内部开发满足科学家需求的工具。从本质上讲,我们所做的一切都是为了帮助那些从事科学工作的人更有效地工作。
AB:你最近的博客“保护你的数据和实践安全科学的五大原因”强调了有效数据管理的重要性,糟糕的数据管理有多大的问题,这会产生什么影响?
NW:对科学界来说,糟糕的数据管理是一个非常紧迫的问题——不仅对实验室管理团队来说如此,对每个研究人员来说也是如此。目前产生的研究数据量每年以30%的速度增长。令人担忧的是,一项研究发现,获取数据集的几率每年下降17%,80%的科学数据在20年内丢失(Vines T.H. et al. 2013)。
从我们与科学家就他们在工作中面临的问题和挑战进行的讨论中,管理和访问数据的困难是向我们提到的最常见的问题之一。在一个数据管理问题的极端案例中,生物学家Billy Hinchen告诉我们,“我的笔记本电脑被盗后,我丢失了400GB的数据和近4年的工作。结果,我最终获得了哲学硕士学位,而不是博士学位。”显然,这些问题在个人和全球层面都产生了巨大影响。
令人担忧的是,随着数据输出的增长,有效的数据组织只会变得更加困难。如果数据继续管理不善,科学最终将受到损害。在最好的情况下,实验将难以复制,结果将受到质疑。在最坏的情况下,论文会被撤回,职业生涯也会受到影响。
为了突出这一问题,并引发围绕研究数据管理问题的对话,我们调查了统计数据,并制作了我们的“热爱你的数据”信息图,其中包括保护你的数据的五个主要原因。
AB: Digital Science如何帮助实现有效的数据管理?
NW:我们的两个工具是专门为帮助科研人员更好地管理数据而设计的。我们常用的工具figshare,是一个基于云的存储库,研究人员可以私下存储他们的数据,与同事共享,或通过永久的数字对象标识符(DOI)公开可用和可引用。我们最近也发布了项目,一个简单的桌面应用程序,帮助研究人员掌握所有的数据,以结构化和安全的方式组织他们的研究。project目前只支持Mac版本,但Windows版本正在开发中。项目中的数据可以一键上传到figshare云,创建真正集成的解决方案。
AB:随着数据输出的快速增长,您认为未来几年将面临哪些挑战?数字科学将如何帮助解决这些挑战?
NW:主要的挑战是鼓励科学界改变他们的行为,以解决数据管理问题。如果研究人员没有动机记录他们的分析,那么仅仅告诉他们这是一个好主意是不够的,因为当他们已经有足够的工作要做时,这似乎是额外的工作。在Digital Science,我们试图通过创建软件工具来帮助您轻松地将最佳实践集成到现有的工作流程中。通过资助机构、机构、出版商和政府与科学界的合作,我们希望以积极的方式影响变化。
另一个挑战是历史数据以及如何将这些数据迁移到新的平台和工具上。如果操作不当,遗留数据文件的数据迁移是复杂且昂贵的。对于需要访问现有数据库,同时生成新输出的研究人员来说,无缝过渡也是至关重要的。我们有,通过产品Labguru我们在开发中的其他人,在帮助管理这个过程方面变得熟练,使它尽可能地无痛。谈论现在产生的数据很好,但如果我们忽略了遗留问题,那么我们只解决了问题的一部分。
在Digital Science,我们正在构建工具,以确保任何人都可以访问数据,并以一种促进对大数据的新见解的方式进行链接。figshare正在寻找新的方法,以这种方式使数据尽可能易于重用。随着数据和研究成果的浪潮,学者们将需要更好的过滤器Altmetric有助于帮助发现的研究,是得到关注和正在网上讨论。从更一般的组织角度来看项目帮助研究人员在桌面上组织他们的数据,而figshare带来了科学家需要的基于云的存储和共享功能。
我们总是回想起这样一个类比:在我们的个人生活中处理大量数据是我们都已经习惯了的事情——例如,我们有很好的工具来帮助我们管理音乐和照片。Digital Science的使命是将这些最佳实践和软件标准带到科学界,使科学工作者能够更高效地工作。
Nathan Westgarth接受了技术网络执行编辑Ashley Board的采访。188金宝搏备用你可以找到阿什利谷歌+并关注科技网络188金宝搏备用推特.