数字爱情-数据管理和科学的未来
最近的一篇博文数字科学强调了数据管理不善对科学未来的影响。我对这些数据和潜在影响的广度感到震惊,于是我采访了Digital Science研究工具产品经理Nathan Westgarth,了解了该公司的更多情况,数据管理的重要性以及Digital Science如何解决这些问题。
AB:你能给我讲讲数字科学吗?
内森·韦斯特加斯(西北):数字科学成立的目的是通过更好地利用技术使科学研究更有效率。我们热切地相信,明天的研究将与今天的研究不同,而且更好。因此,我们致力于将科学家置于我们所做的一切的核心,并创造真正有助于改变科学研究方式的工具。我们孵化和投资有前途的初创企业,并在内部开发满足科学家需求的工具。从本质上讲,我们所做的一切都是为了帮助那些从事科学工作的人更有效地工作。
AB:你最近的博客“保护你的数据和实践安全科学的五大理由”强调了有效数据管理的重要性,糟糕的数据管理问题有多大,这会产生什么影响?
NW:对科学界来说,糟糕的数据管理是一个非常紧迫的问题——不仅是对实验室管理团队来说,对每个研究人员来说也是如此。目前产生的研究数据量以每年30%的速度增长。令人担忧的是,一项研究发现,采购数据集的几率每年下降17%,然后在20年内丢失了80%的科学数据(Vines T.H. et al. 2013)。
从我们与科学家讨论他们在工作中面临的问题和挑战来看,管理和访问他们的数据的困难是我们提到的最常见的问题之一。在一个数据管理问题的极端案例中,我们听到生物学家Billy Hinchen告诉我们,“在我的笔记本电脑被盗后,我丢失了400GB的数据和近4年的工作。结果我拿到的是哲学硕士学位,而不是博士学位。”显然,这些问题在个人和全球层面上都产生了巨大的影响。
令人担忧的是,随着数据输出的增长,有效的数据组织只会变得更加困难。如果数据继续管理不善,那么科学最终将受到损害。在最好的情况下,实验将难以复制,结果将受到质疑。在最坏的情况下,论文将被撤回,职业生涯将受到影响。
为了突出这一问题,并引发围绕研究数据管理问题的讨论,我们调查了统计数据,并制作了我们的“爱你的数据”信息图表,其中包括保护你的数据的五个主要原因。
AB:数字科学如何帮助实现有效的数据管理?
NW:我们的两个工具是专门为帮助科研人员更好地管理数据而设计的。我们流行的工具figshare是一个基于云的存储库,研究人员可以在其中私下存储他们的数据,与同事共享,或者通过永久的数字对象标识符(DOI)将其公开可用和可引用。我们最近也发布了项目这是一款简单的桌面应用程序,可以帮助研究人员以一种结构化和安全的方式组织他们的研究,从而掌握所有数据。Projects目前只支持Mac,但Windows版本正在开发中。项目中的数据可以一键上传到figshare云,创建一个真正的集成解决方案。
AB:随着数据输出的快速增长,您认为未来几年将面临哪些挑战?数字科学将如何帮助解决这些挑战?
NW:主要的挑战是鼓励科学界改变他们的行为来解决数据管理的问题。如果研究人员没有动机记录他们的分析,那么简单地告诉他们这是一个好主意是不够的,因为这看起来像是额外的工作,而他们已经有足够的工作要做。在Digital Science,我们试图通过创建软件工具来帮助他们,这些工具可以轻松地将最佳实践集成到他们现有的工作流程中。通过资助机构、研究机构、出版商和政府与科学界合作,我们希望以积极的方式影响变革。
另一个挑战是历史数据以及如何将其迁移到新的平台和工具。如果处理不当,遗留数据文件的数据迁移是复杂和昂贵的。对于需要访问现有数据库同时生成新输出的研究人员来说,这对于无缝过渡也是至关重要的。我们有,通过产品像Labguru而我们正在开发的其他技术,在帮助管理这个过程方面变得熟练,使它尽可能地无痛。谈论现在产生的数据很好,但如果我们忽略了遗留问题,那么我们只解决了部分问题。
在Digital Science,我们正在构建工具,以确保任何人都可以访问数据,并以一种培养对大数据的新见解的方式将数据联系起来。figshare正在寻找以这种方式使数据尽可能易于重用的新方法。随着数据和研究成果的浪潮,学术界将需要更好的过滤器Altmetric有助于帮助发现正在获得关注和在线讨论的研究。从更广泛的组织角度来看项目帮助研究人员在桌面上组织他们的数据,而figshare带来了科学家需要的基于云的存储和共享功能。
我们总是提到处理个人生活中大量数据的类比,这是我们都已经习惯的事情——例如,我们有很好的工具来帮助我们管理音乐和照片。数字科学的使命是将这些最佳实践和软件标准带到科学界,使那些从事科学工作的人能够更高效地工作。
内森·韦斯特加斯接受了技术网络总编辑阿什利·博德的采访。188金宝搏备用你可以找到阿什利谷歌+并继续关注科技网络188金宝搏备用推特.