我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

188金宝慱官网可信

阅读时间:

重现另一位研究人员工作成果的能力是科学的基石,然而在许多情况下,科学家无法获得其他人使用的数据或方法,从而能够验证和自信地建立他们的发现。为什么数据的可重复性常常如此可怜的?我们能做些什么呢?在本文中,我们将介绍一些措施我们可以作为单个科学家,作为一个全球社区,来提高科学努力的可重复性和严谨性。

为什么数据再现性很重要?


数据重现性是通过使用作者的数据集、分析方法和代码重新生成实验结果的能力,例如科学出版物中呈现的数据。它与可复制性不同,可复制性是使用不同的设置重复一个实验,并得到相同的结果。出于一系列不同的原因,两者都是强有力的科学研究的重要组成部分。

“可重复性是每一个科学领域的基础,”他说Susanna-Assunta桑松他是牛津大学(University of Oxford)数据准备副教授、牛津电子研究中心(Oxford e-Research Centre)副主任。“科学是关于连续性的:发现是用别人的数据做出的,进步是用我们的集体知识做出的。然而,无法复制、验证和信任的数据和知识对任何人都没有帮助。它没有任何潜力,毫无用处。”

除了能够信任科学知识的基础之外,认真对待数据可重复性还有更多自私的原因。Florian Markowetz是英国癌症研究剑桥研究所的高级小组负责人,也是英国癌症研究中心的本地网络负责人英国重复性网络.在他的文章《重复工作的五个自私理由》中,1 他认为,除了保护科学基础之外,数据可重复性还有几个好处——包括避免数据分析灾难,使论文写作更容易,以及建立你的专业声誉。

“我有一个非常简单的方法来实现数据的可重复性,”Markowetz说,“如果你想有一个好的职业,如果你想做好的科学,有一定的要求,环境必须以特定的方式设置。例如,你必须了解别人是如何进行研究的,才能真正参与到他们的研究中来,参与到他们的研究结果中去。如果他们不与我分享他们的数据和方法,我将永远无法理解他们做了什么。这对我来说是个问题。”

在下一次实验室检查中生存的五个要点

即使有强大的质量体系来管理您的分析实验室和强大的数据完整性(DI)程序,您可能仍然对准备监管检查感到紧张。调查人员想知道什么?他们会问什么?你的团队准备好了吗?观看本次网络研讨会,了解将会发生什么,并深入了解DI如何在检查中发挥作用,以及如何理解和回答检查员的问题。

看网络研讨会
关注数据的可重复性

近年来,由于许多原因,人们越来越关注数据的可重复性,有报道称“再现性危机在某些领域。2那么,为什么数据可重复性越来越受到关注呢?

“首先,学术数字资产(包括数据集、代码、模型、文章、预印本、协议)的规模和多样性不断增长,给我们目前对共享信息进行同行评审和质量控制的机制带来了压力,”Sansone说。“其次,由于一些原因,绝大多数处于公共领域的数据集和代码仍然不能重用。即使它是公开的,它也经常被描述得很糟糕,这意味着它不适合第三方使用。”

这方面的一个相当大的障碍是,在研究人员开始重新使用数据集来回答研究问题之前,数据集仍然需要大量的准备工作。准备用于共享的数据需要时间和精力。

Markowetz说:“需要认识到的一件重要的事情是,在短期内,你需要采取的使数据可再现的步骤不会让你的生活变得更容易,因为你必须学习各种各样的新工具。”“如果你只是想把你拥有的所有信息拼凑成一张表格,我敢肯定,Excel比学习如何编程和整理数据要快得多。所以,你必须把它视为一项长期投资。”

在Markowetz的实验室中,他们通过在收集和分析的不同阶段使用Python、R和Github中可用的数据管理和版本控制工具来实现可重复性。他解释说:“一个普遍的问题是管理混乱的数据,一个科学术语或药物名称可能有十种或更多不同的拼写,必须有人清理这些数据——这是朝着整洁数据迈出的重要一步。”“一旦我们知道了分析的方向,我们就会尽可能多地记录,因为我们希望,如果成功了,这将是我们的下一篇论文。我们不想陷入一种愚蠢的境地,忘记了我们是如何得到结果的。在多学科环境中实现数据可再现性的最实际步骤是,每个人都知道如何编程软件语言,知道GitHub等版本控制系统是如何工作的,然后你就差不多做到了。”

避免假阳性的ELISA数据

酶联免疫吸附测定(elisa)通常用于定量血清、血浆和细胞培养上产物中的生物标志物。这些样品含有多种可能干扰ELISA结果的因素,通常称为基质效应。下载此应用程序注释,以了解更多关于检测人类GDNF时阻断试剂的重要性,以及在其他Quantikine Elsa试剂盒中检测阻断试剂的重要性。

查看App

全系统努力提高数据再现性


值得庆幸的是,随着越来越多的资助者和出版商对更开放的数据访问设置了期望,有更多的工具正在开发以支持这一点,以及更多关于如何以可复制的方式工作的指导和培训。

2016年,Sansone与一群国际公认的数据管理领导者共同撰写了公平的原则-一套指导原则,以确保当代数据资源和学术成果是可查找、可访问、可互操作和可重复使用的(FAIR)。3.这些方法已经被科学生态系统中的许多利益相关者广泛采用,并推动了关于更好的数据管理的全球辩论。

“资助机构现在正在将FAIR原则整合到他们的资助协议中,出版商联合起来支持FAIR,作为一种保持开放研究前沿的方式,在私营部门,FAIR正在被主要生物制药公司、图书馆和工会采纳并写入政策中,”Sansone说。这些原则也得到了全球和政府间领导人的认可,如20国集团、七国集团开放科学专家组和经济合作与发展组织(OECD)科学和技术政策委员会事实上的良好的研究数据管理的全球规范,也是数据科学的先决条件。”

但是,尽管FAIR原则加速了全球对各个学科更好的数据管理的讨论,但它们仍然需要付诸实践。尽管已经有了一些改进,但数据仍然很少遵循FAIR原则,它们仍然是令人振奋的。

利用扩展现实(XR)技术来提高实验室的生产力

为了使实验室的产出最大化,科学家们需要能够依靠技术进步、创新软件和改进的流程。最终,通过简化日常活动来提高生产力是成为未来实验室的主要组成部分。观看本次网络研讨会,了解更多关于完全连接的生态系统的价值,以及如何在实验室中实现这一目标。

看网络研讨会

将公平原则转化为实践


世界各地的许多社区正在努bet188真人力将FAIR变成现实。“这是通过设计和实施相关的技术和社会基础设施,以及文化和政策变革,并辅以新的教育和培训要素来实现的,”Sansone说。“这项工作不仅需要研究人员参与,还需要数据生命周期中的所有利益相关者参与:从开发人员、服务提供商、图书馆员、期刊出版商、资助者、学术团体以及商业和政府机构。”

一个这样的例子是UKRN该项目由布里斯托尔大学的马库斯·穆纳福教授领导,马科维茨是剑桥大学的当地负责人。马科韦茨解释说:“之所以设立这个项目,是因为可重复性是一个比个别机构和个别学科更大的大问题。”“所以,在全国范围内用一种更加一致的方法来解决这个问题是有意义的,现在在不同的国家都有很多可重复性网络。”不同国家的研究文化和格局不同,所以我们必须在国家层面上解决这个问题。这是一项全英国范围内的倡议,旨在提高从心理学到政治学和生物医学等学科的可重复性。”UKRN正在通过两种方式解决这个问题:通过与资助者的高层合作和建立基础设施来支持可重复性,以及在基层通过关于如何可重复性地进行科学研究的培训研讨会,涵盖从编程到领导的所有内容。

“真正需要的是大学的研究领导者更明确地支持数据可重复性,”Markowetz说,“我们有这些大型的国家努力,如UKRN,以及早期职业研究人员的许多兴奋和参与,但我们还没有中间部分,即个别大学的高级领导层认真对待这一问题,例如改变他们的终身教职流程或学术职业发展框架。”

在牛津,Sansone通过她的工作帮助支持UKRN的努力和其他国家类似的国家倡议数据准备小组,该组织研究和开发提高数据重用的方法和工具。她的团队与国际利益相关者合作,开发了促进公平的资源,例如fairshare合理的食谱主要制药公司支持UKRN及其在其他国家的同行的工作。4

不过,最终还是要归结到研究界的个人实践。“社区需要通过改变研究文化(我们做研究的环境)及其研究实践(我们做研究的方式)来帮助自己,”Sansone说。“科学是一项团队运动,团队合作很难:但你必须发挥你的作用。更好的数据意味着更好的科学。”

参考文献

1.重复工作的五个自私理由。基因组医学杂志。2015; 16:274 . .doi:10.1186 / s13059 - 015 - 0850 - 7

2.1500名科学家揭开了再现性的面纱。自然2016; 533:452 - 454。doi:10.1038 / 533452

3.Wilkinson MD, Dumontier M, Aalbersberg IJ,等。科学数据管理和管理的FAIR指导原则[已发表的更正见科学数据.2019年3月19日;6(1):6科学数据2016; 3:160018。doi:10.1038 / sdata.2016.18

4.王志强,王志强,王志强,等。FAIRsharing作为标准、存储库和政策的社区方法。生物科技Nat》.2019; 37:358 - 367。doi:10.1038 / s41587 - 019 - 0080 - 8

与作者见面
乔安娜·欧文斯博士
乔安娜·欧文斯博士
广告
Baidu