188金宝慱官网可信
重现另一位研究人员工作成果的能力是科学的基石,然而在许多情况下,科学家无法获得其他人使用的数据或方法,从而能够验证和自信地建立他们的发现。为什么数据的可重复性常常如此可怜的?我们能做些什么呢?在本文中,我们将介绍一些措施我们可以作为单个科学家,作为一个全球社区,来提高科学努力的可重复性和严谨性。
为什么数据再现性很重要?
数据重现性是通过使用作者的数据集、分析方法和代码重新生成实验结果的能力,例如科学出版物中呈现的数据。它与可复制性不同,可复制性是使用不同的设置重复一个实验,并得到相同的结果。出于一系列不同的原因,两者都是强有力的科学研究的重要组成部分。
“可重复性是每一个科学领域的基础,”他说Susanna-Assunta桑松他是牛津大学(University of Oxford)数据准备副教授、牛津电子研究中心(Oxford e-Research Centre)副主任。“科学是关于连续性的:发现是用别人的数据做出的,进步是用我们的集体知识做出的。然而,无法复制、验证和信任的数据和知识对任何人都没有帮助。它没有任何潜力,毫无用处。”
除了能够信任科学知识的基础之外,认真对待数据可重复性还有更多自私的原因。Florian Markowetz是英国癌症研究剑桥研究所的高级小组负责人,也是英国癌症研究中心的本地网络负责人英国重复性网络.在他的文章《重复工作的五个自私理由》中,1 他认为,除了保护科学基础之外,数据可重复性还有几个好处——包括避免数据分析灾难,使论文写作更容易,以及建立你的专业声誉。
“我有一个非常简单的方法来实现数据的可重复性,”Markowetz说,“如果你想有一个好的职业,如果你想做好的科学,有一定的要求,环境必须以特定的方式设置。例如,你必须了解别人是如何进行研究的,才能真正参与到他们的研究中来,参与到他们的研究结果中去。如果他们不与我分享他们的数据和方法,我将永远无法理解他们做了什么。这对我来说是个问题。”
在下一次实验室检查中生存的五个要点
即使有强大的质量体系来管理您的分析实验室和强大的数据完整性(DI)程序,您可能仍然对准备监管检查感到紧张。调查人员想知道什么?他们会问什么?你的团队准备好了吗?观看本次网络研讨会,了解将会发生什么,并深入了解DI如何在检查中发挥作用,以及如何理解和回答检查员的问题。
看网络研讨会赞助内容
近年来,由于许多原因,人们越来越关注数据的可重复性,有报道称“再现性危机在某些领域。2那么,为什么数据可重复性越来越受到关注呢?
“首先,学术数字资产(包括数据集、代码、模型、文章、预印本、协议)的规模和多样性不断增长,给我们目前对共享信息进行同行评审和质量控制的机制带来了压力,”Sansone说。“其次,由于一些原因,绝大多数处于公共领域的数据集和代码仍然不能重用。即使它是公开的,它也经常被描述得很糟糕,这意味着它不适合第三方使用。”
这方面的一个相当大的障碍是,在研究人员开始重新使用数据集来回答研究问题之前,数据集仍然需要大量的准备工作。准备用于共享的数据需要时间和精力。
Markowetz说:“需要认识到的一件重要的事情是,在短期内,你需要采取的使数据可再现的步骤不会让你的生活变得更容易,因为你必须学习各种各样的新工具。”“如果你只是想把你拥有的所有信息拼凑成一张表格,我敢肯定,Excel比学习如何编程和整理数据要快得多。所以,你必须把它视为一项长期投资。”
在Markowetz的实验室中,他们通过在收集和分析的不同阶段使用Python、R和Github中可用的数据管理和版本控制工具来实现可重复性。他解释说:“一个普遍的问题是管理混乱的数据,一个科学术语或药物名称可能有十种或更多不同的拼写,必须有人清理这些数据——这是朝着整洁数据迈出的重要一步。”“一旦我们知道了分析的方向,我们就会尽可能多地记录,因为我们希望,如果成功了,这将是我们的下一篇论文。我们不想陷入一种愚蠢的境地,忘记了我们是如何得到结果的。在多学科环境中实现数据可再现性的最实际步骤是,每个人都知道如何编程软件语言,知道GitHub等版本控制系统是如何工作的,然后你就差不多做到了。”
避免假阳性的ELISA数据
酶联免疫吸附测定(elisa)通常用于定量血清、血浆和细胞培养上产物中的生物标志物。这些样品含有多种可能干扰ELISA结果的因素,通常称为基质效应。下载此应用程序注释,以了解更多关于检测人类GDNF时阻断试剂的重要性,以及在其他Quantikine Elsa试剂盒中检测阻断试剂的重要性。
查看App赞助内容
全系统努力提高数据再现性
值得庆幸的是,随着越来越多的资助者和出版商对更开放的数据访问设置了期望,有更多的工具正在开发以支持这一点,以及更多关于如何以可复制的方式工作的指导和培训。
2016年,Sansone与一群国际公认的数据管理领导者共同撰写了公平的原则-一套指导原则,以确保当代数据资源和学术成果是可查找、可访问、可互操作和可重复使用的(FAIR)。3.这些方法已经被科学生态系统中的许多利益相关者广泛采用,并推动了关于更好的数据管理的全球辩论。
“资助机构现在正在将FAIR原则整合到他们的资助协议中,出版商联合起来支持FAIR,作为一种保持开放研究前沿的方式,在私营部门,FAIR正在被主要生物制药公司、图书馆和工会采纳并写入政策中,”Sansone说。这些原则也得到了全球和政府间领导人的认可,如20国集团、七国集团开放科学专家组和经济合作与发展组织(OECD)科学和技术政策委员会事实上的良好的研究数据管理的全球规范,也是数据科学的先决条件。”
但是,尽管FAIR原则加速了全球对各个学科更好的数据管理的讨论,但它们仍然需要付诸实践。尽管已经有了一些改进,但数据仍然很少遵循FAIR原则,它们仍然是令人振奋的。
利用扩展现实(XR)技术来提高实验室的生产力
为了使实验室的产出最大化,科学家们需要能够依靠技术进步、创新软件和改进的流程。最终,通过简化日常活动来提高生产力是成为未来实验室的主要组成部分。观看本次网络研讨会,了解更多关于完全连接的生态系统的价值,以及如何在实验室中实现这一目标。
看网络研讨会赞助内容
将公平原则转化为实践
世界各地的许多社区正在努bet188真人力将FAIR变成现实。“这是通过设计和实施相关的技术和社会基础设施,以及文化和政策变革,并辅以新的教育和培训要素来实现的,”Sansone说。“这项工作不仅需要研究人员参与,还需要数据生命周期中的所有利益相关者参与:从开发人员、服务提供商、图书馆员、期刊出版商、资助者、学术团体以及商业和政府机构。”
一个这样的例子是UKRN该项目由布里斯托尔大学的马库斯·穆纳福教授领导,马科维茨是剑桥大学的当地负责人。马科韦茨解释说:“之所以设立这个项目,是因为可重复性是一个比个别机构和个别学科更大的大问题。”“所以,在全国范围内用一种更加一致的方法来解决这个问题是有意义的,现在在不同的国家都有很多可重复性网络。”不同国家的研究文化和格局不同,所以我们必须在国家层面上解决这个问题。这是一项全英国范围内的倡议,旨在提高从心理学到政治学和生物医学等学科的可重复性。”UKRN正在通过两种方式解决这个问题:通过与资助者的高层合作和建立基础设施来支持可重复性,以及在基层通过关于如何可重复性地进行科学研究的培训研讨会,涵盖从编程到领导的所有内容。
“真正需要的是大学的研究领导者更明确地支持数据可重复性,”Markowetz说,“我们有这些大型的国家努力,如UKRN,以及早期职业研究人员的许多兴奋和参与,但我们还没有中间部分,即个别大学的高级领导层认真对待这一问题,例如改变他们的终身教职流程或学术职业发展框架。”
在牛津,Sansone通过她的工作帮助支持UKRN的努力和其他国家类似的国家倡议数据准备小组,该组织研究和开发提高数据重用的方法和工具。她的团队与国际利益相关者合作,开发了促进公平的资源,例如fairshare和合理的食谱主要制药公司支持UKRN及其在其他国家的同行的工作。4
不过,最终还是要归结到研究界的个人实践。“社区需要通过改变研究文化(我们做研究的环境)及其研究实践(我们做研究的方式)来帮助自己,”Sansone说。“科学是一项团队运动,团队合作很难:但你必须发挥你的作用。更好的数据意味着更好的科学。”
参考文献
1.重复工作的五个自私理由。基因组医学杂志。2015; 16:274 . .doi:10.1186 / s13059 - 015 - 0850 - 7
2.1500名科学家揭开了再现性的面纱。自然2016; 533:452 - 454。doi:10.1038 / 533452
3.Wilkinson MD, Dumontier M, Aalbersberg IJ,等。科学数据管理和管理的FAIR指导原则[已发表的更正见科学数据.2019年3月19日;6(1):6科学数据2016; 3:160018。doi:10.1038 / sdata.2016.18
4.王志强,王志强,王志强,等。FAIRsharing作为标准、存储库和政策的社区方法。生物科技Nat》.2019; 37:358 - 367。doi:10.1038 / s41587 - 019 - 0080 - 8