188金宝慱官网可信

文章

发布日期:2021年11月3日

阅读时间:

重现另一位研究人员工作成果的能力是科学的基石，然而在许多情况下，科学家无法获得其他人使用的数据或方法，从而能够验证和自信地建立他们的发现。为什么数据的可重复性常常如此可怜的？我们能做些什么呢?在本文中，我们将介绍一些措施我们可以作为单个科学家，作为一个全球社区，来提高科学努力的可重复性和严谨性。

为什么数据再现性很重要?

数据重现性是通过使用作者的数据集、分析方法和代码重新生成实验结果的能力，例如科学出版物中呈现的数据。它与可复制性不同，可复制性是使用不同的设置重复一个实验，并得到相同的结果。出于一系列不同的原因，两者都是强有力的科学研究的重要组成部分。

“可重复性是每一个科学领域的基础，”他说Susanna-Assunta桑松他是牛津大学(University of Oxford)数据准备副教授、牛津电子研究中心(Oxford e-Research Centre)副主任。“科学是关于连续性的:发现是用别人的数据做出的，进步是用我们的集体知识做出的。然而，无法复制、验证和信任的数据和知识对任何人都没有帮助。它没有任何潜力，毫无用处。”

除了能够信任科学知识的基础之外，认真对待数据可重复性还有更多自私的原因。Florian Markowetz是英国癌症研究剑桥研究所的高级小组负责人，也是英国癌症研究中心的本地网络负责人英国重复性网络．在他的文章《重复工作的五个自私理由》中，¹ 他认为，除了保护科学基础之外，数据可重复性还有几个好处——包括避免数据分析灾难，使论文写作更容易，以及建立你的专业声誉。

“我有一个非常简单的方法来实现数据的可重复性，”Markowetz说，“如果你想有一个好的职业，如果你想做好的科学，有一定的要求，环境必须以特定的方式设置。例如，你必须了解别人是如何进行研究的，才能真正参与到他们的研究中来，参与到他们的研究结果中去。如果他们不与我分享他们的数据和方法，我将永远无法理解他们做了什么。这对我来说是个问题。”

在下一次实验室检查中生存的五个要点

即使有强大的质量体系来管理您的分析实验室和强大的数据完整性(DI)程序，您可能仍然对准备监管检查感到紧张。调查人员想知道什么?他们会问什么?你的团队准备好了吗?观看本次网络研讨会，了解将会发生什么，并深入了解DI如何在检查中发挥作用，以及如何理解和回答检查员的问题。

看网络研讨会

赞助内容

关注数据的可重复性

近年来，由于许多原因，人们越来越关注数据的可重复性，有报道称“再现性危机在某些领域。²那么，为什么数据可重复性越来越受到关注呢?

“首先，学术数字资产(包括数据集、代码、模型、文章、预印本、协议)的规模和多样性不断增长，给我们目前对共享信息进行同行评审和质量控制的机制带来了压力，”Sansone说。“其次，由于一些原因，绝大多数处于公共领域的数据集和代码仍然不能重用。即使它是公开的，它也经常被描述得很糟糕，这意味着它不适合第三方使用。”

这方面的一个相当大的障碍是，在研究人员开始重新使用数据集来回答研究问题之前，数据集仍然需要大量的准备工作。准备用于共享的数据需要时间和精力。

Markowetz说:“需要认识到的一件重要的事情是，在短期内，你需要采取的使数据可再现的步骤不会让你的生活变得更容易，因为你必须学习各种各样的新工具。”“如果你只是想把你拥有的所有信息拼凑成一张表格，我敢肯定，Excel比学习如何编程和整理数据要快得多。所以，你必须把它视为一项长期投资。”

在Markowetz的实验室中，他们通过在收集和分析的不同阶段使用Python、R和Github中可用的数据管理和版本控制工具来实现可重复性。他解释说:“一个普遍的问题是管理混乱的数据，一个科学术语或药物名称可能有十种或更多不同的拼写，必须有人清理这些数据——这是朝着整洁数据迈出的重要一步。”“一旦我们知道了分析的方向，我们就会尽可能多地记录，因为我们希望，如果成功了，这将是我们的下一篇论文。我们不想陷入一种愚蠢的境地，忘记了我们是如何得到结果的。在多学科环境中实现数据可再现性的最实际步骤是，每个人都知道如何编程软件语言，知道GitHub等版本控制系统是如何工作的，然后你就差不多做到了。”

避免假阳性的ELISA数据

酶联免疫吸附测定(elisa)通常用于定量血清、血浆和细胞培养上产物中的生物标志物。这些样品含有多种可能干扰ELISA结果的因素，通常称为基质效应。下载此应用程序注释，以了解更多关于检测人类GDNF时阻断试剂的重要性，以及在其他Quantikine Elsa试剂盒中检测阻断试剂的重要性。

查看App

赞助内容

全系统努力提高数据再现性

值得庆幸的是，随着越来越多的资助者和出版商对更开放的数据访问设置了期望，有更多的工具正在开发以支持这一点，以及更多关于如何以可复制的方式工作的指导和培训。

2016年，Sansone与一群国际公认的数据管理领导者共同撰写了公平的原则-一套指导原则，以确保当代数据资源和学术成果是可查找、可访问、可互操作和可重复使用的(FAIR)。^3.这些方法已经被科学生态系统中的许多利益相关者广泛采用，并推动了关于更好的数据管理的全球辩论。

“资助机构现在正在将FAIR原则整合到他们的资助协议中，出版商联合起来支持FAIR，作为一种保持开放研究前沿的方式，在私营部门，FAIR正在被主要生物制药公司、图书馆和工会采纳并写入政策中，”Sansone说。这些原则也得到了全球和政府间领导人的认可，如20国集团、七国集团开放科学专家组和经济合作与发展组织(OECD)科学和技术政策委员会事实上的良好的研究数据管理的全球规范，也是数据科学的先决条件。”

但是，尽管FAIR原则加速了全球对各个学科更好的数据管理的讨论，但它们仍然需要付诸实践。尽管已经有了一些改进，但数据仍然很少遵循FAIR原则，它们仍然是令人振奋的。

利用扩展现实(XR)技术来提高实验室的生产力

为了使实验室的产出最大化，科学家们需要能够依靠技术进步、创新软件和改进的流程。最终，通过简化日常活动来提高生产力是成为未来实验室的主要组成部分。观看本次网络研讨会，了解更多关于完全连接的生态系统的价值，以及如何在实验室中实现这一目标。

看网络研讨会

赞助内容

将公平原则转化为实践

世界各地的许多社区正在努bet188真人力将FAIR变成现实。“这是通过设计和实施相关的技术和社会基础设施，以及文化和政策变革，并辅以新的教育和培训要素来实现的，”Sansone说。“这项工作不仅需要研究人员参与，还需要数据生命周期中的所有利益相关者参与:从开发人员、服务提供商、图书馆员、期刊出版商、资助者、学术团体以及商业和政府机构。”

一个这样的例子是UKRN该项目由布里斯托尔大学的马库斯·穆纳福教授领导，马科维茨是剑桥大学的当地负责人。马科韦茨解释说:“之所以设立这个项目，是因为可重复性是一个比个别机构和个别学科更大的大问题。”“所以，在全国范围内用一种更加一致的方法来解决这个问题是有意义的，现在在不同的国家都有很多可重复性网络。”不同国家的研究文化和格局不同，所以我们必须在国家层面上解决这个问题。这是一项全英国范围内的倡议，旨在提高从心理学到政治学和生物医学等学科的可重复性。”UKRN正在通过两种方式解决这个问题:通过与资助者的高层合作和建立基础设施来支持可重复性，以及在基层通过关于如何可重复性地进行科学研究的培训研讨会，涵盖从编程到领导的所有内容。

“真正需要的是大学的研究领导者更明确地支持数据可重复性，”Markowetz说，“我们有这些大型的国家努力，如UKRN，以及早期职业研究人员的许多兴奋和参与，但我们还没有中间部分，即个别大学的高级领导层认真对待这一问题，例如改变他们的终身教职流程或学术职业发展框架。”

在牛津，Sansone通过她的工作帮助支持UKRN的努力和其他国家类似的国家倡议数据准备小组，该组织研究和开发提高数据重用的方法和工具。她的团队与国际利益相关者合作，开发了促进公平的资源，例如fairshare和合理的食谱主要制药公司支持UKRN及其在其他国家的同行的工作。⁴

不过，最终还是要归结到研究界的个人实践。“社区需要通过改变研究文化(我们做研究的环境)及其研究实践(我们做研究的方式)来帮助自己，”Sansone说。“科学是一项团队运动，团队合作很难:但你必须发挥你的作用。更好的数据意味着更好的科学。”

参考文献

1.重复工作的五个自私理由。基因组医学杂志。2015; 16:274 . .doi:10.1186 / s13059 - 015 - 0850 - 7

2.1500名科学家揭开了再现性的面纱。自然2016; 533:452 - 454。doi:10.1038 / 533452

3.Wilkinson MD, Dumontier M, Aalbersberg IJ，等。科学数据管理和管理的FAIR指导原则[已发表的更正见科学数据．2019年3月19日;6(1):6科学数据2016; 3:160018。doi:10.1038 / sdata.2016.18

4.王志强，王志强，王志强，等。FAIRsharing作为标准、存储库和政策的社区方法。生物科技Nat》．2019; 37:358 - 367。doi:10.1038 / s41587 - 019 - 0080 - 8