我们已经更新了隐私政策为了更清楚地说明我们如何使用您的个人资料。

我们使用cookie为您提供更好的体验。你可参阅我们的饼干的政策在这里。

广告

解决再现性危机,一步一个脚印


想要这篇文章的免费PDF版本?

填写下面的表格,我们会将PDF版本的“解决再现性危机,一步一个脚印”

听与
喋喋不休地说
0:00
免费注册收听这篇文章
谢谢你!用上面的播放器听这篇文章。
阅读时间:

提供可重复的科学发现——即在独立重复研究时始终观察到的结果——是确保科学研究可信度的关键;有些人甚至会说可重复性是科学与非科学的分界标准”。然而,在这个技术迅速发展的时代,科学合作、实验和数据分析在许多方面比以往任何时候都更快、更容易,大多数科学研究人员都同意,我们有一个“再现性危机的问题。对已发表的研究有多少可复制的实证尝试表明,已发表的科学发现是可复制的更可能是错误的(即不可复制的)而不是正确的

这是一个复杂的问题,由不同层面的偏见造成,从单个研究人员的认知偏见,到期刊发表的偏见,以及我们当前科学心态中固有的偏见。但作为个体研究人员和研究团队,我们都可以寻求解决潜在的问题实践。通过发展最新的统计和方法最佳实践,采取措施减轻我们自己的认知偏见,并努力在我们如何报告我们的研究时尽可能透明,我们可以帮助解决可重复性危机,一步一个脚印。

意识到自己的偏见,并采取措施减轻它们


作为人类,尤其是作为在我们的研究领域拥有既得利益的热情科学家,我们很容易受到认知偏差的影响,比如确认偏差——倾向于关注支持我们信念的证据——以及后见之明偏差——倾向于在事件发生后才将其视为可预测的。这种偏差会让我们很难意识到我们何时从事了有问题的实践,如“p黑客”,即通过改变预处理或分析程序的小方面来利用分析的灵活性,以使结果更有统计意义。马库斯·穆纳夫
o 布里斯托尔大学的生物心理学教授解释说:“一旦我们看到数据,就很容易对数据中的明显模式感到兴奋——我们都进入科学领域,因为我们想要发现一些东西。但如果我们不小心,这种兴奋和热情可能会把我们引入歧途,作为人类,我们有一种天然的倾向,可以在噪音中看到模式。”

我们有几种实用的方法可以保护自己不被自己的偏见误导,包括盲目。根据实验设计的不同,研究参与者和那些进行数据收集的人可能会对调查中的不同实验条件和/或关键研究假设进行盲视。这并不适用于所有的实验设计,但对于几乎所有的研究,都应该可以进行盲统计分析,这样在数据准备和分析过程中,实验条件和变量标签的身份被掩盖,以确保像识别异常值这样的过程不受研究人员自己对结果应该显示的期望的影响。

另一种防止偏见对数据收集和分析的影响的方法是预注册,在开始计划的研究之前,研究人员发表一份声明,概述他们的研究设计、主要结果和分析计划。穆纳夫教授说:“预注册只是在我们开始研究之前,列出我们打算做什么的一种方式。
o 澄清。他接着解释说,这可以帮助我们免受偏见的影响,这种偏见可能会导致我们进行有问题的分析实践,“通过明确地陈述我们一开始的计划,来提醒我们自己。”因此,预注册可以帮助阻止研究人员利用分析的灵活性来使他们的结果看起来更新颖或更具结束性。支持学习预注册的网站越来越多开放科学架构为刚接触这种方法的研究人员提供预注册服务和指导。正如巴斯大学(University of Bath)心理学高级讲师凯瑟琳•巴顿(Katherine Button)所指出的,预先注册“处理得当”也会起到同样的作用 “迫使你思考研究设计的许多关键方面,这些方面对可重复的结果很重要(例如,明确的假设,样本量的证明,分析计划)。”

有效的协作有助于解决可复制性危机

科学研究是建立在自身基础上的,所以当过去的结果无法重现时,我们所知的科学基础就会受到质疑。近年来,这已成为一个越来越令人担忧的问题;根据《自然》杂志的一项调查,超过70%的研究人员表示无法复制另一位科学家的实验。解决这个所谓的“可重复性危机”是科学界面临的最大挑战之一。在本白皮书中,我们将发现高效的数字化协作如何通过技术解决方案帮助解决可复制性危机。

视图白皮书

保持最新的方法和分析最佳实践


在许多情况下,做可重复科学的尝试可能会被常见的误解和缺乏对方法和统计学的理解所混淆;例如,误解了统计力量的意义和重要性。
分析和方法的最佳实践正在不断改进,特别是在这一时期 metascience (对科学本身及其运作方式的研究)是一个蓬勃发展的研究领域。在没有继续教育的正式要求和/或计划的情况下,应该鼓励研究人员 充分利用免费教育资源。关于方法和分析重要性的关键主题的简短、互动、基于网络的模块越来越多,例如应用程序“P-hacker 这表明,如果你足够努力,就很容易得出统计上显著的发现。

在提高分析的严谨性方面,
o 作为研究人员,我们能做的一件事就是确保,我们的研究得到了充分的支持。Munafò教授解释说:“在其他条件相同的情况下,规模较小的研究往往得出不那么精确的结果,这意味着它们可能不太可能被重复。”他概述了“一个很好的说明研究他们研究了那些试图进行复制的研究——原始研究的规模越大,这一发现在随后的复制研究中被复制的可能性就越大。”虽然方法论的最佳实践表明,研究的功率应该达到80%左右,但在已发表的神经科学文献中估算功率的经验尝试表明,研究是这样的平均只有20%的动力解决他们的关键研究问题。

根据定义,低统计力反映了发现真正真实的效应(即增加假阴性)的概率降低,但也破坏了科学的可重复性。也许与直觉相反,统计功率越低,所观察到的效应达到任意统计显著性水平(如p < 0.05)实际反映真实效应的概率就越低,从而更有可能发现假阳性。巴顿博士进一步解释说:“有了更大的样本,你就不太可能错过真正的影响,当你发现一个显著的结果时,假阳性的可能性也就更小。更大的样本也会增加你的效应估计的精度,所以只要你的样本具有代表性,你的结果就会更接近真实的总体效应,置信区间更小。”

所有研究人员可以帮助减少假阳性和夸大效应量对可重复性造成的威胁的一种方法是进行先验幂计算,以确定足够的样本量来解决他们的关键研究问题。有许多免费且易于使用的软件包可以做到这一点,包括常用的软件包GPOWER
当单个研究团队内部缺乏资源而使大规模研究变得困难时,研究团队之间和多个站点之间的合作在增强力量方面是无价的。巴顿博士说,她的研究合作网络“ 使用开放科学框架来管理[他们的]合作项目,并在可能的情况下选择开源软件和资源,以最大限度地提高[他们的]共享能力。”

提高报告的透明度


当我们阅读和评估科学文献时,w
我们依赖于所有的报告都是透明的,这样我们就可以判断结果是否值得信赖,以及在什么条件下它们可能适用。当被要求为寻求进行更多可重复研究的研究人员提供一个关键信息时,Munaf教授 o 声明: “我们能控制的一件事是我们工作的透明程度。”

为了使我们的研究更加透明,我们可以采取很多实际的步骤。重要的是,当我们报告研究结果时,我们可以明确哪些是验证性分析,哪些是探索性分析。寻求进行可重复的研究"
这并不妨碍我们进行探索性分析……”Munaf教授建议道 o ,它只要求我们“……明确哪些分析是预先指定的(即验证性的),哪些不是(即探索性的)。”探索我们获得的数据对于产生新的假设是非常有用和重要的,但在探索性分析的情况下,研究人员应该只描述他们在数据中观察到的东西,而不是报告p值或显著性检验,因为p值根据定义是用来检验预先存在的假设的。通过明确哪些分析是验证性的,哪些是探索性的,研究人员可以告诉读者哪些影响应该是可复制的,哪些需要进一步调查才能被认为是真实的、可重复的发现。

研究人员提高透明度的其他方法是记录所有预处理和数据清理步骤,使他们的分析管道公开可用(或者更好的是,使用已经存在的标准化管道,因为这可以额外防止分析不当行为,如p-hacking),并使所有研究数据公开可用。Munaf教授
o 强调了如何采取这些迈向透明度的步骤也有助于我们成为更高效的研究人员。他解释说,在他的研究小组中,“准备我们的数据用于共享[…]意味着我们必须仔细管理我们的数据——标记良好的数据文件和分析代码,描述变量的相应数据字典,描述研究基础知识的自述文件。这意味着数据对任何人来说都很容易理解,这也意味着我们如果我们在几个月或几年后再去看它们,就能更好地理解它们。”所有数据都来自Munaf教授 o 的研究小组,可从布里斯托尔大学数据仓库.提高研究报告质量和透明度的指南随处可见,并为不同类型的研究设计提供了质量报告的具体指南,其中许多可通过在线数据库获得赤道网

在Zetasizer Ultra上进行颗粒浓度测量的最佳实践

测量样品的颗粒浓度类似于测量其大小,但样品制备和样品测量特性的影响会对浓度测量产生重大影响。为了确保数据的准确性和可重复性,在样品制备和测量过程中遵循最佳实践是至关重要的。下载本指南,了解如何确保获得高质量的颗粒浓度数据。

查看指南

朝着做更具可重复性的研究迈出了一步


无论你是朝着更透明地报告你的结果和程序迈出了一步,还是承诺在最近的方法和统计进展方面进行一些进一步的培训,或者预先登记你的下一项研究,以帮助防止数据收集和分析过程中的偏差,来自那些研究最佳实践的关键信息是,承诺做一些事情,并在设计时考虑可重复性指南,而不是报告。当你的数据的再现性可能已经受到了很大的“损害”
不。“有很多开放的研究实践——预注册、共享数据、发布预印本,”Munafò教授解释说,“一次可以做很多事情,所以我的建议是做一些事情——任何对你来说最简单和最有趣的事情。”

与作者见面
广告
Baidu