可重复性vs.再现性

文章

发布日期:2019年3月25日

|最后更新:2021年12月20日

Ruairi J Mackenzie

想要这篇文章的免费PDF版本?

填写下面的表格，我们会将PDF版本的“可重复性vs.再现性”

名字*

姓*

电子邮件地址*

国家*

公司类型*

工作职能*

您是否希望收到来自技术网络的进一步电子邮件通信?188金宝搏备用

188金宝搏备用科技网络有限公司需要您提供给我们的联系信息，以便就我们的产品和服务与您联系。您可以随时退订这些通讯。有关如何退订的信息，以及我们的隐私惯例和保护您隐私的承诺，请查看我们的隐私政策

阅读时间:

在衡量实验质量时，重复性和再现性是关键。在本文中，我们将探讨这两个术语之间的区别，以及为什么它们在确定已发表研究的价值方面很重要。

什么是可重复性?

可重复性是一种可能性的衡量，从一个实验中产生了一个结果，你可以用相同的设置尝试相同的实验，并产生完全相同的结果。对于研究人员来说，这是一种验证他们自己的结果是真实的，而不仅仅是偶然的人工制品的方法。

为了证明一项技术的可重复性，实验条件必须保持不变。这些包括:

位置
测量工具
实验中使用的其他仪器
观察者
假设
时间段(在重复练习之间间隔一个月的时间并不是一个好习惯)

布兰德和奥特曼他在1986年撰写了一篇非常有用的论文，强调了评估可重复性的一个好处:它允许人们在不同的测量方法之间进行比较。

先前的研究使用相似的相关系数(r)作为达成一致的指标。Bland和Altman证明了这一点r实际上是测量两种技术之间关系的强度，而不是它们彼此一致的程度。这意味着r在这里是没有意义的;如果两种不同的技术都是用来测量心率的，如果它们彼此没有联系，那就太奇怪了!

Bland和Altman表明，另一方面，可重复性可用于比较两种技术。通过计算一种技术所获得的多个测量值的平均值，并将这些平均值与另一种技术得出的平均值配对，我们可以计算出两种技术是否一致。

如果数据服从正态分布，则这种差异(或至少95%)的可接受极限是+/-1.96倍于两种技术之间均值差异的标准偏差。

什么是可重复性?

的再现性数据的优劣是衡量一篇论文中的结果是否可以由不同的研究团队使用相同的方法得到的标准。这表明所获得的结果不是一个研究实验室中独特设置的人工制品。很容易理解为什么可重复性是可取的，因为它加强了研究结果，防止了罕见的欺诈案例，或者不罕见人为失误的案例，在产生重大成果的时候。

为什么可重复性和再现性很重要?

科学是建立在科学基础上的方法方法通过独立的验证和显示你的发现是正确和透明的能力来逐步推进。学术研究发现只有在知识能够在研究小组之间重复和共享时才对更广泛的科学界有用。因此，不可复制和不可重复研究都是科学界关注的焦点。

什么是可复制性危机?

近几十年来，科学，特别是社会科学和生命科学，越来越重视已发表研究的可重复性。评估科学出版物可重复性的大规模努力已经出现令人担忧的结果。例如，一组被称为“开放科学合作”的心理学研究人员在2015年发表的一篇论文检查了发表在高级同行评审期刊上的100个实验。在这100项研究中，仅为68复制提供了与原始发现相匹配的统计显著结果。这些努力是一个不断发展的领域的一部分。metascience，旨在解决可复制性危机。

但是可复制性呢?

虽然可重复性和可再现性之间的区别很清楚，但有时第三个术语，可复制性，会把水弄浑。对于一些作者来说，可复制性和可再现性是可以使用的互换．对另一些人来说，区别是巨大的重要性．有时，作者们试图这样做交换它们或者完全删除一个．这些不同尝试的历史可以在这本优秀的书中阅读文章．这可能会让人有点困惑，但本指南至少将尝试使用前面的内容，使您更清楚建立了定义这两个术语:

再现性 (不同的团队，相同的实验设置)。如果一个观察是可重复的，它应该能够由不同的团队使用相同的实验数据和方法，在相同的操作条件下，在相同或不同的地点，在多次试验中重复实验

可复制性 :(不同的团队，不同的实验设置)。如果一个观察结果是可复制的，那么它应该能够由不同的团队，在不同的地点，使用不同的测量系统和数据集，进行多次试验。因此，这需要重新收集数据。

这意味着可复制性比可再现性在某种程度上更难实现，但这也说明了为什么可再现性危机如此具有破坏性:如果结果是基于充分报告的方法，使用可靠的数据，那么它们应该始终是可再现的。

我们如何提高再现性?

我们花了很多心思改善实验重现性。下面是一些你可以提高重复性的方法:

杂志清单-越来越多期刊我们开始理解在已发表的研究中包含所有相关细节的重要性，并为任何已发表的论文引入强制性检查清单。在方法部分省略样本数量和动物模型描述的日子已经过去了，在可能的情况下，盲法和随机化应该成为标准。
严格统计-功率计算，多重比较测试和描述性统计至关重要的确保报告的结果在统计上是可靠的。
科技可以帮上忙- - - - - -自动化流程和使用高通量系统可以提高单个实验的准确性，并在给定的时间内进行更多的测量，增加样本数。