可重复性vs.再现性
在衡量实验质量时,重复性和再现性是关键。在本文中,我们将探讨这两个术语之间的区别,以及为什么它们在确定已发表研究的价值方面很重要。
什么是可重复性?
可重复性是一种可能性的衡量,从一个实验中产生了一个结果,你可以用相同的设置尝试相同的实验,并产生完全相同的结果。对于研究人员来说,这是一种验证他们自己的结果是真实的,而不仅仅是偶然的人工制品的方法。
为了证明一项技术的可重复性,实验条件必须保持不变。这些包括:
- 位置
- 测量工具
- 实验中使用的其他仪器
- 观察者
- 假设
- 时间段(在重复练习之间间隔一个月的时间并不是一个好习惯)
布兰德和奥特曼他在1986年撰写了一篇非常有用的论文,强调了评估可重复性的一个好处:它允许人们在不同的测量方法之间进行比较。
先前的研究使用相似的相关系数(r)作为达成一致的指标。Bland和Altman证明了这一点r实际上是测量两种技术之间关系的强度,而不是它们彼此一致的程度。这意味着r在这里是没有意义的;如果两种不同的技术都是用来测量心率的,如果它们彼此没有联系,那就太奇怪了!
Bland和Altman表明,另一方面,可重复性可用于比较两种技术。通过计算一种技术所获得的多个测量值的平均值,并将这些平均值与另一种技术得出的平均值配对,我们可以计算出两种技术是否一致。
如果数据服从正态分布,则这种差异(或至少95%)的可接受极限是+/-1.96倍于两种技术之间均值差异的标准偏差。
什么是可重复性?
的再现性数据的优劣是衡量一篇论文中的结果是否可以由不同的研究团队使用相同的方法得到的标准。这表明所获得的结果不是一个研究实验室中独特设置的人工制品。很容易理解为什么可重复性是可取的,因为它加强了研究结果,防止了罕见的欺诈案例,或者不罕见人为失误的案例,在产生重大成果的时候。
为什么可重复性和再现性很重要?
科学是建立在科学基础上的方法方法通过独立的验证和显示你的发现是正确和透明的能力来逐步推进。学术研究发现只有在知识能够在研究小组之间重复和共享时才对更广泛的科学界有用。因此,不可复制和不可重复研究都是科学界关注的焦点。
什么是可复制性危机?
近几十年来,科学,特别是社会科学和生命科学,越来越重视已发表研究的可重复性。评估科学出版物可重复性的大规模努力已经出现令人担忧的结果。例如,一组被称为“开放科学合作”的心理学研究人员在2015年发表的一篇论文检查了发表在高级同行评审期刊上的100个实验。在这100项研究中,仅为68复制提供了与原始发现相匹配的统计显著结果。这些努力是一个不断发展的领域的一部分。metascience,旨在解决可复制性危机。
但是可复制性呢?
再现性 (不同的团队,相同的实验设置)。如果一个观察是可重复的,它应该能够由不同的团队使用相同的实验数据和方法,在相同的操作条件下,在相同或不同的地点,在多次试验中重复实验
可复制性 :(不同的团队,不同的实验设置)。如果一个观察结果是可复制的,那么它应该能够由不同的团队,在不同的地点,使用不同的测量系统和数据集,进行多次试验。因此,这需要重新收集数据。
这意味着可复制性比可再现性在某种程度上更难实现,但这也说明了为什么可再现性危机如此具有破坏性:如果结果是基于充分报告的方法,使用可靠的数据,那么它们应该始终是可再现的。
我们如何提高再现性?
我们花了很多心思改善实验重现性。下面是一些你可以提高重复性的方法: