事后测试统计分析

文章

发表:2023年3月20日

艾略特特工

希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“事后测试统计分析”

名字*

姓*

电子邮件地址*

国家*

公司类型*

工作职能*

你愿意接受进一步的电子邮件通信技术网络吗?188金宝搏备用

听与

喋喋不休地说

0:00

注册免费听这篇文章

谢谢你！听这篇文章使用上面的球员。✖

阅读时间:

在本文中,我们回顾历史数据测试统计分析的功能,如何解释和何时使用它们(而不是使用它们)。

事后测试是什么?

事后测试后进行统计分析有多个意义进行测试,“因果”来自拉丁语“后”。因果分析代表一个方法调整或重新解释的结果占复合不确定性和风险的错误(可以更低的)固有的执行统计测试。你也可以看到其事后测试称为多重比较测试(mct)。

测试的意义

首先,它可能是有用的回顾一下我们所说的统计显著性检验,然后探讨如何执行多个测试可能会导致虚假的结论。意义或假说测试可以用许多类型的数据,在许多不同的情况。执行的第一步是定义一个“零假设”。然后我们计算假定值的量化证据反对这个零假设的力量。假定值的观察结果的概率是一个极端,或者比这更极端,你观察到如果零假设是真的。换句话说,由于机会这一结果发生的概率。假定值越小,越强对零假设的证据。

例如,我们可能想要调查是否意味着收缩压两组患者之间的不同。我们将测试零假设(通常写成H₀),这两个观察意味着相等(组)之间没有区别。然后我们计算检验统计量,使用一个已知的理论检验统计量的分布,并获取和解释的假定值,给了我们一个理念的力量对零假设的证据。

正确解读假定值可以是一个棘手的业务。假定值存在在0和1之间的连续体,通常使用任意截止值为0.05时表示一个“显著”的结果。0.05显著性水平(或α级)可以用于其他目的,如计算所需的样本大小一项研究。

事后测试告诉你什么?

解释多种假定值变得更加棘手,这是一些研究人员利用其事后的阶段测试。如果我们测试一个零假设,事实上是正确的,使用0.05显著性水平,有一个0.95的概率得出正确的结论在接受零假设。如果我们测试两个独立的零假设是真的,得出正确结论的概率接受零现在0.95 x 0.95 = 0.90。因此,更多的意义测试我们一起执行,加剧风险越高我们错误地拒绝零假设,实际上是真正的(这就是所谓的错误或假阳性——看到表1)。换句话说,如果我们继续测试一遍又一遍,我们最终会找到一个“重大”的结果,这就是为什么必须小心解释假定值的多个测试。在0.05显著性水平,此外,我们可能期望一个重要结果是观察到的机会单独测试每20次意义。因果分析,如Bonferroni测试多个比较,旨在平衡组合风险和调整假定值来反映这一错误的风险。的Bonferroni测试实质上是一系列t上执行对多元组被测试。

测试拒绝零假设

测试失败拒绝零假设

零假设是正确

第一类误差

假阳性

正确的决定

没有区别

零假设是错误的

正确的决定

真正的区别

II型错误

假阴性

表1:总结的四种可能的假设检验结果的差异。

其他常见的因果测试包括以下:

图基的测试——一种常见的因果检验,使调整当比较组的测试数据计算图基的诚实的显著差异(HSD),估计组之间的区别以及置信区间。
矫正人员的测试——测试也调整测试统计数据组间比较和计算95%置信区间差异但在更保守的方式比图基的测试。

不太常见的因果测试存在各种各样的问题,总结可以发现在这里。这些测试会给类似的结果,只是以不同的方式方法因果分析。

Bonferroni测试

计算Bonferroni测试是通过简单地把你正在进行假设检验的显著性水平(通常α= 0.05)和除以执行单独测试的数量。例如,如果研究人员正在调查的区别两个十子组的患者的治疗(所以10测试用单独的意义n)与α/ Bonferroni调整计算n= 0.05/10 = 0.005。

因此,如果任何意义的测试了p值< 0.005,我们会得出这样的结论:测试在0.05显著性水平显著,而且有证据显示区别两个治疗小组。

当不要使用因果测试?

与许多统计程序,缺点甚至有时争议上使用其事后测试。一些统计学家不喜欢使用其事后测试如Bonferroni测试由于通货膨胀的风险II型错误(不拒绝零假设时,它实际上是false)作为第一类误差调整,暗示比较应该解释不同的根据有多少其他测试执行,依赖其事后测试缺乏集中的研究问题和假设检验的方法。

相反,它建议应该设计为研究特定的子群的差异或假设之前感兴趣的一个执行分析,这样的结论是由因果框架和先验知识和机会而不是数据。一个这样的例子在实践中可能看起来像预先登记的临床试验,为了使研究人员预录制和证明假说和研究设计前的分析。经过精心研究设计,分析计划和结果的解释,许多统计学家和分析师避免事后测试没有上述方法论的严格。

此外,由于其事后测试的目的是重新解释或者设置一个新的标准达到统计上显著的发现,一些人认为,停止其事后测试是兼容的使用运动从统计学意义更一般的概念。假定值可以和所误导研究人员和过度依赖统计上显著的结果有些武断的阈值(< 0.05)常常忽略了上下文,如统计假设,数据质量,之前的研究在该地区和潜在机制——这些发现。

满足作者