我们已经更新我们的隐私政策使它更加清晰我们如何使用您的个人资料。

我们使用cookie来提供更好的体验。你可以阅读我们的饼干的政策在这里。

广告

Mann-Whitney U测试:假设和例子


希望这篇文章的一个免费的PDF版本吗?

完成下面的表格,我们将电子邮件您的PDF版本“Mann-Whitney U测试:假设和榜样”

听与
喋喋不休地说
0:00
注册免费听这篇文章
谢谢你!听这篇文章使用上面的球员。
阅读时间:

Mann-Whitney U测试是什么?

Mann-Whitney U测试,也称为Wilcoxon等级和测试,是一种非参数统计检验用来比较两个样品或组。


Mann-Whitney U测试评估两个采样组是否可能来源于相同的人口,和基本要求;做这两个群体对于他们的数据具有相同的形状?换句话说,我们想要的证据是否组织来自感兴趣的人群提供不同级别的一个变量。它遵循Mann-Whitney U测试的假设是:


  • 零假设(H0)是两个的数量是相等的。
  • 备择假设(H1)是两个数量是不平等的。


一些研究人员认为这是比较两个种群之间的中位数(相比之下,参数测试两个独立组之间比较的手段)。在某些情况下,数据也同样形状(见假设),这是有效的,但应该注意的是,中位数不实际参与Mann-Whitney U检验统计量的计算。两组有相同的值,可以根据Mann-Whitney U测试明显不同。

何时使用Mann-Whitney U测试

非参数测试(有时称为“传播变为免费测试”)使用当你认为感兴趣的人群中数据没有一个正态分布。你能想到的与类似于曼Whitney u测验未配对的学生的学习任务,您将使用假设两个种群是正态分布时,他们所定义的方法和标准偏差(分布的参数)。


图1:正态分布和偏态分布

Mann-Whitney U测试是一种常见的统计测试,在许多领域包括经济学、生物科学和流行病学。这是特别有用,当你评估的区别两个独立的团体较低数量的个人每组(通常小于30),非正态分布,数据是连续的。如果你有兴趣比较以上两组数据倾斜,克鲁斯卡尔-沃利斯单向方差分析(方差分析应该使用)。


Mann-Whitney U检验假设


一些关键假设Mann-Whitney U测试详细如下:

  • 两组变量之间的比较连续(可以任意数量的范围——例如年龄,体重,身高或心率)。这是因为测试排名是基于观察每组中。
  • 假定需要的数据非正态或倾斜分布。如果您的数据是正态分布,未配对的学生的学习任务应该被用来比较两组。
  • 虽然两组中的数据不被认为是正常的,数据被认为是相似的形状在两组。
  • 应该有两个随机选择的数据独立的样品,这意味着组织没有关系。如果样本配对(例如,两个测量从同一组的参与者),那么应该使用配对样本t检验。
  • 足够的样本大小需要一个有效的测试,通常超过5观察每组中。

Mann-Whitney U测试例子

考虑一个随机对照试验评估一个新的抗逆转录病毒药物疗法。试点试验参与者随机分配治疗或不治疗组(N = 14)。我们要评估病毒载量(每毫升血液中病毒的数量)的治疗和治疗组。在实践中,Mann-Whitney U测试会轻松快速地计算使用SPSS等统计软件或占据,但下面列出的步骤。


数据如下所示:


治疗 540年 670年 1000年 960年 1200年 4650年 4200年
未经处理的 5000年 4200年 1300年 900年 7400年 4500年 7500年

这些数据都是倾斜的样本大小n = 7在每个治疗手臂,所以非参数测试是合适的。我们计算测试之前,我们选择一个显著性水平(通常α= 0.05)。第一步是将排名分配给的值全部样本汇集(治疗组)从最小到最大。我们可以生成一个基于行列的检验统计量。


下表显示了病毒载量值处理和未经处理的组排名最小最大,随着总结每组的排名:

病毒载量(治疗)
病毒载量(未处理)
排名(治疗) 排名(未处理)
540年
1
670年
2

900年
3
960年
4
1000年
5
1200年
6

1300年
7
4200年
8

4500年

9

4650年
10

5000年
11

6100年
12

7400年
13

7500年
14


R1= 36
R2= 69


加法每个组的排名后,Mann-Whitney U选择检验统计量的最小的的两个U值计算:

一个例子的形象Mann-Whitney U检验统计量

的一个例子Mann-Whitney U检验统计量

的一个例子Mann-Whitney U检验统计量


我们让1表示治疗组和2表示未治疗组(组的外延是任意的),n1和n2参与者的数量和R1和R2的金额在治疗和治疗组,分别。在这个例子中,U1 = 41和U2 = 8。因此,我们选择U = 8作为测试数据。


正常的近似

样本量的情况有可能是太大的参考表用来计算准确的概率分布,在这种情况下,我们可以用一个正常的近似代替。U是发现通过添加独立以来,类似的分布式随机抽样,中心极限定理适用于大样本时(通常每组> 20)。等级之和的标准差可以用来生成一个z统计量和意义价值生成的这种方式。如果零假设是真的,U的分布接近正态分布。



接下来,我们确定的临界值U来比较我们的计算检验统计量,我们可以使用参考表重要的价值观和使用我们的样本大小两组(n = 7)和双边层次的意义(α= 0.05)。


在当前的例子中,可以确定临界值从参考表8所示。最后,我们可以使用它来接受或拒绝零假设使用以下决策规则:否定H0如果你≤8。


鉴于U统计等于临界值,我们可以拒绝零假设,两组相等并接受备择假设,有证据表明治疗组之间的不同病毒载量与新疗法和治疗。


艾略特特工是r流行病学和统计学esearch研究员伦敦卫生与热带医学学院的

满足作者
艾略特特工
艾略特特工
广告
Baidu