曼-惠特尼U检验:假设和例子
什么是曼-惠特尼U型检验?
Mann-Whitney U检验,也称为Wilcoxon秩和检验,是一种用于比较两个样本或组的非参数统计检验。
曼-惠特尼U检验评估两个抽样组是否可能来自同一总体,并基本上要求;这两个群体的数据是否相同?换句话说,我们需要证据来证明这些群体是否来自具有不同水平的感兴趣变量的人群。由此可知,Mann-Whitney U检验的假设为:
- 零假设(H0)是两个总体相等。
- 替代假设(H1)是两个总体不相等。
一些研究人员将其解释为比较两个群体之间的中位数(相比之下,参数检验比较两个独立群体之间的平均值)。在某些情况下,数据的形状相似(见假设),这是有效的-但应该注意的是,中位数实际上并不涉及曼-惠特尼U检验统计量的计算。根据Mann-Whitney U检验,两组可能具有相同的中位数,但有显著差异。
何时使用曼-惠特尼U检验
非参数检验(有时称为“无分布检验”)用于假定感兴趣总体中的数据不具有正态分布。你可以把曼-惠特尼u检验看作是类似于学生t检验,当你假设你的两个总体是正态分布时,你会使用它,由它们的均值和标准差(分布的参数)定义。
图1:正态分布与偏态分布
曼-惠特尼U检验是一种常见的统计检验,被用于许多领域,包括经济学、生物科学和流行病学。当您评估两个独立组之间的差异时,它特别有用,每个组中的个体数量较低(通常小于30),这些组不是正态分布,并且数据是连续的。如果您有兴趣比较两个以上数据偏倚的组,则采用Kruskal-Wallis单向方差分析(方差分析)。
Mann-Whitney U检验假设
Mann-Whitney U检验的一些关键假设如下:
- 两组之间进行比较的变量必须为连续(可以取范围内的任何数字,例如年龄、体重、身高或心率)。这是因为测试是基于对每组观察结果的排名。
- 假设数据取a非正态或倾斜分布。如果您的数据是正态分布,则应使用未配对的学生t检验来比较两组。
- 虽然两组数据都不被假定为正常,但数据被假定为正常形状相似在两组中。
- 数据应该是随机选择的两个独立的样本,意味着组之间没有关系。如果样本是配对的(例如,来自同一组参与者的两个测量值),则应该使用配对样本t检验。
- 足够的样本大小为有效检验所必需,通常每组多于5个观察值。
Mann-Whitney U检验示例
考虑一项随机对照试验,评估一种新的艾滋病毒抗逆转录病毒疗法。试验性试验随机将参与者分为治疗组和未治疗组(N=14)。我们想评估治疗组和未治疗组的病毒载量(每毫升血液中的病毒量)。在实践中,使用SPSS或Stata等统计软件可以轻松快速地计算出Mann-Whitney U检验,但步骤如下。
数据如下:
治疗 | 540 | 670 | 1000 | 960 | 1200 | 4650 | 4200 |
未经处理的 | 5000 | 4200 | 1300 | 900 | 7400 | 4500 | 7500 |
这些数据在每个处理组的样本量均为n=7,因此采用非参数检验是合适的。在我们计算检验之前,我们选择一个显著性水平(通常α=0.05)。第一步是对整个样本(两个处理组合并在一起)中的值按从小到大的顺序进行排序。然后,我们可以根据排名生成一个检验统计量。
下表显示了治疗组和未治疗组的病毒载量从小到大的排序,以及各组的总和排名:
病毒载量(已处理) |
病毒载量(未经处理) |
排名(治疗) | 排名(未处理) |
540 | 1 | ||
670 | 2 | ||
900 | 3. | ||
960 | 4 | ||
1000 | 5 | ||
1200 | 6 | ||
1300 | 7 | ||
4200 | 8 | ||
4500 | 9 |
||
4650 | 10 | ||
5000 | 11 | ||
6100 | 12 | ||
7400 | 13 | ||
7500 | 14 | ||
R1= 36 |
R2= 69 |
在对每个组的排名求和后,选择Mann-Whitney U检验统计量作为最小的计算出以下两个U值:
正常的近似
有些情况下,样本量可能太大,以至于参考表无法用于计算准确的概率分布——在这种情况下,我们可以使用正态近似来代替。由于U是通过将独立的、相似分布的随机样本相加得到的,因此中心极限定理适用于样本较大的情况(通常每组中有>20个样本)。秩和的标准偏差可以用来生成z统计量和以这种方式生成的显著性值。如果零假设成立,则U的分布近似于正态分布。
接下来,我们确定U的“临界值”,与我们计算的测试统计量进行比较,我们可以使用a参考表使用我们的样本量(两组n=7)和双侧显著性水平(α=0.05)。
在我们当前的例子中,临界值可以从参考表中确定为8。最后,我们可以使用以下决策规则来接受或拒绝零假设:如果U≤8,则拒绝H0。
鉴于我们的U统计值等于临界值,我们可以拒绝两组相等的原假设,并接受替代假设,即有证据表明接受新疗法的组与未接受新疗法的组之间的病毒载量存在差异。
Elliot McClenaghan是一个r伦敦卫生和热带医学学院流行病学和医学统计学研究员