卡方检验
卡方检验是什么?
卡方检验,通常写为χ2检验,是一种统计假设检验,用于分类变量分析,以确定观察到的数据是否与预期不同。卡方检验是一种常用的非参数检验,这意味着它们不假设所涉及数据的分布(例如。a正态分布)。相反,该测试依赖于卡方分布,即总体值的理论分布。
卡方检验的类型
卡方检验主要有两种类型:
- 一个卡方拟合优度检验,用于测试一个变量的观测频率(每个类别的观测次数)是否与预期不同。换句话说,检验确定样本分布是否与总体分布匹配。
- 一个独立的卡方检验,也被称为关联卡方检验,它比较两个变量,看看它们是否彼此不同。
这些类型的测试使用卡方检验统计量和分布,并将观察到的值与预期值进行比较,以达到不同的目的。它们被称为皮尔逊卡方检验。还有其他各种使用卡方检验统计量的检验,包括用于趋势的卡方检验、McNemar检验(用于配对数据的分析)、单个方差检验和似然比检验——所有这些都超出了本文的范围。
在这里,我们将重点讨论卡方独立检验,因为它在社会科学、医学统计学和计量经济学中广泛应用,用于比较一个样本中类别变量的分布与另一个样本中类别变量的分布。
何时使用卡方检验
关联卡方检验应用于您想要比较的两个变量的频率交叉表。这被称为列联表,其中行和列的每个组合(例如。一个小家庭中有症状COVID-19的人数)在表中用一个单元格表示(见表1)。这两个变量都是分类的,这意味着它们可以在不同类别中具有有限数量的可能值,这一点很关键。分类变量的例子包括种族、是否患有某种疾病(是/否)和年龄分组(例如,0-5岁、6-10岁、11岁以上)。
|
|
有症状的 |
无症状的 |
总计 |
家庭规模 |
人数少(1-3人) |
30 (41.1%) |
43 (58.9%) |
73 |
|
大型(4人以上) |
96例(66.2%) |
49 (33.8%) |
145 |
|
总计 |
126例(57.8%) |
92例(42.2%) |
218 |
你可以使用卡方检验来调查这两个变量之间的关联,假设如下:
- 零假设(H0)是两个变量之间没有关联
- 另一种假设(H1)是存在任何类型的关联。
卡方检验的一个局限性是它需要足够大的样本量才能有效。作为一般规则,当期望值小于5时,我们应该转向精确概率分布并使用Fisher精确检验。
如何进行卡方检验
一位卫生研究人员可能正在对COVID-19的传播动态进行研究,并希望调查家庭规模是否与病毒检测呈阳性的人是否出现症状性疾病相关。为了帮助回答这个研究问题,他们可以使用以下方法进行卡方检验四个步骤.
步骤1:提出原假设和替代假设
进行卡方检验的第一步是清楚地陈述假设。在本例中,具体假设如下:
- 零假设(H0)是在人群中,家庭规模与COVID-19症状感染之间没有关联。换句话说,在两个家庭规模的组中,出现症状的比例之间的真正差异为零(π1 - π2 = 0)。
- 另一种假设(H1)是家庭规模与有症状感染之间存在关联,并且两个家庭组中有症状的比例之间的真实差异不为零(π1 - π2≠0)。
步骤2:计算零假设下的期望值
在这一步中,我们使用列联表(表1),为每个单元格找到如果零假设为真,预期的频率。为了做到这一点,我们使用行和列的总和,称为边际总和,并得出预期数字如下:
因此,如果家庭规模与症状状态没有关联,我们预计两个家庭组的症状感染比例相同:
预计出现有症状COVID-19的小家庭组(73 x 126) / 218 = 42.1,预计出现有症状COVID-19的大家庭组(145 x 126) / 218 = 83.8。表2显示列联表中所有四个单元格的期望值。值得注意的是,卡方计算是根据频率值本身进行的,而不是根据比例进行的。
|
|
有症状的 |
无症状的 |
总计 |
家庭规模 |
小 |
30.(42.1) |
43(30.8) |
73 |
|
大 |
96(83.8) |
49(61.2) |
145 |
|
总计 |
126 |
92 |
218 |
表2:在一项COVID-19检测呈阳性的研究中,218名参与者按家庭规模显示COVID-19症状状况的列联表。期望的数字以粗体显示。
在我们的例子中,我们使用了一个2x2列联表,假设我们感兴趣的变量都有两个类别,但如果我们想比较类别变量与两个以上类别的分布,卡方检验可以使用相同的四个步骤轻松扩展。
步骤3:计算卡方检验统计量
现在我们比较两个变量的观测频率和期望频率。我们需要计算一个检验统计量,总结它们之间的差异有多大,以及任何差异在多大程度上是由于随机变化造成的。卡方(χ2)检验统计量按以下公式计算:
在这个公式中,∑符号表示对列联表中所有四个单元格取后续数量的和(相加)。举个例子:
这给了我们一个检验统计量χ2= 12.51。
步骤4:计算p值并评估针对零假设的证据强度。
越大χ2观察值与期望值之间的差异越大,检验统计量越大。为了检验关联的强度,我们可以比较χ2在原假设下检验统计量的已知分布,并计算p值。零χ2数值和p值在实际中可以很容易地用统计软件计算出来,手工计算时可以用参考表。这些值取决于自由度,对于2x2表,自由度等于1,对于包含更多类别的列联表,自由度会更大。它们还取决于显著性水平(通常α= 0.05)。
在我们的例子中,χ2产生一个小的p值(p<0.001),这意味着我们对卡方检验的解释是有非常强的证据反对零假设。我们可以得出结论,有证据表明较大的家庭规模与有症状的COVID-19感染之间可能存在关联。
Elliot McClenaghan是伦敦卫生与热带医学学院流行病学和医学统计的研究员