卡方检验
卡方检验是什么?
卡方检验,通常写成χ2检验,是一种统计假设检验,用于分类变量的分析,以确定观察到的数据是否与预期不同。卡方检验是一种常用的非参数检验,这意味着它们不假设所涉及数据的分布(例如:a正态分布)。相反,检验依赖于卡方分布,即总体值的理论分布。
卡方检验的类型
卡方检验主要有两种类型:
- 一个卡方拟合优度检验,用于测试一个变量的观察频率(每一类中的观察次数)是否与预期不同。换句话说,检验确定样本分布是否与总体分布匹配。
- 一个独立性的卡方检验;也被称为关联的卡方检验,它比较两个变量,看看它们是否彼此不同。
这些类型的测试使用卡方检验统计量和分布,并将观察到的值与期望值进行比较,用于不同的目的。它们被称为皮尔逊卡方检验。还有其他各种使用卡方检验统计量的检验,包括趋势的卡方检验、McNemar检验(用于配对数据的分析)、单一方差检验和似然比检验——所有这些都超出了本文的范围。
在这里,我们将重点关注卡方检验的独立性,因为它在社会科学、医学统计学和计量经济学中广泛应用,用于比较一个样本中分类变量的分布与另一个样本中分类变量的分布。
何时使用卡方检验
关联的卡方检验应用于想要比较的两个变量的频率交叉表。这被称为列联表,其中行和列的每个组合(例如:表中的单元格表示小家庭中出现COVID-19症状的人数(见表1)。关键是,这两个变量都是分类的,这意味着它们可以在不同的类别中取有限数量的可能值。分类变量的例子包括种族、是否患病(是/否)和按年龄组划分的年龄(例如0-5岁、6-10岁、11岁以上)。
|
|
有症状的 |
无症状的 |
总计 |
家庭规模 |
小型(1-3人) |
30 (41.1%) |
43 (58.9%) |
73 |
|
大型(4人以上) |
96例(66.2%) |
49 (33.8%) |
145 |
|
总计 |
126例(57.8%) |
92例(42.2%) |
218 |
你可以使用卡方检验来研究这两个变量与以下假设之间的关联:
- 零假设(H0)是两个变量之间没有关联
- 另一种假设(H1)是存在某种关联。
卡方检验的一个局限性是它需要足够大的样本量才能有效。作为一般规则,当期望值小于5时,我们应该转向精确概率分布,并使用费雪精确检验。
如何进行卡方检验
一名卫生研究人员可能正在进行一项关于COVID-19传播动力学的研究,并希望调查家庭规模是否与病毒检测呈阳性的人是否出现有症状的疾病有关。为了帮助回答这个研究问题,他们可以使用以下方法对独立性进行卡方检验四个步骤.
步骤1提出零假设和备选假设
进行卡方检验的第一步是清楚地陈述假设。在本例中,具体假设如下:
- 零假设(H0)是,在人群中,家庭规模与COVID-19症状感染之间没有关联。换句话说,两组家庭中出现症状的比例之间的真正差异是零(π1 - π2 = 0)。
- 另一种假设(H1)是家庭规模与症状性感染之间存在关联,并且两个家庭组中出现症状的比例之间的真正差异不为零(π1 - π2≠0)
步骤2:计算零假设下的期望值
在这一步中,我们使用列联表(表1),以找出每个单元格在零假设成立时的预期频率。要做到这一点,我们使用行和列总计,称为边际总计,并得出预期的数字如下:
因此,如果家庭规模与症状状态无关,我们预计两组家庭中有症状感染的比例相同:
预计出现COVID-19症状的小户组为(73 x 126) / 218 = 42.1,预计出现COVID-19症状的大户组为(145 x 126) / 218 = 83.8。表2显示列联表中所有四个单元格的期望值。重要的是要注意,卡方计算是对频率值本身进行的,而不是对比例进行的。
|
|
有症状的 |
无症状的 |
总计 |
家庭规模 |
小 |
30.(42.1) |
43(30.8) |
73 |
|
大 |
96(83.8) |
49(61.2) |
145 |
|
总计 |
126 |
92 |
218 |
表2在一项新冠肺炎检测呈阳性的研究中,218名参与者按家庭规模分列的新冠肺炎症状状况应急表。期望号码以粗体显示。
在我们的例子中,我们使用2x2列联表,假设我们感兴趣的变量都有两个类别,但如果我们想比较两个以上类别的分类变量的分布,卡方检验可以使用相同的四个步骤轻松扩展。
步骤3:计算卡方检验统计量
现在我们比较两个变量的观测频率和期望频率。我们需要计算一个检验统计量来总结它们的差异有多大,以及任何差异在多大程度上是由于随机变化造成的。卡方(χ2)检验统计量的计算公式如下:
在这个公式中,∑符号表示对列联表中所有四个单元格的后续数量求和(相加)。对于我们的例子:
这给了我们一个检验统计量χ2= 12.51。
步骤4:计算p值并评估反对原假设的证据强度。
越大χ2检验统计量观察值和期望值之间的差异越大。为了检验关联的强度,我们可以比较χ2检验统计量在原假设下的已知分布,并计算p值。零χ2Value和p值在实际应用中可以很容易地用统计软件计算出来,手工计算时可以使用参考表。这些值将取决于自由度,对于2x2表等于1,对于具有更多类别的列联表将更大。它们还取决于显著性水平(通常)α= 0.05)。
在我们的例子中,χ2产生一个小的p值(p<0.001),这意味着我们从卡方检验的解释是,有非常有力的证据反对原假设。我们可以得出结论,有证据表明家庭规模较大与有症状的COVID-19感染之间可能存在关联。
Elliot McClenaghan是伦敦卫生与热带医学学院流行病学和医学统计研究员