Yates连续性校正卡方计算器

计算2×2列联表的Yates校正卡方统计量。在期望频数较小时降低第一类错误。

输入2×2列联表中的四个单元格计数(a、b、c、d),即可计算Yates校正后的χ²值和p值。

Yates连续性校正卡方计算器
计算2×2列联表的Yates校正卡方统计量。在期望频数较小时降低第一类错误。

请输入2×2列联表的计数:A组在行,结果1/2在列。

关于Yates连续性校正

Yates连续性校正是对2×2列联表卡方(χ²)检验的一种调整。卡方分布是连续的,但列联表中的观测频数是离散计数。这种差异会使卡方近似高估检验统计量,导致p值过小,并增加第一类错误的风险——尤其是在样本量或期望频数较小时。 Frank Yates于1934年提出了这一校正。方法很简单:先计算观测频数与期望频数之差的绝对值,再减去0.5,然后再平方。校正后的公式为χ² = Σ (|O − E| − 0.5)² / E,对四个单元格求和。这个小调整会降低整体卡方值,得到更保守(更大的)p值,更能反映观察到的结果或更极端结果的真实概率。 当任一期望频数低于10时,尤其是低于5时,这种校正尤为重要。在这些条件下,标准卡方检验已知并不可靠,而Yates校正有助于补偿。当样本较大且所有期望频数都超过10时,校正影响很小,标准卡方检验即可。 使用此计算器时,需要把数据整理成2×2列联表。两行代表两个组(例如治疗组与对照组),两列代表两种可能结果(例如成功与失败)。单元格a是A组中结果1的计数,b是A组中结果2的计数,c是B组中结果1的计数,d是B组中结果2的计数。 2×2表的自由度始终为1。p值依据自由度为1的卡方分布计算。按惯例,p值低于0.05通常被解释为组别与结果之间存在统计学显著关联的证据。 统计学界一直在讨论何时使用Yates校正。一些统计学家认为它校正过度,会降低统计功效。对于期望频数极小的情况,许多现代统计学家更偏好Fisher精确检验,因为它不依赖卡方近似即可直接计算精确概率。不过,Yates校正在许多学科中仍被广泛教授和接受,当你想要一个快速、保守的2×2表结果时,它是合适的选择。

实用示例

通过不同场景了解此计算器的工作方式。

输入(a, b, c, d)χ² / p值说明
a=3, b=22, c=11, d=14χ²≈4.86, p≈0.027疫苗试验——显著;疫苗降低了感染率。
a=15, b=5, c=8, d=12χ²≈3.68, p≈0.055教学方法——接近临界值,在α=0.05下不显著。
a=25, b=975, c=15, d=985χ²≈2.07, p≈0.151A/B广告测试——点击率无显著差异。
a=1, b=49, c=6, d=44χ²≈2.48, p≈0.115罕见副作用研究——由于单元格计数很低,这里Yates校正至关重要。

如何使用计算器

  1. 将数据整理为2×2表:第一行为A组,第二行为B组,第一列为结果1,第二列为结果2。
  2. 在第一个输入框中输入单元格a(A组,结果1)的计数,在第二个输入框中输入单元格b(A组,结果2)的计数。
  3. 在剩余输入框中输入单元格c(B组,结果1)和d(B组,结果2)的计数。所有值必须是非负整数。
  4. 点击计算即可查看Yates校正后的χ²值、自由度(始终为1)、p值和显著性判断。
  5. 可使用示例按钮载入预设数据,以验证结果或浏览常见用例。

常见问题

什么是Yates连续性校正?
Yates校正是对2×2表标准卡方公式的调整。它会在平方之前从观测频数与期望频数之差的绝对值中减去0.5。这样会使检验更保守,在样本量或期望单元格计数较小时,降低假阳性(第一类错误)的风险。
什么时候该使用Yates校正,而不是标准卡方检验?
当任一期望单元格频数低于10时,应使用Yates校正。当所有期望频数都达到10或以上时,标准卡方检验就足够了。对于任何期望频数低于5的极小样本,建议改用Fisher精确检验,因为在这种情况下它更可靠。
a、b、c和d分别代表什么?
a是A组中经历结果1的受试者数量。b是A组中经历结果2的数量。c是B组中经历结果1的数量。d是B组中经历结果2的数量。以疫苗研究为例,A组可表示接种者,B组表示未接种者,结果1表示感染,结果2表示未感染。
为什么2×2表的自由度总是1?
独立性卡方检验的自由度等于(行数−1)×(列数−1)。对于2×2表,就是(2−1)×(2−1)=1。这意味着一旦知道边际总数和其中一个单元格的值,其余单元格就都被完全确定,因此只剩一个自由参数。
Yates校正会降低统计功效吗?
会。更保守意味着要拒绝原假设需要更强的证据。批评者认为Yates校正可能校正过度,从而增加第二类错误(漏掉真实效应)的风险。对于期望计数较高的大样本,这种校正几乎没有影响。许多现代统计学家在小样本2×2分析中更偏好Fisher精确检验。
我可以把这个计算器用于大于2×2的表吗?
不可以。Yates校正专门用于2×2列联表。对于更大的表(如3×2或3×3),应使用不带连续性校正的标准Pearson卡方检验。更大表格的公式和自由度都不同。