Yates 連續性校正卡方計算器
計算 2×2 列聯表的 Yates 校正卡方統計量。在期望格頻數較小時降低第一型錯誤。
輸入 2×2 列聯表中的四個格子計數(a、b、c、d),即可計算 Yates 校正後的 χ² 值與 p 值。
Yates 連續性校正卡方計算器
計算 2×2 列聯表的 Yates 校正卡方統計量。在期望格頻數較小時降低第一型錯誤。
請輸入 2×2 列聯表的計數:A 組在列,結果 1/2 在欄。
關於 Yates 連續性校正
Yates 連續性校正是在 2×2 列聯表中使用卡方(χ²)檢定時的一種調整。卡方分布是連續的,而列聯表中的觀測頻數是離散計數。這種差異會使卡方近似高估檢定統計量,導致 p 值偏小,並增加第一型錯誤的風險——尤其是在樣本數或期望格頻數較小時。
Frank Yates 於 1934 年提出了這個校正。做法很簡單:先取觀測頻數與期望頻數之差的絕對值,再減去 0.5,然後平方。校正後的公式為 χ² = Σ (|O − E| − 0.5)² / E,對全部四個格子加總。這個小調整會降低整體卡方值,產生較保守(較大)的 p 值,更能反映觀測結果或更極端結果的真實機率。
當任何期望格頻數低於 10,尤其低於 5 時,這種校正特別重要。在這些情況下,標準卡方檢定已知不夠可靠,而 Yates 校正有助於補償。對於較大的樣本,如果所有期望頻數都超過 10,校正的影響很小,標準卡方檢定通常就足夠了。
使用計算器時,需要把資料整理成 2×2 列聯表。兩列代表兩組(例如治療組與對照組),兩欄代表兩種可能結果(例如成功與失敗)。a 為 A 組且結果 1 的人數,b 為 A 組且結果 2 的人數,c 為 B 組且結果 1 的人數,d 為 B 組且結果 2 的人數。
2×2 表的自由度始終為 1。p 值依據自由度為 1 的卡方分布計算。通常 p 值低於 0.05 會被解讀為組別與結果之間存在統計上顯著關聯的證據。
統計學界對於何時使用 Yates 校正一直有爭論。有些統計學家認為它會過度校正並降低統計力。許多現代統計學家在期望頻數極小時更偏好 Fisher 精確檢定,因為它不必依賴卡方近似就能計算精確機率。不過,Yates 校正仍被廣泛教授並在許多學科中被接受;當你需要 2×2 表的快速、保守結果時,它是合適的選擇。
實用範例
探索不同情境,了解計算器如何運作。
| 輸入(a, b, c, d) | χ² / p 值 | 備註 |
|---|---|---|
| a=3, b=22, c=11, d=14 | χ²≈4.86, p≈0.027 | 疫苗試驗——結果顯著;疫苗可降低感染率。 |
| a=15, b=5, c=8, d=12 | χ²≈3.68, p≈0.055 | 教學方法——接近臨界,在 α=0.05 下不顯著。 |
| a=25, b=975, c=15, d=985 | χ²≈2.07, p≈0.151 | A/B 廣告測試——點擊率沒有顯著差異。 |
| a=1, b=49, c=6, d=44 | χ²≈2.48, p≈0.115 | 罕見副作用研究——由於格子計數較低,這裡必須使用 Yates 校正。 |
如何使用計算器
- 將資料整理成 2×2 表:A 組放在第一列,B 組放在第二列,結果 1 放在第一欄,結果 2 放在第二欄。
- 在第一個輸入框中輸入單元格 a(A 組,結果 1)的計數,第二個輸入框中輸入 b(A 組,結果 2)的計數。
- 在剩餘輸入框中輸入單元格 c(B 組,結果 1)與 d(B 組,結果 2)的計數。所有值都必須是非負整數。
- 按一下「計算」即可查看 Yates 校正後的 χ² 值、自由度(始終為 1)、p 值,以及顯著性判定。
- 使用範例按鈕載入預設資料,驗證結果或探索常見用法。
常見問題
什麼是 Yates 連續性校正?
Yates 連續性校正是對 2×2 表標準卡方公式的一種調整。它會先從觀測頻數與期望頻數的絕對差中減去 0.5,再進行平方。這會讓檢定更保守,在樣本數或期望格頻數較小時,可降低假陽性(第一型錯誤)的風險。
什麼時候該使用 Yates 校正,而不是標準卡方檢定?
當任何期望格頻數低於 10 時,應使用 Yates 校正。若所有期望頻數都至少為 10,標準卡方檢定就足夠。對於任何期望頻數低於 5 的極小樣本,建議改用 Fisher 精確檢定,因為在這種情況下它更可靠。
a、b、c、d 分別代表什麼?
a 是 A 組中出現結果 1 的人數,b 是 A 組中出現結果 2 的人數,c 是 B 組中出現結果 1 的人數,d 是 B 組中出現結果 2 的人數。以疫苗研究為例,A 組可表示接種者,B 組表示未接種者,結果 1 表示感染,結果 2 表示未感染。
為什麼 2×2 表的自由度總是 1?
卡方獨立性檢定的自由度等於(列數 − 1)×(欄數 − 1)。對於 2×2 表,就是(2−1)×(2−1)= 1。這表示一旦知道邊際總數和一個單元格的值,其他所有單元格都被完全決定,只剩一個自由參數。
Yates 校正會降低統計力嗎?
會。讓檢定更保守意味著需要更強的證據才能拒絕虛無假設。批評者認為 Yates 校正可能過度校正,進而增加第二型錯誤(漏掉真實效應)的風險。對於期望計數較高的大樣本,校正影響可以忽略。許多現代統計學家在小樣本 2×2 分析中更偏好 Fisher 精確檢定。
我可以把這個計算器用於大於 2×2 的表嗎?
不可以。Yates 校正專為 2×2 列聯表設計。對於更大的表(例如 3×2 或 3×3),應使用不含連續性校正的標準 Pearson 卡方檢定。更大表的公式和自由度都不同。