Yates連續性校正卡方計算器
計算2×2列聯表的Yates校正卡方統計量。在期望次數較小時降低第一類錯誤。
輸入2×2列聯表中的四個格子計數(a、b、c、d),即可計算Yates校正後的χ²值與p值。
Yates連續性校正卡方計算器
計算2×2列聯表的Yates校正卡方統計量。在期望次數較小時降低第一類錯誤。
請輸入2×2列聯表的計數:A組在列,結果1/2在欄。
關於 Yates 連續性校正
Yates 連續性校正是用於2×2列聯表卡方(χ²)檢定的一種調整。卡方分布是連續的,但列聯表中的觀測次數是離散計數。這種差異會使卡方近似高估檢定統計量,導致p值過小,並增加第一類錯誤的風險——尤其是在樣本數或期望次數較小時。
Frank Yates 於1934年提出這項校正。方法很簡單:先取觀測次數與期望次數差值的絕對值,再減去0.5,之後平方。校正後的公式為χ² = Σ (|O − E| − 0.5)² / E,對四個格子加總。這個小調整會降低整體卡方值,產生較保守(較大)的p值,更能反映觀察到的結果或更極端結果的真實機率。
當任何期望次數低於10時,尤其是低於5時,這項校正特別重要。在這些條件下,標準卡方檢定已知不夠可靠,而Yates校正有助於補足。當樣本較大且所有期望次數都超過10時,校正影響很小,標準卡方檢定就足夠。
使用此計算器時,需要把資料整理成2×2列聯表。兩列代表兩個組別(例如治療組與對照組),兩欄代表兩種可能結果(例如成功與失敗)。格子a是A組中結果1的數量,b是A組中結果2的數量,c是B組中結果1的數量,d是B組中結果2的數量。
2×2表的自由度永遠是1。p值是根據自由度1的卡方分布計算。依慣例,p值低於0.05通常會被解讀為組別與結果之間存在統計上顯著關聯的證據。
統計學界對於何時使用Yates校正仍有討論。有些統計學家認為它校正過度,會降低統計力。對於期望次數非常小的情況,許多現代統計學家更偏好Fisher精確檢定,因為它不依賴卡方近似就能直接計算精確機率。不過,Yates校正仍在許多學科中被廣泛教學與接受;當你想要快速、保守地得到2×2表結果時,它是合適的選擇。
實用範例
透過不同情境了解此計算器的運作方式。
| 輸入(a, b, c, d) | χ² / p值 | 說明 |
|---|---|---|
| a=3, b=22, c=11, d=14 | χ²≈4.86, p≈0.027 | 疫苗試驗——達顯著;疫苗降低感染率。 |
| a=15, b=5, c=8, d=12 | χ²≈3.68, p≈0.055 | 教學方法——接近臨界值,在α=0.05下不顯著。 |
| a=25, b=975, c=15, d=985 | χ²≈2.07, p≈0.151 | A/B廣告測試——點擊率沒有顯著差異。 |
| a=1, b=49, c=6, d=44 | χ²≈2.48, p≈0.115 | 罕見副作用研究——由於格子次數很低,此處Yates校正格外重要。 |
如何使用計算器
- 將資料整理為2×2表:第一列為A組,第二列為B組,第一欄為結果1,第二欄為結果2。
- 在第一個輸入框輸入格子a(A組,結果1)的數量,第二個輸入框輸入格子b(A組,結果2)的數量。
- 在其餘輸入框中輸入格子c(B組,結果1)與d(B組,結果2)的數量。所有值都必須是非負整數。
- 點擊計算即可查看Yates校正後的χ²值、自由度(永遠為1)、p值以及顯著性判斷。
- 可使用範例按鈕載入預設資料,以驗證結果或瀏覽常見用例。
常見問題
什麼是 Yates 連續性校正?
Yates校正是對2×2表標準卡方公式的調整。它會在平方前,先從觀測次數與期望次數差值的絕對值中減去0.5。這會讓檢定更保守,並在樣本數或期望格數較小時,降低假陽性(第一類錯誤)的風險。
我什麼時候應該用 Yates 校正,而不是標準卡方檢定?
當任何期望格數低於10時,應使用Yates校正。當所有期望格數都達到10或以上時,標準卡方檢定就足夠。對於任何期望格數低於5的極小樣本,建議改用Fisher精確檢定,因為在這種情況下它更可靠。
a、b、c、d 分別代表什麼?
a是A組中經歷結果1的受試者數量。b是A組中經歷結果2的數量。c是B組中經歷結果1的數量。d是B組中經歷結果2的數量。以疫苗研究為例,A組可表示已接種者,B組表示未接種者,結果1表示感染,結果2表示未感染。
為什麼2×2表的自由度永遠是1?
獨立性卡方檢定的自由度等於(列數−1)×(欄數−1)。對2×2表而言,就是(2−1)×(2−1)=1。這表示一旦知道邊際總數和其中一個格子的值,其餘格子就會完全確定,因此只剩一個自由參數。
Yates 校正會降低統計力嗎?
會,因為更保守代表需要更強的證據才能拒絕虛無假設。批評者認為Yates校正可能校正過度,增加第二類錯誤(漏掉真實效果)的風險。對於期望次數較高的大樣本,這種校正幾乎沒有影響。許多現代統計學家在小樣本2×2分析中更偏好Fisher精確檢定。
這個計算器可以用於大於2×2的表嗎?
不行。Yates校正專為2×2列聯表設計。對於更大的表(例如3×2或3×3),應使用不含連續性校正的標準Pearson卡方檢定。更大表格的公式與自由度都不同。