Yates 연속성 보정 카이제곱 계산기
2×2 분할표의 Yates 보정 카이제곱 통계를 계산합니다. 기대 빈도가 작을 때 제1종 오류를 줄입니다.
2×2 분할표의 네 셀 값(a, b, c, d)을 입력하면 Yates 보정된 χ² 값과 p값을 계산합니다.
Yates 연속성 보정 카이제곱 계산기
2×2 분할표의 Yates 보정 카이제곱 통계를 계산합니다. 기대 빈도가 작을 때 제1종 오류를 줄입니다.
2×2 분할표의 값을 입력하세요: 행은 그룹 A, 열은 결과 1/2입니다.
Yates 연속성 보정에 대하여
Yates 연속성 보정은 2×2 분할표에 사용하는 카이제곱(χ²) 검정의 조정입니다. 카이제곱 분포는 연속형이지만, 분할표의 관측 빈도는 이산적인 개수입니다. 이 차이 때문에 카이제곱 근사는 검정 통계를 과대평가하기 쉽고, p값이 너무 작아지며 제1종 오류 위험이 높아집니다. 특히 표본 수나 기대 빈도가 작을 때 그렇습니다.
Frank Yates는 1934년에 이 보정을 제안했습니다. 방법은 간단합니다. 관측 빈도와 기대 빈도의 차의 절댓값에서 0.5를 뺀 뒤 제곱합니다. 보정식은 χ² = Σ (|O − E| − 0.5)² / E 이며, 네 셀 전체를 합산합니다. 이 작은 조정은 전체 카이제곱 값을 낮춰 더 보수적인(더 큰) p값을 만들고, 관측된 결과 또는 그보다 더 극단적인 결과의 실제 확률을 더 잘 반영합니다.
이 보정은 기대 빈도가 10 미만일 때, 특히 5 미만일 때 중요합니다. 그런 조건에서는 표준 카이제곱 검정이 신뢰하기 어렵고, Yates 보정이 이를 보완합니다. 표본이 크고 모든 기대 빈도가 10을 넘는 경우에는 보정의 영향이 거의 없으며 표준 카이제곱 검정이면 충분합니다.
이 계산기를 사용하려면 데이터를 2×2 분할표로 정리해야 합니다. 두 행은 두 집단(예: 치료군과 대조군), 두 열은 두 가지 결과(예: 성공과 실패)를 나타냅니다. 셀 a는 그룹 A에서 결과 1의 수, b는 그룹 A에서 결과 2의 수, c는 그룹 B에서 결과 1의 수, d는 그룹 B에서 결과 2의 수입니다.
2×2 표의 자유도는 항상 1입니다. p값은 자유도 1인 카이제곱 분포로부터 계산됩니다. 관례적으로 p값이 0.05보다 작으면 집단 소속과 결과 사이에 통계적으로 유의한 관련이 있다고 해석합니다.
Yates 보정을 언제 사용해야 하는지는 통계학계에서 여전히 논의 중입니다. 일부 통계학자는 보정이 과도하여 검정력을 낮춘다고 주장합니다. 기대 빈도가 매우 작은 경우, 많은 현대 통계학자는 카이제곱 근사에 의존하지 않고 정확한 확률을 계산하는 Fisher의 정확 검정을 더 선호합니다. 그러나 Yates 보정은 여전히 여러 분야에서 널리 교육되고 받아들여지며, 2×2 표에서 빠르고 보수적인 결과를 원할 때 적절한 선택입니다.
실용 예시
다양한 상황을 통해 계산기의 동작을 살펴보세요.
| 입력(a, b, c, d) | χ² / p값 | 메모 |
|---|---|---|
| a=3, b=22, c=11, d=14 | χ²≈4.86, p≈0.027 | 백신 시험 — 유의함. 백신이 감염률을 낮춥니다. |
| a=15, b=5, c=8, d=12 | χ²≈3.68, p≈0.055 | 교수법 — 경계선 수준이며, α=0.05에서는 유의하지 않습니다. |
| a=25, b=975, c=15, d=985 | χ²≈2.07, p≈0.151 | A/B 광고 테스트 — 클릭률에 유의한 차이가 없습니다. |
| a=1, b=49, c=6, d=44 | χ²≈2.48, p≈0.115 | 드문 부작용 연구 — 셀 수가 적어 여기서는 Yates 보정이 필수적입니다. |
사용 방법
- 데이터를 2×2 표로 정리하세요. 첫 번째 행은 그룹 A, 두 번째 행은 그룹 B, 첫 번째 열은 결과 1, 두 번째 열은 결과 2입니다.
- 첫 번째 입력칸에 셀 a(그룹 A, 결과 1)의 수를, 두 번째 입력칸에 셀 b(그룹 A, 결과 2)의 수를 입력하세요.
- 나머지 입력칸에 셀 c(그룹 B, 결과 1)와 d(그룹 B, 결과 2)의 수를 입력하세요. 모든 값은 0 이상의 정수여야 합니다.
- 계산을 클릭하면 Yates 보정된 χ² 값, 자유도(항상 1), p값, 그리고 유의성 판단을 볼 수 있습니다.
- 예시 버튼을 사용해 미리 설정된 데이터를 불러오고 결과를 확인하거나 일반적인 사용 사례를 살펴보세요.
자주 묻는 질문
Yates 연속성 보정이란 무엇인가요?
Yates 보정은 2×2 표의 표준 카이제곱 공식에 대한 조정입니다. 관측 빈도와 기대 빈도의 차의 절댓값에서 제곱하기 전에 0.5를 뺍니다. 이렇게 하면 검정이 더 보수적으로 되어, 표본 수나 기대 셀 수가 작을 때 거짓 양성(제1종 오류) 위험이 줄어듭니다.
표준 카이제곱 검정 대신 언제 Yates 보정을 사용해야 하나요?
기대 셀 빈도 중 하나라도 10 미만이면 Yates 보정을 사용하세요. 모든 기대 빈도가 10 이상이면 표준 카이제곱 검정이면 충분합니다. 기대 빈도가 5 미만인 아주 작은 표본에서는 그 상황에서 더 신뢰할 수 있는 Fisher의 정확 검정을 고려하세요.
셀 a, b, c, d는 무엇을 의미하나요?
a는 그룹 A에서 결과 1을 경험한 대상자의 수입니다. b는 그룹 A에서 결과 2의 수입니다. c는 그룹 B에서 결과 1의 수입니다. d는 그룹 B에서 결과 2의 수입니다. 백신 연구에서는 A군을 접종군, B군을 미접종군, 결과 1을 감염, 결과 2를 비감염으로 둘 수 있습니다.
2×2 표의 자유도가 항상 1인 이유는 무엇인가요?
독립성 카이제곱 검정의 자유도는 (행 수−1)×(열 수−1)입니다. 2×2 표에서는 (2−1)×(2−1)=1입니다. 즉, 주변 합계와 하나의 셀 값만 알면 나머지 셀 값은 모두 결정되므로, 자유롭게 변하는 매개변수는 하나뿐입니다.
Yates 보정은 통계적 검정력을 줄이나요?
그렇습니다. 더 보수적이라는 것은 귀무가설을 기각하기 위해 더 강한 증거가 필요하다는 뜻입니다. 비판자들은 Yates 보정이 과도하여 제2종 오류(실제 효과를 놓치는 것) 위험을 높일 수 있다고 주장합니다. 기대 수가 높은 큰 표본에서는 이 보정의 영향이 거의 없습니다. 많은 현대 통계학자는 작은 표본의 2×2 분석에서 Fisher의 정확 검정을 선호합니다.
이 계산기를 2×2보다 큰 표에도 사용할 수 있나요?
아니요. Yates 보정은 2×2 분할표 전용입니다. 3×2나 3×3 같은 더 큰 표에는 연속성 보정 없이 표준 Pearson 카이제곱 검정을 사용하세요. 더 큰 표에서는 공식과 자유도도 다릅니다.