피셔의 정확 검정 계산기 - 2x2 분할표

Fisher의 정확 검정을 사용해 2×2 분할표의 단측 및 양측 p값과 오즈비를 계산합니다. 소표본에 적합합니다.

2×2 표(그룹 × 결과)의 네 셀 개수를 입력한 뒤 '계산'을 클릭해 정확한 p값과 오즈비를 확인하세요.

피셔의 정확 검정
2×2 분할표의 통계적 유의성을 분석
결과 1결과 2
그룹 1
그룹 2

Fisher의 정확 검정에 대해

Fisher의 정확 검정은 2×2 분할표를 분석하는 통계적 유의성 검정으로, 1922년 Ronald A. Fisher 경이 개발했습니다. 이 검정은 치료군과 환자 결과처럼 두 범주형 변수 사이에 우연이 아닌 연관이 있는지 판단합니다. 기대 셀 수가 작을 때 부정확해지는 근사 방법인 카이제곱 검정과 달리, Fisher의 정확 검정은 초등분포가 아니라 초등분포의 정확한 확률을 계산하는 초과기하분포를 사용해 관측 데이터와 그보다 더 극단적인 모든 경우의 정확한 확률을 구합니다. 이 검정은 주변합(행합과 열합)이 고정된 2×2 표로 데이터를 배열합니다. 이러한 주변합이 주어지면, 귀무가설인 '연관 없음' 아래에서 관측 배열의 확률을 계산합니다. 셀 [a, b; c, d]를 가진 특정 표의 확률은 초과기하 공식 P = C(a+b, a) × C(c+d, c) / C(n, a+c)로 주어지며, 여기서 n = a+b+c+d입니다. p값은 관측된 표보다 같거나 더 극단적인 모든 표의 확률을 합산해 구합니다. 단측 p값에서 '극단적'이란 관측된 방향과 같은 방향의 연관을 가진 표를 뜻합니다. 양측 p값에서는 — 대부분의 연구 질문에 적합하며 — 관측 표보다 확률이 같거나 더 작은 표를 양쪽 꼬리에서 합산합니다. 따라서 양측 p값은 더 보수적이며, 출판된 연구에서 더 널리 사용됩니다. 오즈비는 연관의 강도를 나타냅니다: OR = (a × d) / (b × c). 오즈비가 1이면 연관이 없음을 뜻하고, 1보다 크면 그룹 1에서 결과 1이 그룹 2보다 더 발생하기 쉽다는 뜻이며, 1보다 작으면 반대입니다. 오즈비는 환자-대조군 연구, 임상시험, 유전 연관성 연구에서 핵심 지표입니다. 2×2 표의 어떤 셀이라도 기대빈도가 5 미만이면 Fisher의 정확 검정이 적합하며, 이 지점에서 카이제곱 근사가 신뢰할 수 없게 됩니다. 대표적인 활용에는 두 그룹의 치료 성공률을 비교하는 임상시험, 대립유전자가 질병과 연관되는지 확인하는 유전역학 연구, 두 교육 방식의 합격/불합격률을 비교하는 교육 연구, 두 광고 버전의 전환율을 비교하는 마케팅 분석이 있습니다. 이 검정은 표본 크기와 무관하게 정확한 결과를 제공하므로, 이러한 분야의 소표본 분석에서 표준으로 여겨집니다.

Fisher의 정확 검정 — 예시

2×2 분할표를 어떻게 구성하고 정확한 p값을 해석하는지 보여주는 세 가지 실제 사례입니다.

표 [a, b; c, d]양측 p맥락
a=9, b=1, c=2, d=8 (n=20)p = 0.0350 (유의)신약 시험: 치료를 받은 10명 중 9명이 호전되었고, 위약군 10명 중 2명이 호전되었습니다. 치료와 호전 사이의 연관은 통계적으로 유의합니다.
a=7, b=3, c=1, d=12 (n=23)p = 0.0189 (유의)유전학: 유전자 변이 보유자 10명 중 7명이 질환을 가지고 있었고, 변이 비보유자 13명 중 1명만 질환을 가지고 있었습니다. 이 유전자는 질환과 유의하게 연관됩니다.
a=10, b=2, c=5, d=8 (n=25)p = 0.0840 (0.05에서 유의하지 않음)교수법: 방법 A에서는 12명 중 10명이 합격했고, 방법 B에서는 13명 중 5명이 합격했습니다. 이 차이는 5% 수준에서 유의하지 않습니다.
a=4, b=100, c=0, d=110 (n=214)p = 0.0563 (경계적)광고 A/B 테스트: 각 광고가 약 110회 노출된 상황에서 광고 A는 4건의 전환이 있었고 광고 B는 0건이었습니다. 결과는 경계선상에 있으며 더 큰 표본의 후속 검증이 필요합니다.

Fisher의 정확 검정 계산기 사용법

  1. 데이터를 2×2 분할표로 정리하세요. 행은 두 그룹(그룹 1과 그룹 2), 열은 두 결과(결과 1과 결과 2)입니다.
  2. 각 셀의 개수를 입력하세요: 셀 A(그룹 1, 결과 1), 셀 B(그룹 1, 결과 2), 셀 C(그룹 2, 결과 1), 셀 D(그룹 2, 결과 2). 모든 값은 0 이상의 정수여야 합니다.
  3. ‘계산’을 클릭하세요. 계산기는 같은 주변합을 가진 가능한 모든 2×2 표를 열거하고, 초과기하 확률을 합산해 정확한 단측 및 양측 p값을 구합니다.
  4. 대부분의 연구 질문에서는 양측 p값을 보세요. p < 0.05이면 두 그룹과 두 결과 사이의 연관은 통계적으로 유의합니다.
  5. 오즈비를 해석하세요: 1보다 크면 그룹 1에서 결과 1이 더 발생하기 쉽고, 1보다 작으면 덜 발생하기 쉽습니다. 표 아래의 예시 버튼으로 실제 사례에서 이 검정이 어떻게 작동하는지 확인할 수 있습니다.

Fisher의 정확 검정 — FAQ

카이제곱 검정 대신 Fisher의 정확 검정을 언제 사용해야 하나요?
2×2 표의 어떤 셀이라도 기대빈도가 5 미만이거나 전체 표본 수가 작을 때(n < 20이 흔한 경험칙) Fisher의 정확 검정을 사용하세요. 카이제곱 검정은 근사에 의존하므로 작은 빈도에서 무너져 p값이 신뢰할 수 없게 됩니다. Fisher 검정은 항상 정확하므로 어떤 표본 크기에도 안전하게 사용할 수 있습니다.
Fisher 검정의 양측 p값은 무엇을 의미하나요?
양측 p값은 귀무가설인 '연관 없음'이 참일 때, 어느 방향이든 현재 표와 같거나 더 극단적인 표를 관측할 확률입니다. 여기서 '극단적'이란 초과기하 확률이 관측된 표와 같거나 더 작다는 뜻입니다. 관례적으로 p값 < 0.05이면 통계적으로 유의하다고 봅니다.
오즈비는 무엇이며 어떻게 해석하나요?
오즈비(OR)는 (a × d) / (b × c)입니다. OR이 1이면 두 그룹에서 결과 1이 발생할 가능성이 같아 연관이 없다는 뜻입니다. OR > 1이면 그룹 1에서 결과 1이 그룹 2보다 더 발생하기 쉽고, OR < 1이면 덜 발생하기 쉽습니다. 예를 들어 OR = 9는 그룹 1에서 결과 1의 오즈가 그룹 2의 9배라는 뜻으로, 강한 양의 연관을 나타냅니다.
단측 p값과 양측 p값의 차이는 무엇인가요?
단측 p값은 특정 한 방향의 연관만 검정합니다(예: 그룹 1에서 결과 1의 비율이 그룹 2보다 높다는 가설). 양측 p값은 방향에 관계없이 모든 연관을 검정합니다. 데이터를 보기 전에 방향성 가설이 없었다면 양측 p값이 더 적절하고 더 보수적인 선택입니다.
주변합이란 무엇이고 왜 고정되어야 하나요?
주변합은 표의 행합(a+b와 c+d)과 열합(a+c와 b+d)입니다. Fisher 검정은 이 합계가 고정되어 있다고 조건을 두며, 이것이 정확한 초과기하분포를 유도하는 आधार입니다. 실제로 주변값은 연구 설계에 의해 고정되는 경우가 많습니다(예: 미리 정해진 그룹 크기 또는 총 사건 수).
Fisher의 정확 검정은 2×2보다 큰 표에도 사용할 수 있나요?
고전적인 Fisher의 정확 검정은 2×2 표에 대해 정의됩니다. 더 큰 r×c 분할표에 대한 일반화도 있지만(다차원 초과기하분포 사용), 계산 비용이 큽니다. 기대빈도가 작은 큰 표의 경우 2×2 부분표에 대해 정확 검정을 적용하거나, 통계 소프트웨어의 몬테카를로 시뮬레이션 기반 정확 검정을 사용할 수 있습니다.