F 통계량 계산기 - ANOVA 및 분산비 검정
ANOVA 또는 F비 검정에서 두 표본분산을 비교하기 위한 F 통계량, 자유도, p값, 임계 F값을 계산합니다.
각 그룹의 표본분산과 표본 크기를 입력하고 유의수준을 선택하면 F 통계량과 명확한 기각/기각 실패 결정을 확인할 수 있습니다.
F 통계량 계산기
F비 검정을 사용해 두 그룹의 분산 비교
그룹 1 데이터
그룹 2 데이터
F 통계량 계산기 소개
F 통계량은 두 분산의 비율로, 그룹 평균 또는 그룹 분산 간 차이가 통계적으로 유의한지 판단하는 데 사용됩니다. 로널드 A. 피셔 경의 이름을 딴 이 통계량은 분산분석(ANOVA)의 핵심이며, 두 분산의 동일성을 검정하는 F 검정에서도 중요한 값입니다. 한 그룹의 값들이 다른 그룹과 의미 있게 다른 정도로 퍼져 있는지 판단해야 할 때 F 통계량은 엄밀하고 확률에 기반한 답을 제공합니다.
핵심적으로 F 통계량은 F = s₁² / s₂² 입니다. 여기서 s₁²와 s₂²는 두 독립 그룹의 표본분산입니다. 관례상 더 큰 분산을 분자에 두어 F가 항상 ≥ 1이 되게 하며, 관심 있는 확률 질량을 F분포의 오른쪽 꼬리로 제한합니다. 그런 다음 결과값을 두 자유도 값으로 매개변수화된 이론적 F분포와 비교합니다: df₁ = n₁ − 1 (분자), df₂ = n₂ − 1 (분모). 큰 F값은 분산이 매우 다르다는 뜻이고, 1에 가까운 F값은 서로 비슷하다는 뜻입니다.
F분포는 오른쪽으로 치우쳐 있으며 음수가 아닌 값만 가집니다. 정확한 모양은 df₁과 df₂에 따라 달라집니다. 가장 일반적인 유형인 양측 검정은 방향과 관계없이 차이가 있는지 확인하며, p값은 2 × P(F > F_obs)로 계산됩니다. 여기서 P(F > F_obs)는 관측 통계량보다 오른쪽에 있는 F분포 오른쪽 꼬리의 면적입니다. 이 p값이 선택한 유의수준 α 이하이면 귀무가설 H₀: σ₁² = σ₂² 를 기각하고 분산이 유의하게 다르다고 결론냅니다.
ANOVA에서 F 통계량은 약간 다른 형태를 가집니다. 그룹 간 분산(그룹 간 평균제곱, MSB)을 그룹 내 분산(그룹 내 평균제곱, MSW)으로 나눈 비율입니다. 모든 그룹 평균이 동일하다면 MSB와 MSW는 대략 같아야 하므로 F ≈ 1입니다. 그룹 평균이 서로 멀어질수록 MSB가 MSW에 비해 커지고 F가 증가하여 결국 임계 기준을 넘게 됩니다.
F 통계량의 일반적인 활용 사례에는 제조 품질관리(두 기계가 동일한 변동성으로 부품을 생산하는가?), 교육 연구(두 교수법이 비슷하게 일관된 시험 점수를 내는가?), 금융 분석(두 주식의 변동성이 유사한가?), 농업 과학(두 비료가 같은 일관성의 작물 수확량을 내는가?) 등이 있습니다. 많은 분석가는 두 표본 t검정을 실행하기 전에 먼저 F 검정으로 등분산 가정을 확인합니다. F 검정이 H₀를 기각하면 Welch t검정(이분산)이 더 적절합니다.
이 계산기는 정규화 불완전 베타 함수를 사용해 F분포 CDF 계산을 자동화하므로 통계표 없이도 모든 양의 자유도에 대해 정확한 p값을 제공합니다. 임계 F값은 CDF를 수치적으로 역산해 찾습니다. 두 출력 모두 R, Python(scipy), SPSS에서 생성되는 값과 일치합니다.
F 통계량 계산기 예제
분산 비교에 F 검정을 적용하는 세 가지 실제 시나리오입니다.
| 입력 | 결과 | 맥락 |
|---|---|---|
| s₁² = 0.34, n₁ = 25; s₂² = 0.29, n₂ = 25; α = 0.05 | F = 1.1724, p ≈ 0.6767 — H₀ 기각 실패 | 두 기계가 볼트를 생산합니다. 지름의 분산은 5% 수준에서 유의하게 다르지 않습니다. |
| s₁² = 110, n₁ = 41; s₂² = 135, n₂ = 31; α = 0.05 | F = 1.2273, p ≈ 0.5061 — H₀ 기각 실패 | 두 교수법입니다. 시험 점수 분산은 유의하게 다르지 않으며, 두 방법 모두 비슷한 일관성을 보입니다. |
| s₁² = 1.5, n₁ = 30; s₂² = 1.2, n₂ = 30; α = 0.01 | F = 1.25, p ≈ 0.5717 — H₀ 기각 실패 | 주식 일일 수익률 분산입니다. 1% 유의수준에서는 변동성이 다르다는 증거가 없습니다. |
| s₁² = 550, n₁ = 50; s₂² = 620, n₂ = 50; α = 0.10 | F = 1.1273, p ≈ 0.5659 — H₀ 기각 실패 | 두 비료의 작물 수확량입니다. 산출량의 분산은 10% 수준에서 통계적으로 유사합니다. |
F 통계량 계산기 사용 방법
- '그룹 1 데이터' 섹션에 그룹 1의 표본분산 (s²)과 표본 크기 (n)를 입력합니다. 두 값은 모두 숫자여야 하며, 분산은 ≥ 0, 표본 크기는 ≥ 2여야 합니다.
- '그룹 2 데이터' 섹션에 그룹 2의 해당 분산과 표본 크기를 입력합니다.
- 드롭다운에서 원하는 유의수준 α를 선택합니다. 0.01, 0.05, 0.10은 세 가지 표준 선택지입니다.
- '계산'을 클릭합니다. 계산기는 더 큰 분산을 분자에 두고 F = s_max² / s_min²를 계산하며, 자유도(df₁ = n_max − 1, df₂ = n_min − 1)를 도출하고 양측 p값과 임계 F값을 평가합니다.
- p값을 α와 비교합니다. p ≤ α이면 H₀를 기각하고 분산이 유의하게 다르다고 결론냅니다. 그렇지 않으면 H₀ 기각에 실패합니다. '초기화'를 클릭하면 모든 필드를 지우고 다시 시작할 수 있습니다.
F 통계량 계산기 FAQ
F 통계량이란 무엇인가요?
F 통계량은 두 표본분산의 비율입니다: F = s₁² / s₂². 관례상 더 큰 분산을 분자에 두므로 F ≥ 1입니다. 두 모집단 분산이 같다는 귀무가설하에서는 df₁ = n₁ − 1 및 df₂ = n₂ − 1 자유도를 갖는 F분포를 따릅니다.
F 검정에서 p값은 무엇을 의미하나요?
p값은 H₀(등분산)가 참이라고 가정할 때 계산된 값만큼 극단적이거나 더 극단적인 F 통계량을 관측할 확률입니다. 작은 p값(≤ α)은 H₀ 하에서 그런 큰 비율이 나타나기 어렵다는 뜻이므로 H₀를 기각합니다. 큰 p값은 데이터가 등분산과 일치한다는 뜻입니다.
단측 F 검정과 양측 F 검정은 언제 사용하나요?
방향과 관계없이 분산 간 어떤 차이라도 탐지하려면 양측 검정(여기서는 기본값)을 사용합니다. σ₁² > σ₂²와 같이 사전 방향성 가설이 있을 때만 단측 검정을 사용하세요. 단측 p값은 이 계산기의 양측 p값을 절반으로 나누면 됩니다.
F 검정의 가정은 무엇인가요?
분산의 동일성을 검정하는 F 검정은 두 표본이 모두 정규분포 모집단에서 추출되었고 표본들이 독립적이어야 합니다. 정규성이 의심되면 비정규성에 더 강건한 Levene 검정 또는 Brown–Forsythe 검정을 고려하세요.
임계 F값은 어떻게 사용하나요?
임계 F값 F_crit는 선택한 α에서 H₀를 기각하는 기준입니다. F_obs > F_crit이면 H₀를 기각합니다. 임계값 접근법은 p값 접근법과 동등합니다. p값 < α일 때 그리고 그때에만 F_obs > F_crit입니다. 두 방법은 항상 같은 결정을 제공합니다.
F 검정과 t검정의 차이는 무엇인가요?
t검정은 두 그룹의 평균을 비교하는 반면, F 검정(두 표본 맥락에서는)은 두 그룹의 분산을 비교합니다. ANOVA에서 F 통계량은 그룹 평균 간 분산을 그룹 내 분산과 비교하여 사실상 모든 그룹 평균이 같은지 검정합니다. 두 표본 t검정은 F값이 t²와 같은 특수한 경우로 볼 수 있습니다.