가설 검정 계산기 - Z검정, T검정, P값
평균과 비율에 대한 Z검정과 T검정을 수행하세요. 샘플 데이터를 입력하면 몇 초 만에 검정통계량, p값, 임계값을 계산합니다.
검정 유형과 대립가설을 선택한 뒤 데이터를 입력하고 계산을 누르면 귀무가설을 기각할지 판단할 수 있습니다.
가설 검정 계산기 - Z검정, T검정, P값
평균과 비율에 대한 Z검정과 T검정을 수행하세요. 샘플 데이터를 입력하면 몇 초 만에 검정통계량, p값, 임계값을 계산합니다.
가설 검정 계산기 소개
가설 검정은 추론통계의 핵심입니다. 수집한 데이터가 이론적 주장인 귀무가설과 일치하는지, 아니면 그 주장을 기각할 만큼 증거가 충분한지를 원칙에 기반한 확률적 틀로 판단합니다. 의학, 심리학, 경제학, 공학 품질관리, A/B 웹사이트 테스트의 모든 실험은 결국 어떤 형태의 가설 검정으로 귀결됩니다.
귀무가설 (H₀)은 기본 가정입니다. 아무 일도 일어나지 않았다, 처치는 효과가 없다, 공정은 목표를 유지한다, 비율은 변하지 않았다와 같은 상태를 뜻합니다. 대립가설 (H₁)은 탐지하려는 내용입니다. 평균이 이동했는지, 비율이 변했는지, 또는 한 처치가 다른 처치보다 나은지를 확인합니다. 유의수준 α는 보통 0.05 또는 0.01이며, H₀가 실제로 참인데 이를 잘못 기각할 확률(제1종 오류)입니다. 검정의 p값이 α보다 작으면 H₀를 기각합니다.
모집단 표준편차 σ를 알고 있고 표본이 충분히 크거나(n ≥ 30) 모집단이 정규분포를 따른다면 평균에 대한 Z검정을 사용합니다. 검정통계량은 Z = (x̄ − μ₀) / (σ / √n) 입니다. σ를 알고 있으므로 이 통계량은 표준정규분포를 정확히 따르며, p값은 정규표에서 읽습니다. σ를 모르는 현실적인 상황에서는 평균에 대한 T검정을 사용합니다. 이때는 표본표준편차 s를 사용하고, 검정통계량 T = (x̄ − μ₀) / (s / √n) 는 자유도 df = n − 1 인 t분포를 따릅니다. 표본이 작을수록 t분포의 꼬리는 정규분포보다 두꺼워서 유의성에 도달하기 더 어렵습니다. 이는 σ에 대한 추가 불확실성에 대한 합리적인 패널티입니다.
비율에 대한 Z검정은 관측된 표본비율 p̂가 가설적 모집단비율 p₀와 일치하는지 검정합니다. 표준오차는 √(p₀(1 − p₀) / n) 이고, 검정통계량은 Z = (p̂ − p₀) / SE 입니다. 이 검정은 A/B 테스트, 임상시험의 주요 평가변수, 품질관리의 불량률 관리도에 널리 사용됩니다.
양측검정에서는 |통계량|이 임계값보다 크면 H₀를 기각하며, 양쪽 방향의 차이를 모두 포착합니다. 단측검정(좌측 또는 우측)에서는 방향을 사전에 정해야 합니다. 이렇게 하면 해당 방향의 변화를 더 잘 잡아낼 수 있지만, 반대 방향의 예상치 못한 변화는 탐지하지 못합니다. 표시되는 임계값은 우측 경계이며, 좌측검정에서는 그 음수가 해당 경계입니다.
p값은 H₀가 참이라고 가정했을 때, 관측된 통계량만큼 또는 그보다 더 극단적인 값을 얻을 확률입니다. p값 0.03은 귀무가설이 참일 확률이 3%라는 뜻이 아닙니다. H₀가 참이라면 무작위 표본추출만으로 이 정도로 극단적이거나 더 극단적인 데이터가 나올 확률이 3%라는 뜻입니다. 통계적 유의성과 실질적 유의성은 다릅니다. 표본수가 매우 크면 작은 효과도 매우 유의할 수 있고, 표본수가 작으면 큰 효과도 유의하지 않을 수 있습니다. p값은 항상 효과크기와 신뢰구간과 함께 해석해야 합니다.
가설 검정 예시
각 검정 유형과 꼬리 방향을 보여주는 실제 사례입니다.
| 시나리오 | 결과 | 해석 |
|---|---|---|
| 품질관리: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, 양측 Z검정 | Z=2.357, p=0.0184 → H₀ 기각 | 볼트 평균 지름이 10 mm 목표에서 유의하게 벗어났습니다. 공정 조정이 필요합니다. |
| 약물 시험: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, 우측 T검정 | T=3.651, df=29, p=0.0005 → H₀ 기각 | 이 약물이 평균적으로 혈압을 10 mmHg보다 더 많이 낮춘다는 강한 증거가 있습니다. |
| A/B 테스트: p̂=0.095, p₀=0.08, n=1000, α=0.05, 우측 Z검정 (비율) | Z=1.750, p=0.0401 → H₀ 기각 | 새 버튼 디자인이 클릭률을 기준선 8%보다 유의하게 높였습니다. |
| 연비: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, 좌측 Z검정 | Z=−3.162, p=0.0008 → H₀ 기각 | 1% 수준에서 이 차종의 연비가 광고된 30 mpg보다 낮다는 증거가 있습니다. |
가설 검정 계산기 사용 방법
- 검정 유형을 선택하세요. σ를 알고 있으면 Z검정(평균), σ를 모르고 표본표준편차가 있으면 T검정(평균), 범주형 결과에는 Z검정(비율)을 선택합니다.
- 대립가설 방향을 선택하세요. 양측은 어떤 변화든 탐지하고, 좌측은 감소를, 우측은 증가를 탐지합니다.
- 귀무가설 값(평균 검정에서는 μ₀, 비율 검정에서는 p₀), 선택한 유의수준 α(보통 0.05), 표본 크기 n을 입력하세요.
- 나머지 항목을 입력하세요. Z검정(평균)은 표본평균 x̄와 모집단 표준편차 σ, T검정은 표본평균 x̄와 표본표준편차 s, Z검정(비율)은 표본비율 p̂를 입력합니다.
- 계산을 클릭하세요. 도구는 검정통계량, 자유도(T검정만), p값, 임계값, 기각/기각 실패 판정을 표시합니다.
가설 검정 FAQ
Z검정과 T검정의 차이는 무엇인가요?
모집단 표준편차 σ를 알고 있으면 Z검정을 사용합니다. 이렇게 하면 표준정규분포로 정확한 p값을 계산할 수 있습니다. σ를 모르고 표본표준편차 s로 추정해야 하면 T검정을 사용합니다. 이때 검정통계량은 자유도 n−1의 t분포를 따르며, 추가 불확실성을 반영해 정규분포보다 꼬리가 두껍습니다. 표본 크기가 커질수록 t분포는 정규분포로 수렴하므로, 이 차이는 작은 표본에서 가장 중요합니다(대략 n < 30).
p값은 실제로 무엇을 의미하나요?
p값은 귀무가설이 참이라고 가정했을 때, 관측값만큼 또는 그보다 더 극단적인 검정통계량이 나올 확률입니다. H₀가 참일 확률도 아니고, 결과가 우연히 일어났을 확률도 아닙니다. p값이 α(보통 0.05)보다 작으면 H₀가 참일 때 현재 데이터는 놀라운 결과이므로 H₀를 기각합니다. p값이 α보다 크면 데이터가 H₀와 일치하므로 기각하지 않지만, 이것이 H₀가 맞다는 증거는 아닙니다.
언제 단측검정을 쓰고 언제 양측검정을 써야 하나요?
양쪽 방향의 차이가 모두 과학적으로 의미 있고 특정 방향을 강하게 예상할 근거가 없으면 양측검정을 사용합니다. 이론이나 사전 증거가 데이터 수집 전에 효과 방향을 명확히 정해준다면 단측검정을 사용합니다. 결과를 보고 유의성을 얻기 위해 나중에 단측검정으로 바꾸는 것은 p-hacking이며 무효입니다. α=0.05의 단측검정은 α=0.10의 양측검정과 같습니다.
유의수준 α는 무엇이며 어떻게 정하나요?
유의수준 α는 허용 가능한 제1종 오류의 최대 확률, 즉 참인 귀무가설을 잘못 기각할 확률입니다. 전통적으로 0.05(5%)를 많이 사용하지만, 거짓 양성이 특히 큰 비용을 초래하는 경우(의료 진단, 안전 중요 시스템)에는 0.01을 사용합니다. 일부 분야에서는 고정된 임계값에 의존하기보다 정확한 p값을 보고하고, 신뢰구간과 효과크기를 함께 제시해 더 완전한 그림을 보길 권장합니다.
제1종 오류와 제2종 오류는 무엇인가요?
제1종 오류(거짓 양성)는 H₀가 참인데도 이를 기각하는 경우이며, 그 확률은 α입니다. 제2종 오류(거짓 음성)는 H₀가 거짓인데도 기각하지 못하는 경우이며, 그 확률은 β이고 통계적 검정력은 1−β입니다. α를 낮추면 기각 기준이 엄격해져 제1종 오류는 줄지만 제2종 오류는 늘어납니다. 표본 크기를 늘리는 것이 두 오류를 동시에 줄이는 가장 깔끔한 방법입니다.
이 계산기를 설문조사 비율에도 사용할 수 있나요?
네. 비율에 대한 Z검정 모드가 바로 그 용도입니다. 가정한 모집단 비율 p₀(기준값 또는 이론값), 표본 크기 n, 관측된 표본비율 p̂(성공 수를 n으로 나눈 값)를 입력하세요. 계산기는 표준 공식 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) 를 적용합니다. n·p₀와 n·(1−p₀)가 모두 5 또는 10보다 크면 정규근사는 신뢰할 수 있습니다.