Q: p값은 실제로 무엇을 의미하나요?

p값은 귀무가설이 참이라고 가정했을 때, 관측값만큼 또는 그보다 더 극단적인 검정통계량이 나올 확률입니다. H₀가 참일 확률도 아니고, 결과가 우연히 일어났을 확률도 아닙니다. p값이 α(보통 0.05)보다 작으면 H₀가 참일 때 현재 데이터는 놀라운 결과이므로 H₀를 기각합니다. p값이 α보다 크면 데이터가 H₀와 일치하므로 기각하지 않지만, 이것이 H₀가 맞다는 증거는 아닙니다.

Q: 언제 단측검정을 쓰고 언제 양측검정을 써야 하나요?

양쪽 방향의 차이가 모두 과학적으로 의미 있고 특정 방향을 강하게 예상할 근거가 없으면 양측검정을 사용합니다. 이론이나 사전 증거가 데이터 수집 전에 효과 방향을 명확히 정해준다면 단측검정을 사용합니다. 결과를 보고 유의성을 얻기 위해 나중에 단측검정으로 바꾸는 것은 p-hacking이며 무효입니다. α=0.05의 단측검정은 α=0.10의 양측검정과 같습니다.

Q: 유의수준 α는 무엇이며 어떻게 정하나요?

유의수준 α는 허용 가능한 제1종 오류의 최대 확률, 즉 참인 귀무가설을 잘못 기각할 확률입니다. 전통적으로 0.05(5%)를 많이 사용하지만, 거짓 양성이 특히 큰 비용을 초래하는 경우(의료 진단, 안전 중요 시스템)에는 0.01을 사용합니다. 일부 분야에서는 고정된 임계값에 의존하기보다 정확한 p값을 보고하고, 신뢰구간과 효과크기를 함께 제시해 더 완전한 그림을 보길 권장합니다.

Q: 제1종 오류와 제2종 오류는 무엇인가요?

제1종 오류(거짓 양성)는 H₀가 참인데도 이를 기각하는 경우이며, 그 확률은 α입니다. 제2종 오류(거짓 음성)는 H₀가 거짓인데도 기각하지 못하는 경우이며, 그 확률은 β이고 통계적 검정력은 1−β입니다. α를 낮추면 기각 기준이 엄격해져 제1종 오류는 줄지만 제2종 오류는 늘어납니다. 표본 크기를 늘리는 것이 두 오류를 동시에 줄이는 가장 깔끔한 방법입니다.

Q: 이 계산기를 설문조사 비율에도 사용할 수 있나요?

네. 비율에 대한 Z검정 모드가 바로 그 용도입니다. 가정한 모집단 비율 p₀(기준값 또는 이론값), 표본 크기 n, 관측된 표본비율 p̂(성공 수를 n으로 나눈 값)를 입력하세요. 계산기는 표준 공식 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) 를 적용합니다. n·p₀와 n·(1−p₀)가 모두 5 또는 10보다 크면 정규근사는 신뢰할 수 있습니다.

Question 1

Z검정과 T검정의 차이는 무엇인가요?

Accepted Answer

모집단 표준편차 σ를 알고 있으면 Z검정을 사용합니다. 이렇게 하면 표준정규분포로 정확한 p값을 계산할 수 있습니다. σ를 모르고 표본표준편차 s로 추정해야 하면 T검정을 사용합니다. 이때 검정통계량은 자유도 n−1의 t분포를 따르며, 추가 불확실성을 반영해 정규분포보다 꼬리가 두껍습니다. 표본 크기가 커질수록 t분포는 정규분포로 수렴하므로, 이 차이는 작은 표본에서 가장 중요합니다(대략 n < 30).

Question 2

p값은 실제로 무엇을 의미하나요?

Accepted Answer

p값은 귀무가설이 참이라고 가정했을 때, 관측값만큼 또는 그보다 더 극단적인 검정통계량이 나올 확률입니다. H₀가 참일 확률도 아니고, 결과가 우연히 일어났을 확률도 아닙니다. p값이 α(보통 0.05)보다 작으면 H₀가 참일 때 현재 데이터는 놀라운 결과이므로 H₀를 기각합니다. p값이 α보다 크면 데이터가 H₀와 일치하므로 기각하지 않지만, 이것이 H₀가 맞다는 증거는 아닙니다.

Question 3

언제 단측검정을 쓰고 언제 양측검정을 써야 하나요?

Accepted Answer

양쪽 방향의 차이가 모두 과학적으로 의미 있고 특정 방향을 강하게 예상할 근거가 없으면 양측검정을 사용합니다. 이론이나 사전 증거가 데이터 수집 전에 효과 방향을 명확히 정해준다면 단측검정을 사용합니다. 결과를 보고 유의성을 얻기 위해 나중에 단측검정으로 바꾸는 것은 p-hacking이며 무효입니다. α=0.05의 단측검정은 α=0.10의 양측검정과 같습니다.

Question 4

유의수준 α는 무엇이며 어떻게 정하나요?

Accepted Answer

유의수준 α는 허용 가능한 제1종 오류의 최대 확률, 즉 참인 귀무가설을 잘못 기각할 확률입니다. 전통적으로 0.05(5%)를 많이 사용하지만, 거짓 양성이 특히 큰 비용을 초래하는 경우(의료 진단, 안전 중요 시스템)에는 0.01을 사용합니다. 일부 분야에서는 고정된 임계값에 의존하기보다 정확한 p값을 보고하고, 신뢰구간과 효과크기를 함께 제시해 더 완전한 그림을 보길 권장합니다.

Question 5

제1종 오류와 제2종 오류는 무엇인가요?

Accepted Answer

제1종 오류(거짓 양성)는 H₀가 참인데도 이를 기각하는 경우이며, 그 확률은 α입니다. 제2종 오류(거짓 음성)는 H₀가 거짓인데도 기각하지 못하는 경우이며, 그 확률은 β이고 통계적 검정력은 1−β입니다. α를 낮추면 기각 기준이 엄격해져 제1종 오류는 줄지만 제2종 오류는 늘어납니다. 표본 크기를 늘리는 것이 두 오류를 동시에 줄이는 가장 깔끔한 방법입니다.

Question 6

이 계산기를 설문조사 비율에도 사용할 수 있나요?

Accepted Answer

네. 비율에 대한 Z검정 모드가 바로 그 용도입니다. 가정한 모집단 비율 p₀(기준값 또는 이론값), 표본 크기 n, 관측된 표본비율 p̂(성공 수를 n으로 나눈 값)를 입력하세요. 계산기는 표준 공식 Z = (p̂ − p₀) / √(p₀(1−p₀)/n) 를 적용합니다. n·p₀와 n·(1−p₀)가 모두 5 또는 10보다 크면 정규근사는 신뢰할 수 있습니다.

시나리오	결과	해석
품질관리: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, 양측 Z검정	Z=2.357, p=0.0184 → H₀ 기각	볼트 평균 지름이 10 mm 목표에서 유의하게 벗어났습니다. 공정 조정이 필요합니다.
약물 시험: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, 우측 T검정	T=3.651, df=29, p=0.0005 → H₀ 기각	이 약물이 평균적으로 혈압을 10 mmHg보다 더 많이 낮춘다는 강한 증거가 있습니다.
A/B 테스트: p̂=0.095, p₀=0.08, n=1000, α=0.05, 우측 Z검정 (비율)	Z=1.750, p=0.0401 → H₀ 기각	새 버튼 디자인이 클릭률을 기준선 8%보다 유의하게 높였습니다.
연비: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, 좌측 Z검정	Z=−3.162, p=0.0008 → H₀ 기각	1% 수준에서 이 차종의 연비가 광고된 30 mpg보다 낮다는 증거가 있습니다.

가설 검정 계산기 - Z검정, T검정, P값

가설 검정 계산기 소개

가설 검정 예시

가설 검정 계산기 사용 방법

가설 검정 FAQ