Q: 단측 검정과 양측 검정의 차이는 무엇인가요?

양측 검정은 어느 방향의 차이든 확인하며 α를 양쪽 꼬리에 나눕니다. 단측 검정은 전체 α를 한 방향에 집중하므로 그 방향의 효과를 더 잘 잡아내지만, 데이터 보기 전에 방향이 미리 정해져 있어야만 타당합니다. 애매한 양측 결과를 살리려고 단측으로 바꾸는 것은 p-hacking입니다.

Q: 자유도는 어떻게 정해지나요?

자유도(df)는 데이터 속 독립적인 정보의 개수를 나타냅니다. 단일표본 t 검정에서는 df = n − 1입니다. 독립표본 t 검정에서는 df = n₁ + n₂ − 2입니다. r × c 분할표의 카이제곱 독립성 검정에서는 df = (r − 1)(c − 1)입니다. 일원분산분석 F 검정에서는 분자 자유도 = k − 1(집단 수 − 1), 분모 자유도 = N − k(전체 관측치 − 집단 수)입니다.

Q: p-hacking이란 무엇이고 왜 해로운가요?

p-hacking은 p < 0.05가 나올 때까지 여러 검정, 하위집단, 모델 사양을 반복해서 시도한 뒤, 그 결과만 보고하는 행위입니다. 이는 실제 제1종 오류율을 α보다 훨씬 높여 재현되지 않는 위양성을 만들어냅니다. 이를 피하려면 분석 계획을 사전 등록하고, 다중비교 보정(예: Bonferroni 보정)을 적용하며, 수행한 모든 검정을 보고해야 합니다.

Q: p값이 매우 작으면 결과가 중요하지 않다는 뜻인가요?

그럴 수 있습니다. 표본이 충분히 크면 혈압을 0.1 mmHg만 낮추는 약처럼 극히 작은 효과도 p < 0.001이 될 수 있습니다. 통계적 유의성과 실질적 유의성은 다릅니다. p값과 함께 효과 크기(Cohen's d, 오즈비, R² 등)를 반드시 계산하고 보고해, 그 효과가 실제로 의미 있는지 독자가 판단할 수 있게 하세요.

Question 1

p값은 실제로 무엇을 측정하나요?

Accepted Answer

p값은 귀무가설이 참이라고 가정했을 때, 계산한 검정 통계량만큼 또는 그보다 더 극단적인 값이 관측될 확률을 의미합니다. H₀ 아래에서 데이터가 얼마나 ‘의외’인지 수치로 나타냅니다. H₀가 참일 확률, 효과의 크기, 또는 실수를 했을 확률을 의미하는 것은 아닙니다.

Question 2

왜 α = 0.05가 관례적 기준인가요?

Accepted Answer

0.05 기준은 Ronald Fisher가 1920년대에 널리 퍼뜨린 편의적 관행일 뿐, 보편적 진리는 아닙니다. 이는 5%의 위양성 위험을 감수한다는 뜻입니다. 분야별 기준은 다릅니다. 입자물리학은 보통 p < 5×10⁻⁷을 요구하고, 유전체학은 대개 p < 5×10⁻⁸을 사용하며, 임상시험에서는 α = 0.01을 쓰기도 합니다. 적절한 기준은 위양성과 위음성의 비용에 따라 달라집니다.

Question 3

단측 검정과 양측 검정의 차이는 무엇인가요?

Accepted Answer

양측 검정은 어느 방향의 차이든 확인하며 α를 양쪽 꼬리에 나눕니다. 단측 검정은 전체 α를 한 방향에 집중하므로 그 방향의 효과를 더 잘 잡아내지만, 데이터 보기 전에 방향이 미리 정해져 있어야만 타당합니다. 애매한 양측 결과를 살리려고 단측으로 바꾸는 것은 p-hacking입니다.

Question 4

자유도는 어떻게 정해지나요?

Accepted Answer

자유도(df)는 데이터 속 독립적인 정보의 개수를 나타냅니다. 단일표본 t 검정에서는 df = n − 1입니다. 독립표본 t 검정에서는 df = n₁ + n₂ − 2입니다. r × c 분할표의 카이제곱 독립성 검정에서는 df = (r − 1)(c − 1)입니다. 일원분산분석 F 검정에서는 분자 자유도 = k − 1(집단 수 − 1), 분모 자유도 = N − k(전체 관측치 − 집단 수)입니다.

Question 5

p-hacking이란 무엇이고 왜 해로운가요?

Accepted Answer

p-hacking은 p < 0.05가 나올 때까지 여러 검정, 하위집단, 모델 사양을 반복해서 시도한 뒤, 그 결과만 보고하는 행위입니다. 이는 실제 제1종 오류율을 α보다 훨씬 높여 재현되지 않는 위양성을 만들어냅니다. 이를 피하려면 분석 계획을 사전 등록하고, 다중비교 보정(예: Bonferroni 보정)을 적용하며, 수행한 모든 검정을 보고해야 합니다.

Question 6

p값이 매우 작으면 결과가 중요하지 않다는 뜻인가요?

Accepted Answer

그럴 수 있습니다. 표본이 충분히 크면 혈압을 0.1 mmHg만 낮추는 약처럼 극히 작은 효과도 p < 0.001이 될 수 있습니다. 통계적 유의성과 실질적 유의성은 다릅니다. p값과 함께 효과 크기(Cohen's d, 오즈비, R² 등)를 반드시 계산하고 보고해, 그 효과가 실제로 의미 있는지 독자가 판단할 수 있게 하세요.

검정 설정	P값	α = 0.05에서의 판정
Z 검정, 양측, Z = 2.5, α = 0.05	p = 0.0124	p < 0.05 → 유의함. H₀ 아래에서 \|Z\| ≥ 2.5일 확률은 약 1.24%입니다.
T 검정, 우측, t = 2.1, df = 15, α = 0.05	p = 0.0267	p < 0.05 → 유의함. df = 15, t = 2.1인 단측 t 검정의 p값은 약 0.027입니다.
카이제곱 검정, 우측, χ² = 18.3, df = 10, α = 0.01	p = 0.0499	p > 0.01 → α = 0.01에서는 유의하지 않음. 같은 결과는 α = 0.05에서는 유의합니다.
F 검정, 우측, F = 3.8, df1 = 2, df2 = 27, α = 0.05	p = 0.0347	p < 0.05 → 유의함. 자유도 2와 27의 분산분석 F 비가 3.8입니다.

P값 계산기 - Z, t, F, 카이제곱 검정

P값 계산기 소개

실전 예시

P값 계산기 사용법

자주 묻는 질문