Tukey HSD 계산기 - ANOVA 사후검정
ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.
각 그룹의 데이터를 쉼표로 구분해 입력하고, 그룹 수와 유의수준을 선택한 뒤 계산을 클릭하면 ANOVA 표와 모든 쌍별 비교 결과를 볼 수 있습니다.
Tukey HSD 계산기 - ANOVA 사후검정
ANOVA 이후 Tukey의 Honestly Significant Difference 검정을 실행해 어떤 그룹 평균이 유의하게 다른지 확인합니다.
Tukey HSD 검정 소개
Tukey의 Honestly Significant Difference(HSD) 검정은 일원분산분석(ANOVA)에서 유의한 F 통계량이 나온 뒤 수행하는 대표적인 사후검정입니다. ANOVA가 적어도 한 그룹 평균이 다르다고 알려주면, Tukey HSD는 어떤 평균쌍이 그 차이를 만드는지 정확히 짚어내면서 선택한 α 수준에서 모든 비교에 대한 가족오류율을 통제합니다.
이 검정은 통계학자 John Tukey가 1949년에 개발했으며, 모든 쌍별 비교가 중요할 때 지금도 표준으로 쓰입니다. 과도하게 보수적인 Bonferroni 보정과 달리, Tukey 방법은 표본 크기가 같을 때 실험 전체 오류율을 정확히 통제하고, 표본 크기가 다를 때도 근사적으로 잘 통제합니다. 이런 통계적 검정력과 오류 제어의 균형 때문에 농업, 심리학, 임상시험, 제조업 등에서 3개 이상 처리군을 비교할 때 기본 선택이 됩니다.
계산은 일원분산분석부터 시작합니다. 모든 관측값으로 전체 평균을 구한 뒤, 제곱합을 집단 간 변동(각 그룹 평균이 전체 평균에서 얼마나 떨어져 있는지)과 집단 내 변동(개별 값이 그룹 평균 주변에서 얼마나 흩어져 있는지)으로 나눕니다. 각 제곱합을 자유도로 나누면 평균제곱이 됩니다. F 통계량은 집단 간 평균제곱을 집단 내 평균제곱으로 나눈 비율이며, 값이 클수록 그룹 평균이 실제로 다를 가능성이 높습니다.
HSD 단계에서는 그룹 수 k와 집단 내 자유도를 사용해 studentized range 분포표에서 임계값 q를 찾습니다. HSD 기준값은 q × √(MS_within / n_harmonic)이며, 여기서 n_harmonic은 각 그룹 표본수의 조화평균입니다. 두 평균의 절대차가 이 기준값을 넘으면 유의하게 다르다고 판정합니다.
이 계산기는 2~6개 그룹과 서로 다른 표본 수를 지원하며, 유효 표본수로 조화평균을 사용합니다. 결과에는 완전한 ANOVA 표와 모든 쌍별 비교 행렬이 포함됩니다. 표준 95% 신뢰수준에는 α = 0.05를, 더 엄격한 99% 수준에는 α = 0.01을 사용하세요.
Tukey HSD 예시
검정이 유의한 그룹 차이를 찾아내거나 찾아내지 못하는 방식을 보여주는 대표 데이터셋입니다.
| 그룹 | 판정 | 메모 |
|---|---|---|
| G1: 23,25,28,30 | G2: 22,24,26,28 | G3: 35,38,40,42 | G1 vs G3: 유의함; G2 vs G3: 유의함 | 3그룹 평균(약 38.75)이 1그룹과 2그룹(약 26.5, 약 25)보다 훨씬 높습니다. G3가 포함된 쌍은 HSD 기준값을 넘습니다. |
| G1: 10,11,12 | G2: 10,12,11 | G3: 11,13,12 | 유의한 차이 없음 | 평균은 11, 11, 12입니다. 집단 내 변동에 비해 차이가 작아 모든 쌍이 HSD 기준값 아래에 있습니다. |
| G1: 5,6,7,8 | G2: 12,14,13,15 | G3: 20,21,22,23 | G4: 30,31,29,32 | 모든 쌍 유의함 | 네 개의 그룹이 일정한 간격으로 떨어져 있고 집단 내 분산도 작습니다. alpha=0.05에서 모든 평균 차이가 HSD 기준값을 넘습니다. |
Tukey HSD 계산기 사용 방법
- 계산기 상단의 그룹 선택 버튼으로 그룹 수(2-6)를 선택합니다.
- 각 그룹에 해당하는 입력란에 쉼표로 구분된 데이터 값을 입력합니다.
- 유의수준을 선택합니다. alpha=0.05는 일반적인 5% 기준이고, alpha=0.01은 더 엄격한 1% 기준입니다.
- 계산을 클릭하면 ANOVA 표(SS, df, MS, F)와 전체 쌍별 비교 표가 표시됩니다.
- 쌍별 비교 표의 결과 열을 확인하세요. 유의함으로 표시된 쌍은 평균 차이가 HSD 기준값을 넘습니다.
Tukey HSD FAQ
Tukey HSD 검정은 언제 사용해야 하나요?
유의한 일원분산분석 결과를 얻었고, 어떤 그룹 평균이 다른지 알고 싶을 때 사용합니다. 모든 쌍별 비교를 계획했고 실험 전체 오류율을 엄격하게 관리하고 싶을 때 이상적입니다.
HSD 기준값은 무엇을 의미하나요?
HSD 기준값은 선택한 alpha 수준에서 통계적으로 유의하다고 보는 두 그룹 평균의 최소 절대차입니다. 평균 차이가 이 값을 넘는 쌍은 유의하게 다르다고 표시됩니다.
Tukey HSD는 t-검정과 어떻게 다른가요?
쌍별 t-검정은 다중비교 보정을 하지 않으므로 여러 번 수행하면 거짓 양성 가능성이 커집니다. Tukey HSD는 모든 비교에 대한 가족오류율을 동시에 통제하므로 3개 이상 그룹을 검사할 때 더 적합합니다.
Tukey HSD는 같은 표본 크기가 필요한가요?
표본 크기가 같으면 가족오류율을 정확하게 통제할 수 있습니다. 표본 크기가 다를 때는 이 계산기가 그룹 크기의 조화평균을 사용해 Tukey-Kramer 방법으로 알려진 좋은 근사를 제공합니다.
studentized range 통계량 q는 무엇인가요?
q 통계량은 그룹 평균 범위를 표준오차로 나눈 값입니다. 임계값은 studentized range 분포에서 찾으며, 그룹 수 k와 오차 자유도를 반영합니다.
ANOVA가 유의하지 않으면 어떻게 하나요?
전체 ANOVA F 검정이 유의하지 않다면 어떤 평균도 다르다는 통계적 근거가 없으므로, 일반적으로 Tukey HSD 같은 사후검정은 하지 않습니다. 유의하지 않은 F를 보고하고 종료하는 것이 표준입니다.