Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)

비모수 Wilcoxon 순위합 검정(Mann-Whitney U)으로 두 독립 표본을 비교합니다. 정규성 가정 없이 U 통계량, Z 점수, p값을 얻을 수 있습니다.

두 독립 표본을 쉼표로 구분한 숫자로 입력하고, 유의수준과 검정 유형을 선택한 뒤 계산을 클릭하세요.

Wilcoxon Rank Sum Test Calculator (Mann-Whitney U)
비모수 Wilcoxon 순위합 검정(Mann-Whitney U)으로 두 독립 표본을 비교합니다. 정규성 가정 없이 U 통계량, Z 점수, p값을 얻을 수 있습니다.

Wilcoxon 순위합 검정 소개

Wilcoxon 순위합 검정은 Mann-Whitney U 검정이라고도 하며, 두 독립 표본이 같은 분포를 가진 모집단에서 왔는지를 판단하는 비모수 통계 가설 검정입니다. 독립표본 t-검정과 달리 데이터가 정규분포를 따른다고 가정하지 않으므로, 서열형 데이터, 치우친 분포, 또는 정규성을 확인하기 어려운 작은 표본에 특히 유용합니다. 이 검정은 1945년 Frank Wilcoxon이 처음 제안했고, 이후 Mann과 Whitney가 1947년에 오늘날 가장 널리 쓰이는 형태로 확장했습니다. Mann-Whitney U 통계량은 한 집단의 값이 다른 집단의 값을 초과하는 횟수를 셉니다. 한 표본의 U가 다른 표본보다 충분히 크면, 두 모집단의 중앙값이나 중심 경향이 다르다는 증거가 됩니다. 계산 절차는 먼저 두 표본을 합친 뒤 모든 관측값에 대해 작은 값부터 순위를 매기는 방식으로 시작합니다. 동점이 있으면 그 값들이 차지했을 순위의 평균을 부여합니다. 이후 각 집단의 순위합을 따로 계산하고, 그 순위합으로 U 통계량을 도출합니다. 표본이 큰 경우 U의 분포는 정규분포로 잘 근사되므로 Z 점수를 사용해 p값을 구합니다. 귀무가설은 두 모집단이 동일하며 분포에 체계적인 차이가 없다는 뜻입니다. 대립가설은 양측(어떤 차이든), 우측(1그룹이 더 큼), 좌측(1그룹이 더 작음)일 수 있습니다. 적절한 꼬리 유형은 연구 질문에 따라 데이터 수집 전에 결정해야 하며, 제1종 오류의 증가를 막는 데 중요합니다. p값은 선택한 유의수준 α(보통 0.05)와 함께 해석합니다. p < α이면 귀무가설을 기각하고 두 집단 사이에 통계적으로 유의한 차이가 있다고 결론합니다. p ≥ α이면 차이가 있다고 말하기엔 근거가 부족합니다. 이 검정은 의료 분야에서 치료군과 대조군의 환자 결과를 비교할 때 널리 사용됩니다. 심리학에서는 집단 간 리커트 척도 설문 응답을 비교할 수 있습니다. 생태학에서는 두 지점의 측정값이 유의하게 다른지 검정할 수 있습니다. 교육 분야에서는 서로 다른 교수법으로 가르친 학생들의 점수를 비교할 수 있습니다. 최상의 결과를 위해서는 각 표본 내 관측값이 서로 독립적이고, 두 표본 또한 서로 독립적이어야 합니다. 기본 분포의 형태가 비슷할 때 이 검정은 위치 차이(중앙값 이동)를 탐지하는 데 가장 강력합니다.

실용 예시

다음의 흔한 사례를 통해 Wilcoxon 순위합 검정의 적용 방식을 살펴보세요.

입력출력참고
S1: 7, 8, 8, 9, 10, 12 — S2: 9, 11, 12, 13, 14, 15 — α=0.05, two-tailedU=4, Z≈−2.24, p≈0.025약물 회복 시간 — 유의한 차이; 약물군의 회복이 더 빠름.
S1: 85, 90, 78, 92, 88, 76 — S2: 72, 80, 81, 75, 68, 79 — α=0.05, right-tailedU=6, Z≈1.92, p≈0.027교수법 점수 — 새 방법이 유의하게 더 높은 점수를 만듭니다.
S1: 120, 125, 130, 110, 115, 122, 128 — S2: 130, 135, 140, 128, 132, 138, 142 — α=0.01, left-tailedU=2, Z≈−2.88, p≈0.002비료 작물 수확량 — B 비료의 수확량이 유의하게 더 높음.

사용 방법

  1. 첫 번째 입력란에 표본 1의 숫자를 쉼표 또는 공백으로 구분해 입력합니다.
  2. 두 번째 입력란에 독립된 표본 2의 값을 입력합니다.
  3. 해당 버튼을 클릭해 유의수준 α(0.01, 0.05, 0.10)를 선택합니다.
  4. 꼬리 유형을 선택합니다. 어떤 차이든 보려면 양측, 표본 1이 더 클 것으로 예상하면 우측, 더 작을 것으로 예상하면 좌측을 선택하세요.
  5. 계산을 클릭하면 U 통계량, Z 점수, p값, 통계적 판단을 볼 수 있습니다.

FAQ

Wilcoxon 순위합 검정과 Mann-Whitney U 검정의 차이는 무엇인가요?
둘은 같은 검정이며 이름과 표현만 다릅니다. Wilcoxon은 검정 통계량을 순위합으로 정의했고, Mann과 Whitney는 한 집단에 유리한 쌍 비교의 개수로 U를 정의했습니다. 두 통계량은 선형적으로 연결되며 p값은 동일합니다.
t-검정 대신 Wilcoxon 순위합 검정을 언제 사용해야 하나요?
데이터가 서열형일 때, 정규성 가정이 깨졌을 때(특히 작은 표본), 또는 이상치가 있을 때 사용합니다. 거의 정규분포인 큰 표본에서는 t-검정과 Wilcoxon 검정의 결과가 비슷하지만, t-검정의 통계적 검정력은 약간 더 높습니다.
양측 검정과 단측 검정은 무슨 뜻인가요?
양측 검정은 방향과 무관하게 두 집단 사이의 차이를 확인합니다. 우측 검정은 표본 1이 표본 2보다 확률적으로 큰지, 좌측 검정은 반대를 확인합니다. 꼬리 유형은 데이터를 수집하기 전에 가설에 따라 결정해야 합니다.
계산기는 동점 값을 어떻게 처리하나요?
합쳐진 데이터에서 동점 값은 원래 차지했을 순위의 평균을 받습니다. 예를 들어 두 관측값이 3위와 4위를 동점으로 차지하면 둘 다 3.5를 받습니다. 이런 중간순위 보정은 순위합의 타당성을 보장하고 Z 근사의 정확도를 유지합니다.
신뢰할 만한 Z 점수 근사를 위해 필요한 표본 크기는 얼마인가요?
일반적으로 n₁과 n₂가 모두 최소 8~10 이상이면 정규 근사가 충분하다고 봅니다. 아주 작은 표본(n < 8)에서는 U의 정확한 분포를 사용해야 합니다. 이 계산기는 정규 근사를 사용하므로 매우 작은 표본에서는 p값을 신중하게 해석하세요.
비수치 데이터나 서열형 데이터에도 사용할 수 있나요?
네. Likert 척도 응답(1=전혀 그렇지 않다, 5=매우 그렇다)처럼 관측값에 의미 있는 순위를 매길 수 있다면 적합합니다. 관측값을 순서대로 나열할 수 있기만 하면 되며, 정확한 수치 간격은 필요하지 않습니다.