Cohen's d 효과크기 계산기

Cohen's d를 빠르게 계산해 두 집단 평균의 표준화된 차이를 확인하세요. 합동 표준편차, 효과크기, 해석 라벨을 즉시 보여줍니다.

각 집단의 평균, 표준편차, 표본수를 입력한 뒤 계산을 클릭하면 Cohen's d와 효과크기 해석이 표시됩니다.

Cohen's d 효과크기 계산기
Cohen's d를 빠르게 계산해 두 집단 평균의 표준화된 차이를 확인하세요. 합동 표준편차, 효과크기, 해석 라벨을 즉시 보여줍니다.

그룹 1 데이터

그룹 2 데이터

Cohen's d 계산기 소개

Cohen's d는 두 독립 집단의 평균을 비교할 때 가장 널리 쓰이는 효과크기 지표입니다. 통계학자 Jacob Cohen이 1969년의 기념비적인 저서 Statistical Power Analysis for the Behavioral Sciences에서 소개했으며, 두 평균의 차이를 합동 표준편차로 표현합니다. 이 값은 무차원 수이므로 시험 점수, 반응 시간, 혈압, 사용자당 매출처럼 무엇을 측정하든 공통된 척도로 비교할 수 있습니다. 공식은 간단합니다. d = (M₁ − M₂) / s_pooled이며, s_pooled는 두 집단의 표본분산을 가중 평균한 값의 제곱근입니다. 이 합동 표준편차는 두 집단의 표본수가 다를 수 있다는 점을 반영합니다. d의 부호는 방향을 나타내며, 양수는 그룹 1의 평균이 더 높고 음수는 그룹 2의 평균이 더 높다는 뜻입니다. Jacob Cohen이 제안한 관례적 기준은 이후 사회과학과 생의학 분야의 표준이 되었습니다. 절대값이 0.2 미만인 d는 무시 가능하다고 보며, 데이터에서 실제 차이가 거의 보이지 않습니다. 0.2에서 0.5는 작지만 실제로 존재하는 효과로, 15세와 16세 남학생 키를 비교할 때의 겹침 정도와 비슷합니다. 0.5에서 0.8은 보통 크기의 효과로, Cohen의 원래 분석에서 사무직과 반숙련 노동자의 평균 IQ 차이 정도에 해당합니다. 0.8을 넘으면 큰 효과로, 13세와 18세 남학생 키 차이처럼 눈에 띄는 차이를 뜻합니다. 이 기준은 엄격한 규칙이 아니라 휴리스틱으로 이해해야 합니다. 어떤 분야에서는 작은 효과크기도 매우 큰 실무적 의미를 가질 수 있습니다. 예를 들어, 수백만 명 규모의 인구에서 사망률을 아주 조금이라도 낮추는 약물은 매우 큰 공중보건 효과를 만듭니다. 반대로, 설계가 좋지 않은 설문지에서 큰 효과크기가 나와도 실제 세계에서 의미 있는 차이를 뜻하지 않을 수 있습니다. d는 항상 신뢰구간, 표본수, 그리고 해당 분야의 지식과 함께 해석해야 합니다. Cohen's d는 다른 효과크기 지표와도 밀접하게 연결됩니다. Hedges' g는 합동 표준편차에 소표본 편향 보정을 적용한 버전으로, 작은 표본(n < 20/집단)에서 더 적합합니다. Glass's Δ는 통제 집단의 표준편차만을 나누는 값으로, 두 집단의 분산이 본질적으로 다를 것으로 예상될 때 유용합니다. 상관, 분산분석, 회귀처럼 더 복잡한 설계에서는 각각 Pearson's r, η²(eta-squared), partial η²가 대응 지표입니다. 실무에서는 Cohen's d가 검정력 분석, 메타분석, 연구 보고에서 자주 사용됩니다. 검정력 분석에서는 예상 효과크기를 알면 원하는 검정력(power)으로 효과를 검출하는 데 필요한 표본수를 계산할 수 있습니다. 메타분석에서는 여러 연구의 d 값을 가중 평균하여 실제 효과의 통합 추정치를 얻습니다. 임상 연구에서는 많은 학술지가 p값과 함께 d를 보고하도록 요구합니다. 결과가 통계적으로 유의(p < 0.05)하더라도 표본이 매우 크면 효과크기는 아주 작을 수 있기 때문입니다.

Cohen's d 예시

교육, 의학, 심리학, 마케팅의 네 가지 사례로 효과크기 해석을 보여줍니다.

집단 (M, SD, n)Cohen's d해석
G1: M=85, SD=10, n=30 vs G2: M=80, SD=9, n=30d ≈ 0.52보통 크기의 효과. 새로운 교수법이 대조군보다 시험 점수를 의미 있게 높입니다.
G1: M=120, SD=15, n=50 vs G2: M=130, SD=16, n=50d ≈ −0.65보통 크기의 효과(음수). 약물군의 혈압이 위약군보다 낮아 임상적으로 바람직한 결과입니다.
G1: M=450, SD=50, n=25 vs G2: M=500, SD=55, n=25d ≈ −0.95큰 효과. 카페인은 비카페인 집단에 비해 반응 시간을 크게 줄입니다.
G1: M=75.50, SD=20, n=100 vs G2: M=70.25, SD=18, n=100d ≈ 0.28작은 효과. 레이아웃 A는 평균 구매액을 약간 높입니다. 통계적으로는 검출 가능하지만 실무적 영향은 제한적입니다.

Cohen's d 계산기 사용법

  1. 왼쪽 패널에 그룹 1의 평균 (M), 표준편차 (s), 표본수 (n)를 입력합니다.
  2. 오른쪽 패널에 그룹 2의 같은 세 값을 입력합니다. 표본수는 최소 2여야 합니다.
  3. 계산을 클릭합니다. 합동 표준편차, Cohen's d, 해석 라벨(무시 가능 / 작음 / 보통 / 큼)이 표시됩니다.
  4. 예시 버튼을 사용하면 교육, 의학 연구, 심리학의 미리 준비된 시나리오를 불러올 수 있습니다.
  5. 초기화를 클릭하면 모든 입력값이 지워지고 새 계산을 시작할 수 있습니다.

Cohen's d FAQ

좋은 Cohen's d 값은 무엇인가요?
Cohen의 일반적 기준은 d = 0.2(작음), 0.5(보통), 0.8(큼)입니다. 하지만 '좋음'은 맥락에 따라 다릅니다. 인지심리학에서는 d = 0.3도 의미 있는 경우가 많고, 의학에서는 작은 d라도 생명을 구하는 중재라면 매우 중요할 수 있습니다. 항상 해당 분야의 전형적인 효과크기와 실제적 결과를 함께 해석하세요.
합동 표준편차란 무엇인가요?
합동 표준편차는 두 집단의 분산을 하나의 집단 내 산포 추정치로 결합한 것으로, 각 집단의 자유도(n − 1)로 가중합니다. 이것이 Cohen's d 공식의 분모입니다. 한 집단의 표준편차만 쓰는 대신 합동 표준편차를 사용하면, 두 집단의 표본수가 다르거나 분산이 다소 다를 때 효과크기가 왜곡되는 것을 막을 수 있습니다.
Cohen's d 대신 Hedges' g를 언제 사용해야 하나요?
Hedges' g는 Cohen's d에 소표본 편향 보정을 적용한 값입니다. 각 집단의 n > 20이면 차이는 거의 무시할 수 있지만, 더 작은 표본에서는 의미가 있을 수 있습니다. 어느 한 집단이 20개 미만의 관측값을 갖는다면 Hedges' g 보고가 권장됩니다. 보정 계수는 대략 (1 − 3 / (4(n₁+n₂) − 9))이며, 이 계산기가 산출한 Cohen's d에 곱하면 됩니다.
Cohen's d는 등분산을 가정하나요?
표준 합동 표준편차 공식은 두 모집단 분산이 대체로 같다는 것(분산의 동질성)을 암묵적으로 가정합니다. 분산 차이가 매우 크다면 통제 집단의 표준편차만으로 나누는 Glass's Δ를 고려하거나, 비교별로 별도의 효과크기를 보고하세요. Levene 검정이나 두 표준편차의 간단한 시각적 비교도 이 가정이 타당한지 판단하는 데 도움이 됩니다.
Cohen's d는 음수가 될 수 있나요?
그렇습니다. 음수 d는 단지 그룹 2의 평균이 그룹 1보다 높다는 뜻입니다. 부호는 차이의 방향을 나타낼 뿐 크기를 뜻하지 않습니다. 많은 연구 설계에서는 부호가 어떤 집단을 그룹 1로 정하느냐에 따라 달라지므로 임의적입니다. 효과크기를 해석할 때는 d의 절댓값이 핵심이고, 부호는 어느 집단이 더 높은지 알려줍니다.
효과크기는 통계적 유의성과 어떤 관계가 있나요?
통계적 유의성(p값)은 어떤 효과가 우연히 생겼을 가능성이 낮은지 알려줍니다. 효과크기(Cohen's d)는 그 효과가 얼마나 큰지를 알려줍니다. 표본이 매우 크면 효과가 아주 작아도 매우 유의하게 나올 수 있습니다. 반대로 표본이 작으면 큰 효과도 유의수준에 도달하지 못할 수 있습니다. p값과 Cohen's d를 함께 보고해야 결과의 강도와 신뢰성을 완전히 보여줄 수 있습니다.