Cohens-d-Rechner

Berechnen Sie Cohens d, um den standardisierten Unterschied zwischen zwei Mittelwerten zu quantifizieren — inklusive gepoolter SD, Effektstärke und sofortiger Interpretationsstufe.

Geben Sie Mittelwert, Standardabweichung und Stichprobengröße für beide Gruppen ein und klicken Sie auf Berechnen, um Cohens d samt Effektstärken-Interpretation zu sehen.

Cohens-d-Rechner
Berechnen Sie Cohens d, um den standardisierten Unterschied zwischen zwei Mittelwerten zu quantifizieren — inklusive gepoolter SD, Effektstärke und sofortiger Interpretationsstufe.

Daten von Gruppe 1

Daten von Gruppe 2

Über den Cohens-d-Rechner

Cohens d ist das am weitesten verbreitete Maß für Effektstärken beim Vergleich der Mittelwerte zweier unabhängiger Gruppen. Es wurde vom Statistiker Jacob Cohen in seinem wegweisenden Buch Statistical Power Analysis for the Behavioral Sciences aus dem Jahr 1969 eingeführt und drückt den Unterschied zwischen zwei Mittelwerten in Einheiten der gepoolten Standardabweichung aus. Das Ergebnis ist eine dimensionslose Zahl auf einer gemeinsamen Skala — unabhängig davon, ob Sie Testergebnisse, Reaktionszeiten, Blutdruckwerte oder Umsatz pro Nutzer messen. Die Formel ist einfach: d = (M₁ − M₂) / s_pooled, wobei s_pooled die Quadratwurzel des gewichteten Mittelwerts der beiden Stichprobenvarianzen ist. Diese gepoolte Standardabweichung berücksichtigt, dass die Gruppen unterschiedliche Stichprobengrößen haben können. Das Vorzeichen von d gibt die Richtung an: Ein positives d bedeutet, dass Gruppe 1 den höheren Mittelwert hat, ein negatives d, dass Gruppe 2 höher liegt. Jacob Cohen schlug konventionelle Richtwerte vor, die sich inzwischen in den Sozial- und Biowissenschaften etabliert haben. Ein absoluter d-Wert unter 0,2 gilt als vernachlässigbar — die Gruppen sind so ähnlich, dass der Unterschied in den Daten praktisch unsichtbar ist. Ein d zwischen 0,2 und 0,5 ist klein, aber real; er entspricht ungefähr der Überschneidung, die man beim Vergleich der Körpergröße von 15- und 16-jährigen Jungen sieht. Ein d zwischen 0,5 und 0,8 ist mittel und vergleichbar mit dem mittleren IQ-Unterschied zwischen Büroangestellten und angelernten Arbeitern in Cohens ursprünglichen Analysen. Ein d über 0,8 ist groß und entspricht leicht erkennbaren Unterschieden, etwa beim Größenunterschied zwischen 13- und 18-jährigen Jungen. Diese Richtwerte sollten als Heuristiken und nicht als harte Regeln verstanden werden. In manchen Bereichen kann eine kleine Effektstärke enorme praktische Bedeutung haben. Ein Medikament, das die Sterblichkeit in einer Bevölkerung von Millionen auch nur geringfügig senkt, erzeugt einen sehr großen Nutzen für die öffentliche Gesundheit. Umgekehrt muss eine große Effektstärke in einem schlecht konstruierten Fragebogen nicht zwangsläufig reale Unterschiede bedeuten. Interpretieren Sie d immer zusammen mit Konfidenzintervallen, Stichprobengröße und Fachwissen. Cohens d steht auch in engem Zusammenhang mit anderen Effektstärkemaßen. Hedges' g verwendet eine bias-korrigierte Version der gepoolten Standardabweichung und wird bei kleinen Stichproben bevorzugt (n < 20 pro Gruppe). Glass' Δ teilt nur durch die Standardabweichung der Kontrollgruppe und ist nützlich, wenn die Gruppen erwartungsgemäß unterschiedliche Varianzen haben. Für komplexere Designs — Korrelation, ANOVA, Regression — entsprechen die Größen Pearson's r, η² (Eta-Quadrat) und partielle η². In der Praxis begegnet man Cohens d vor allem in Power-Analysen, Metaanalysen und Forschungsberichten. In der Power-Analyse ermöglicht die erwartete Effektstärke die Berechnung der Stichprobengröße, die nötig ist, um einen Effekt mit einer bestimmten Wahrscheinlichkeit (Power) zu entdecken. In der Metaanalyse können d-Werte mehrerer Studien gewichtet gemittelt werden, um eine gepoolte Schätzung des wahren Effekts zu erhalten. In der klinischen Forschung verlangen viele Journals neben p-Werten auch d, weil ein Ergebnis statistisch signifikant (p < 0,05) sein kann und dennoch bei sehr großen Stichproben nur eine triviale Effektstärke aufweisen kann.

Cohens-d-Beispiele

Vier Szenarien aus Bildung, Medizin, Psychologie und Marketing zeigen, wie man Effektstärken interpretiert.

Gruppen (M, SD, n)Cohens dInterpretation
G1: M=85, SD=10, n=30 vs G2: M=80, SD=9, n=30d ≈ 0.52Mittlere Effektstärke. Die neue Lehrmethode führt zu einem deutlich höheren Testergebnis als die Kontrollgruppe.
G1: M=120, SD=15, n=50 vs G2: M=130, SD=16, n=50d ≈ −0.65Mittlere Effektstärke (negativ). Die Medikamentengruppe hat einen niedrigeren Blutdruck als die Placebogruppe — ein günstiges klinisches Ergebnis.
G1: M=450, SD=50, n=25 vs G2: M=500, SD=55, n=25d ≈ −0.95Große Effektstärke. Koffein verkürzt die Reaktionszeit gegenüber der Gruppe ohne Koffein deutlich.
G1: M=75.50, SD=20, n=100 vs G2: M=70.25, SD=18, n=100d ≈ 0.28Kleine Effektstärke. Layout A erhöht den durchschnittlichen Bestellwert leicht — statistisch messbar, aber praktisch eher moderat.

So verwenden Sie den Cohens-d-Rechner

  1. Geben Sie im linken Bereich Mittelwert (M), Standardabweichung (s) und Stichprobengröße (n) für Gruppe 1 ein.
  2. Geben Sie im rechten Bereich dieselben drei Werte für Gruppe 2 ein. Die Stichprobengröße muss mindestens 2 betragen.
  3. Klicken Sie auf Berechnen. Der Rechner zeigt gepoolte Standardabweichung, Cohens d und eine Interpretationsstufe (vernachlässigbar / klein / mittel / groß).
  4. Mit den Beispiel-Buttons laden Sie vorgefertigte Szenarien aus Bildung, medizinischer Forschung und Psychologie.
  5. Klicken Sie auf Zurücksetzen, um alle Felder zu leeren und eine neue Berechnung zu starten.

Cohens-d-FAQ

Was ist ein guter Cohens-d-Wert?
Cohens konventionelle Richtwerte sind d = 0,2 (klein), 0,5 (mittel) und 0,8 (groß). Was „gut“ ist, hängt jedoch vom Kontext ab. In der kognitiven Psychologie werden Effekte von d = 0,3 oft bereits als bedeutsam angesehen. In der Medizin kann ein kleiner d bei einer lebensrettenden Intervention äußerst wichtig sein. Interpretieren Sie d stets im Kontext der typischen Effektstärken Ihres Fachgebiets und der praktischen Folgen des Befunds.
Was ist die gepoolte Standardabweichung?
Die gepoolte Standardabweichung fasst die Varianz beider Gruppen zu einer einzigen Schätzung der Streuung innerhalb der Gruppen zusammen, gewichtet nach den Freiheitsgraden jeder Gruppe (n − 1). Sie ist der Nenner in der Cohens-d-Formel. Die Verwendung der gepoolten SD statt nur der SD einer Gruppe verhindert Verzerrungen, wenn die Gruppen unterschiedliche Stichprobengrößen oder moderat unterschiedliche Varianzen haben.
Wann sollte ich Hedges' g statt Cohens d verwenden?
Hedges' g wendet eine Klein-Stichproben-Biaskorrektur auf Cohens d an. Der Unterschied ist bei n > 20 pro Gruppe vernachlässigbar, kann bei kleineren Stichproben aber relevant sein. Wenn eine der Gruppen weniger als 20 Beobachtungen hat, wird die Berichterstattung von Hedges' g empfohlen. Der Korrekturfaktor ist ungefähr (1 − 3 / (4(n₁+n₂) − 9)), den Sie mit dem von diesem Rechner berechneten Cohens-d-Wert multiplizieren können.
Setzt Cohens d gleiche Varianzen voraus?
Die Standardformel der gepoolten SD setzt implizit voraus, dass die beiden Populationsvarianzen ungefähr gleich sind (Varianzhomogenität). Wenn die Varianzen stark unterschiedlich sind, sollten Sie Glass' Δ in Betracht ziehen, das nur durch die Standardabweichung der Kontrollgruppe teilt, oder separate Effektstärken für jede Vergleichspaarung berichten. Ein Levene-Test oder ein einfacher visueller Vergleich der beiden SDs hilft zu beurteilen, ob diese Annahme plausibel ist.
Kann Cohens d negativ sein?
Ja. Ein negatives d bedeutet einfach, dass Gruppe 2 einen höheren Mittelwert hat als Gruppe 1. Das Vorzeichen gibt die Richtung des Unterschieds an, nicht seine Größe. In vielen Studiendesigns ist das Vorzeichen willkürlich und hängt davon ab, wie Sie Gruppe 1 definiert haben. Für die Interpretation der Effektstärke ist der Absolutwert von d entscheidend; das Vorzeichen zeigt nur, welche Gruppe höher lag.
Wie hängt Effektstärke mit statistischer Signifikanz zusammen?
Statistische Signifikanz (p-Wert) sagt Ihnen, ob ein Effekt wahrscheinlich nicht zufällig entstanden ist. Die Effektstärke (Cohens d) sagt Ihnen, wie groß dieser Effekt ist. Ein Ergebnis kann hochsignifikant sein (sehr kleines p), aber eine triviale Effektstärke haben, wenn die Stichprobe enorm groß ist. Umgekehrt kann eine große Effektstärke in einer kleinen Stichprobe nicht signifikant werden. Die gemeinsame Berichterstattung von p-Wert und Cohens d liefert ein vollständiges Bild von Stärke und Zuverlässigkeit des Befunds.