Rechner für gepoolte Standardabweichung

Gepoolte Standardabweichung für zwei unabhängige Stichproben berechnen

Geben Sie Stichprobengrößen, Mittelwerte und Standardabweichungen zweier Gruppen ein, um die gepoolte Standardabweichung, die t-Statistik und Cohen's d zu berechnen.

Rechner für gepoolte Standardabweichung
Gepoolte Standardabweichung für zwei unabhängige Stichproben berechnen
Stichprobe 1
Stichprobe 2

Über den Rechner für gepoolte Standardabweichung

Die gepoolte Standardabweichung ist ein gewichteter Mittelwert der Standardabweichungen aus zwei (oder mehr) unabhängigen Stichproben. Sie wird verwendet, wenn Gruppen verglichen werden, die dieselbe zugrunde liegende Populationsvarianz teilen. Sie ist ein Grundpfeiler des t-Tests für unabhängige Stichproben und vieler weiterer inferenzstatistischer Verfahren. Die Formel für die gepoolte Standardabweichung lautet: sp = √[((n₁−1)s₁² + (n₂−1)s₂²) / (n₁+n₂−2)], wobei n₁ und n₂ die Stichprobengrößen und s₁ und s₂ die Stichprobenstandardabweichungen sind. Der Nenner n₁+n₂−2 steht für die gesamten Freiheitsgrade des Zwei-Stichproben-Vergleichs. Die gepoolte Standardabweichung setzt Varianzhomogenität voraus, also dass beide Stichproben aus Populationen mit derselben Varianz stammen. Diese Annahme sollte vor Verwendung der gepoolten Schätzung geprüft werden (z. B. mit dem Levene-Test oder Bartlett-Test). Sind die Varianzen ungleich, ist der Welch-t-Test vorzuziehen, da er die Varianzen nicht poolt. Zusätzlich zur gepoolten SA liefert dieser Rechner die gepoolte Varianz (sp²), die gesamten Freiheitsgrade, die Zwei-Stichproben-t-Statistik und Cohen's d als standardisierte Effektgröße. Cohen's d = (mean₁ − mean₂) / sp quantifiziert die praktische Bedeutung der Mittelwertdifferenz in Einheiten der gepoolten Standardabweichung. Richtwerte für Cohen's d: Werte um 0.2 gelten als kleine, 0.5 als mittlere und 0.8 oder höher als große Effekte. Diese Schwellenwerte helfen bei der Interpretation in Psychologie, Medizin, Bildung und Sozialwissenschaften. Die gepoolte Standardabweichung wird außerdem zur Berechnung von Konfidenzintervallen für die Differenz zweier Mittelwerte, in Metaanalysen zur Kombination von Effektgrößen über Studien hinweg und in der Qualitätskontrolle zur Aggregation von Variabilitätsschätzungen über Produktionschargen verwendet. Praktische Anwendungen umfassen klinische Studien (Vergleich von Behandlungs- und Kontrollgruppen), A/B-Tests in der Produktanalyse (Vergleich von Konversionsraten), Bildungsforschung (Vergleich der Streuung von Testergebnissen zwischen Klassenräumen) und industrielle Qualitätskontrolle (Zusammenführen von Fehlerratenschätzungen aus mehreren Produktionslinien). Merken Sie sich: Die gepoolte Standardabweichung ist eine präzisere Schätzung der gemeinsamen Populationsstandardabweichung als jede einzelne Stichprobenstandardabweichung, weil sie die Informationen beider Gruppen gleichzeitig nutzt.

Beispiele

Diese Beispiele zeigen, wie die gepoolte Standardabweichung in unterschiedlichen Zwei-Stichproben-Szenarien berechnet wird.

EingabenGepoolte SAKontext
n₁=10, x̄₁=50, s₁=2; n₂=15, x̄₂=55, s₂=3sp ≈ 2.669Ungleiche Stichprobengrößen, unterschiedliche Mittelwerte
n₁=20, x̄₁=30, s₁=4; n₂=20, x̄₂=35, s₂=4sp = 4.000Gleiche Größen und SA, reiner Durchschnitt
n₁=30, x̄₁=100, s₁=10; n₂=30, x̄₂=105, s₂=12sp ≈ 11.045Größere Stichproben, ähnliche SA
n₁=5, x̄₁=8, s₁=1.5; n₂=8, x̄₂=10, s₂=2sp ≈ 1.824Kleine Stichproben, Gewichtung zur größeren Gruppe

So verwenden Sie diesen Rechner

  1. Geben Sie Stichprobengröße (n₁), Mittelwert (x̄₁) und Standardabweichung (s₁) der ersten Gruppe ein.
  2. Geben Sie die entsprechenden Werte (n₂, x̄₂, s₂) der zweiten Gruppe ein. Stichprobengrößen müssen mindestens 2 betragen.
  3. Klicken Sie auf „Berechnen“, um gepoolte Standardabweichung, gepoolte Varianz, Freiheitsgrade, t-Statistik und Cohen's d zu berechnen.
  4. Interpretieren Sie die gepoolte SA unter der Annahme gleicher Varianzen als beste Schätzung der gemeinsamen Populationsstandardabweichung.
  5. Verwenden Sie t-Statistik und Freiheitsgrade mit einer t-Verteilungstabelle, um statistische Signifikanz zu bestimmen, oder prüfen Sie Cohen's d für die Effektgröße.

Häufig gestellte Fragen

Was ist die gepoolte Standardabweichung?
Die gepoolte Standardabweichung (sp) kombiniert die Varianzschätzungen aus zwei unabhängigen Stichproben zu einer einzelnen, präziseren Schätzung. Sie ist ein gewichteter Mittelwert der beiden Stichprobenvarianzen, gewichtet nach ihren Freiheitsgraden. Sie setzt voraus, dass beide Populationen dieselbe zugrunde liegende Varianz teilen.
Wann sollte ich die gepoolte Standardabweichung verwenden?
Verwenden Sie die gepoolte Standardabweichung, wenn Sie Varianzhomogenität zwischen zwei Gruppen annehmen, beispielsweise bei einem klassischen Zwei-Stichproben-t-Test. Wenn ein Vortest (Levene, Bartlett) nahelegt, dass sich die Varianzen signifikant unterscheiden, verwenden Sie stattdessen den Welch-t-Test, der keine Varianzgleichheit erfordert.
Was ist Cohen's d und wie interpretiere ich es?
Cohen's d ist eine standardisierte Effektgröße, die die Mittelwertdifferenz in Einheiten der gepoolten Standardabweichung ausdrückt. Werte von ungefähr 0.2, 0.5 und 0.8 werden üblicherweise als kleine, mittlere bzw. große Effekte beschrieben. Ein großes Cohen's d zeigt, dass die beiden Gruppen im Verhältnis zu ihrer kombinierten Variabilität gut getrennt sind.
Warum teilt die Formel durch n₁+n₂−2?
Der Nenner n₁+n₂−2 entspricht den gesamten Freiheitsgraden, die durch die Schätzung der beiden Stichprobenmittelwerte verbraucht werden. Die Verwendung von Freiheitsgraden (statt n₁+n₂) liefert eine unverzerrte Schätzung der Populationsvarianz. Jede Stichprobe trägt nᵢ−1 Freiheitsgrade zur gepoolten Schätzung bei.
Kann ich die gepoolte Standardabweichung für mehr als zwei Gruppen verwenden?
Ja. Die gepoolte Standardabweichung lässt sich mit der Formel sp = √[Σ(nᵢ−1)sᵢ² / Σ(nᵢ−1)] auf k Gruppen erweitern. Diese Verallgemeinerung wird in der ANOVA verwendet, wo eine einzige gepoolte Within-Group-Standardabweichung (Wurzel des mittleren Fehlerquadrats) als Schätzung der gemeinsamen Varianz dient.
Wie beeinflusst die Stichprobengröße die gepoolte Standardabweichung?
Größere Stichproben haben in der gepoolten Schätzung mehr Gewicht. Wenn n₁ >> n₂, wird die gepoolte SA von der Varianz der ersten Stichprobe dominiert. Das spiegelt das Prinzip wider, dass mehr Daten eine verlässlichere Varianzschätzung liefern. Es bedeutet auch, dass Ausreißer oder Verletzungen der Annahme gleicher Varianzen stärkeren Einfluss haben, wenn eine Stichprobe viel größer ist.