Q: Was bedeutet ein signifikantes Ergebnis eigentlich?

Ein signifikantes Ergebnis (p ≤ α) bedeutet, dass die beobachtete mittlere Differenz unter der Annahme der wahren Nullhypothese unwahrscheinlich durch Zufall entstanden ist. Es beweist aber weder, dass die Nullhypothese falsch ist, noch garantiert es, dass der Effekt groß oder klinisch wichtig ist. Berichten Sie immer die mittlere Differenz d̄, ihr Konfidenzintervall und eine Effektgröße (etwa Cohen's d = d̄ / s_d), damit Leser die praktische Bedeutung beurteilen können.

Question 1

Wann sollte ich einen gepaarten t-Test statt eines t-Tests für unabhängige Stichproben verwenden?

Accepted Answer

Verwenden Sie einen gepaarten t-Test, wenn jede Beobachtung in einer Gruppe natürlich mit genau einer Beobachtung der anderen Gruppe verbunden ist — zum Beispiel dieselbe Person vor und nach einer Behandlung oder zwei Geschwister, die zwei verschiedenen Diäten zugeteilt werden. Sind die beiden Gruppen unabhängig (verschiedene, nicht zusammenhängende Personen ohne Paarung), verwenden Sie einen t-Test für unabhängige Stichproben.

Question 2

Was ist die hypothetische mittlere Differenz μ₀?

Accepted Answer

μ₀ ist der Wert, von dem Sie unter der Nullhypothese annehmen, dass er der wahren mittleren Differenz entspricht. In den meisten Anwendungen — wenn man prüft, ob eine Intervention irgendeinen Effekt hat — ist μ₀ = 0. Bei spezifischeren Hypothesen, etwa ob ein Medikament den Blutdruck um mindestens 10 mmHg senkt, setzen Sie μ₀ = 10.

Question 3

Was, wenn meine Differenzen nicht normalverteilt sind?

Accepted Answer

Der gepaarte t-Test setzt voraus, dass die Differenzen näherungsweise normalverteilt sind. Bei n ≥ 30 Paaren macht der Zentrale Grenzwertsatz diese Annahme weniger kritisch. Bei kleineren Stichproben mit klar nicht normalverteilten Differenzen (Histogramm prüfen) ist der Wilcoxon-Vorzeichen-Rang-Test eine robuste nichtparametrische Alternative ohne Normalitätsannahme.

Question 4

Wie interpretiere ich das Konfidenzintervall?

Accepted Answer

Das 95%-Konfidenzintervall gibt einen Bereich plausibler Werte für die wahre mittlere Differenz an. Enthält das Intervall die Null nicht, ist das Ergebnis bei α = 0.05 signifikant. Das Intervall ist informativer als der p-Wert allein, weil es die Größe und Richtung des Effekts zeigt. Ein KI von (2.3, 9.8) sagt beispielsweise, dass der Effekt signifikant ist und von klein bis mäßig groß reicht.

Question 5

Kann ich einen einseitigen gepaarten t-Test durchführen?

Accepted Answer

Ja. Wählen Sie „Rechtsseitig“, wenn Sie Gruppe 1 > Gruppe 2 (positive mittlere Differenz) erwarten, oder „Linksseitig“, wenn Sie Gruppe 1 < Gruppe 2 (negative mittlere Differenz) erwarten. Ein einseitiger Test ist mächtiger, aber nur gültig, wenn die Richtung des Effekts bereits vor der Datenerhebung festgelegt wurde. Einen einseitigen Test nur zu wählen, weil das zweiseitige Ergebnis knapp ist, ist eine Form von p-Hacking.

Question 6

Was bedeutet ein signifikantes Ergebnis eigentlich?

Accepted Answer

Ein signifikantes Ergebnis (p ≤ α) bedeutet, dass die beobachtete mittlere Differenz unter der Annahme der wahren Nullhypothese unwahrscheinlich durch Zufall entstanden ist. Es beweist aber weder, dass die Nullhypothese falsch ist, noch garantiert es, dass der Effekt groß oder klinisch wichtig ist. Berichten Sie immer die mittlere Differenz d̄, ihr Konfidenzintervall und eine Effektgröße (etwa Cohen's d = d̄ / s_d), damit Leser die praktische Bedeutung beurteilen können.

Studiendesign	t-Wert / p-Wert	Fazit
Blutdruck vor: 140,135,150,155,130,142,138,147,152,133 / nach: 132,130,145,148,125,135,130,140,145,128 (zweiseitig, α=0.05, n=10)	t ≈ 16.00, df = 9, p < 0.001	Hochsignifikant. Das Medikament senkte den systolischen Blutdruck bei 10 Patientinnen und Patienten im Schnitt um 6.4 mmHg.
Testpunkte vor: 75,80,82,70,88,65,90,78 / nach: 85,85,88,78,92,75,95,85 (zweiseitig, α=0.05, n=8)	t ≈ −8.47, df = 7, p < 0.001	Signifikante Verbesserung. Die Studierenden erzielten nach dem Nachhilfeprogramm im Schnitt 6.9 Punkte mehr.
Wöchentliches Verkaufsvolumen vor: 500,550,480,600,520,530 / nach: 540,580,500,650,550,560 (zweiseitig, α=0.05, n=6)	t ≈ −7.91, df = 5, p < 0.001	Die Werbekampagne steigerte den wöchentlichen Umsatz signifikant um durchschnittlich 33.3 Einheiten pro Filiale.

t-Test für gepaarte Stichproben - Vorher/Nachher

Über den t-Test für gepaarte Stichproben

Durchgerechnete Beispiele

So verwenden Sie den t-Test für gepaarte Stichproben

Häufige Fragen