Wilcoxon-Vorzeichen-Rang-Test-Rechner für gepaarte Stichproben
Vergleichen Sie zwei verbundene Stichproben oder Wiederholungsmessungen mit dem nichtparametrischen Wilcoxon-Vorzeichen-Rang-Test. Erhalten Sie W-Statistik, Z-Wert und p-Wert ohne Normalverteilungsannahme.
Geben Sie Ihre gepaarten Vorher-/Nachher-Messwerte als durch Kommas getrennte Zahlen ein. Beide Stichproben müssen genau gleich viele Werte enthalten.
Wilcoxon-Vorzeichen-Rang-Test-Rechner für gepaarte Stichproben
Vergleichen Sie zwei verbundene Stichproben oder Wiederholungsmessungen mit dem nichtparametrischen Wilcoxon-Vorzeichen-Rang-Test. Erhalten Sie W-Statistik, Z-Wert und p-Wert ohne Normalverteilungsannahme.
Über den Wilcoxon-Vorzeichen-Rang-Test
Der Wilcoxon-Vorzeichen-Rang-Test ist ein nichtparametrischer statistischer Hypothesentest zum Vergleich zweier verbundener Stichproben oder wiederholter Messungen innerhalb einer Gruppe. Er ist das nichtparametrische Gegenstück zum gepaarten t-Test und wird eingesetzt, wenn die Annahme der Normalverteilung der Differenzen zwischen den Paaren nicht gerechtfertigt werden kann.
Der Test wurde 1945 von Frank Wilcoxon eingeführt und ist besonders in klinischen Studien und der Verhaltensforschung nützlich, wenn dieselben Personen vor und nach einer Intervention gemessen werden. Anstatt mit den Rohwerten zu arbeiten, werden die absoluten Differenzen der gepaarten Beobachtungen gerankt und die positiven und negativen Rangsumme getrennt addiert.
Das Verfahren läuft wie folgt ab. Für jedes Paar wird die Differenz d = (nach − vor) berechnet. Paare mit Differenz null werden ausgeschlossen. Die absoluten Differenzen werden der Größe nach geordnet, bei Bindungen wird der mittlere Rang vergeben. Die Rangsumme der positiven Differenzen ist W⁺, die der negativen Differenzen W⁻. Die Teststatistik W ist der kleinere der beiden Werte.
Für größere Stichproben (typischerweise n ≥ 10) lässt sich die Verteilung von W durch eine Normalverteilung annähern. Der Z-Wert wird mit Mittelwert und Standardabweichung von W unter der Nullhypothese berechnet. Der Mittelwert beträgt n(n+1)/4 und die Standardabweichung √[n(n+1)(2n+1)/24], wobei n die Anzahl der nicht nullen Differenzen ist.
Die Nullhypothese besagt, dass die Median-Differenz zwischen den gepaarten Beobachtungen null ist — die Behandlung hat keinen Effekt. Die Alternativhypothese kann zweiseitig sein (die Median-Differenz ist nicht null) oder einseitig (positiv oder negativ). Dieser Rechner zeigt den zweiseitigen p-Wert an, was die konservativste Wahl ist.
Ein p-Wert unter 0,05 wird üblicherweise als Hinweis auf einen signifikanten Unterschied zwischen den gepaarten Messungen interpretiert. In einer Blutdruckstudie könnte das bedeuten, dass ein Medikament den systolischen Druck signifikant gesenkt hat. In einer psychologischen Studie könnte es zeigen, dass ein Therapieprogramm die Angstwerte signifikant reduziert hat.
Der Test setzt voraus, dass die Beobachtungen gepaart sind — jede Beobachtung aus Stichprobe 1 muss einer bestimmten Beobachtung aus Stichprobe 2 entsprechen (derselbe Proband zu einem anderen Zeitpunkt oder gematchte Probanden). Die Paare müssen untereinander unabhängig sein, und die Differenzen sollten aus einer symmetrischen Verteilung stammen, nicht unbedingt aus einer Normalverteilung.
Im Vergleich zum gepaarten t-Test ist der Wilcoxon-Vorzeichen-Rang-Test robuster gegenüber Ausreißern und nicht normalen Verteilungen, aber etwas weniger leistungsstark, wenn die Normalitätsannahme erfüllt ist. Er ist die empfohlene Wahl für kleine Stichproben, ordinale Ergebnisse oder Daten mit Extremwerten.
Praxisbeispiele
Nutzen Sie diese Beispiele, um zu sehen, wie der Rechner mit unterschiedlichen gepaarten Datensätzen arbeitet.
| Eingabe | Ausgabe | Hinweis |
|---|---|---|
| Vor: 140,135,150,160,130,145,155,138,148,152 — Nach: 132,130,142,151,125,137,145,130,140,148 | W=0, Z≈−2.80, p≈0.005 | Blutdruckmedikament — alle Differenzen sind negativ, deutliche Senkung. |
| Vor: 8,7,6,9,8,7,8,9 — Nach: 6,5,5,7,6,6,7,7 | W=0, Z≈−2.52, p≈0.012 | Angstwerte nach Therapie — signifikante Verbesserung bei α = 0,05. |
| Vor: 75,80,82,79,88,90,76,85,89,92,78,84 — Nach: 80,85,85,83,90,94,81,88,92,95,81,89 | W=0, Z≈+3.06, p≈0.002 | Schülerleistungen vor und nach einer neuen Lehrmethode — deutlicher Zugewinn. |
So verwenden Sie den Rechner
- Geben Sie in das Feld für Stichprobe 1 die Messwerte vor der Behandlung (oder den Basiswert) ein, getrennt durch Kommas.
- Geben Sie die entsprechenden Messwerte nach der Behandlung in das Feld für Stichprobe 2 ein. Beide Stichproben müssen genau gleich viele Werte enthalten.
- Klicken Sie auf Berechnen, um die Differenzen zu bestimmen, zu rangieren und W-Statistik, Z-Wert und p-Wert zu erhalten.
- Ein p-Wert unter 0,05 (rot dargestellt) weist auf einen statistisch signifikanten Unterschied zwischen den beiden Bedingungen hin.
- Mit den Beispielschaltflächen können Sie schnell reale Datensätze laden und den Rechner mit bekannten Ergebnissen überprüfen.
FAQ
Was ist der Unterschied zwischen dem Wilcoxon-Vorzeichen-Rang-Test und dem gepaarten t-Test?
Beide vergleichen gepaarte Messungen, aber der gepaarte t-Test setzt normalverteilte Differenzen voraus. Der Wilcoxon-Vorzeichen-Rang-Test macht diese Annahme nicht und ist deshalb besser für kleine Stichproben, ordinale Daten oder Daten mit deutlichen Ausreißern geeignet. Wenn Normalverteilung gilt, ist der t-Test etwas leistungsstärker.
Was passiert mit Paaren, deren Differenz null ist?
Paare, bei denen Vorher- und Nachher-Wert identisch sind (Differenz = 0), werden aus der Analyse ausgeschlossen. Die effektive Stichprobengröße n für Teststatistik und p-Wert zählt nur die nicht nullen Differenzen. Das ist das in den meisten Statistikbüchern empfohlene Standardverfahren.
Wie werden gebundene Differenzen behandelt?
Wenn mehrere Paare dieselbe absolute Differenz haben, erhalten sie den Mittelwert der Ränge, die sie einnehmen würden. Wenn zum Beispiel drei Paare mit |d| = 5 um die Ränge 4, 5 und 6 konkurrieren, erhält jedes den Rang 5. Diese Mittelrangkorrektur erhält die Gültigkeit der Z-Approximation.
Warum zeigt dieser Rechner nur einen zweiseitigen p-Wert an?
Der zweiseitige Test ist am konservativsten und die Standardwahl in den meisten explorativen Studien. Er prüft, ob die Median-Differenz in irgendeine Richtung von null abweicht. Für gerichtete Hypothesen (z. B. dass eine Behandlung immer verbessert) können Sie den angezeigten zweiseitigen p-Wert halbieren, um den einseitigen p-Wert zu erhalten.
Wie groß muss die Stichprobe sein, damit die Z-Approximation gültig ist?
Im Allgemeinen ist die Normalapproximation für W zuverlässig, wenn n ≥ 10 ist, nachdem Null-Differenzen entfernt wurden. Bei kleineren Stichproben sollten die exakten kritischen Werte aus der Wilcoxon-Tabelle verwendet werden. Dieser Rechner nutzt die Normalapproximation, daher ist bei n < 10 Vorsicht geboten.