Wilcoxon-Vorzeichen-Rangtest-Rechner - Gepaarte Stichproben

Vergleichen Sie zwei verbundene Stichproben oder wiederholte Messungen mit dem nichtparametrischen Wilcoxon-Vorzeichen-Rangtest. Erhalten Sie W-Statistik, Z-Wert und p-Wert ohne Normalverteilungsannahme.

Geben Sie Ihre gepaarten Vorher/Nachher-Messwerte durch Kommas getrennt ein. Beide Stichproben müssen gleich viele Werte enthalten.

Wilcoxon-Vorzeichen-Rangtest-Rechner - Gepaarte Stichproben
Vergleichen Sie zwei verbundene Stichproben oder wiederholte Messungen mit dem nichtparametrischen Wilcoxon-Vorzeichen-Rangtest. Erhalten Sie W-Statistik, Z-Wert und p-Wert ohne Normalverteilungsannahme.

Über den Wilcoxon-Vorzeichen-Rangtest

Der Wilcoxon-Vorzeichen-Rangtest ist ein nichtparametrischer statistischer Hypothesentest zum Vergleich zweier verbundener Stichproben oder wiederholter Messungen innerhalb einer Gruppe. Er ist das nichtparametrische Gegenstück zum gepaarten t-Test und wird eingesetzt, wenn die Annahme der Normalverteilung der Differenzen zwischen den Paaren nicht gerechtfertigt werden kann. Der 1945 von Frank Wilcoxon eingeführte Test ist besonders wertvoll in klinischen Studien und der Verhaltensforschung, in denen dieselben Personen vor und nach einer Intervention gemessen werden. Statt der Rohwerte werden die absoluten Differenzen der gepaarten Beobachtungen rangiert und die Ränge positiver und negativer Unterschiede getrennt aufsummiert. Das Verfahren läuft so ab: Für jedes Paar wird die Differenz d = (after − before) berechnet. Paare mit der Differenz 0 werden ausgeschlossen. Die absoluten Differenzen werden von klein nach groß gerankt; bei Gleichständen wird der mittlere Rang vergeben. Die Rangsummen der positiven Unterschiede sind W⁺, die der negativen Unterschiede W⁻. Die Teststatistik W ist der kleinere Wert von W⁺ und W⁻. Für größere Stichproben (typischerweise n ≥ 10) kann die Verteilung von W durch eine Normalverteilung approximiert werden. Der Z-Wert wird mit dem Mittelwert und der Standardabweichung von W unter der Nullhypothese berechnet. Der Mittelwert ist n(n+1)/4 und die Standardabweichung √[n(n+1)(2n+1)/24], wobei n die Anzahl der nicht-null Unterschiede ist. Die Nullhypothese besagt, dass die Mediandifferenz zwischen den gepaarten Beobachtungen null ist — die Behandlung hat keinen Effekt. Die Alternativhypothese besagt, dass die Mediandifferenz ungleich null ist (zweiseitig) oder positiv bzw. negativ ist (einseitig). Dieser Rechner gibt den zweiseitigen p-Wert aus, was die konservativste Wahl ist. Ein p-Wert unter 0.05 wird üblicherweise als Hinweis darauf interpretiert, dass sich die gepaarten Messungen signifikant unterscheiden. In einer Blutdruckstudie könnte das bedeuten, dass ein Medikament den systolischen Druck signifikant gesenkt hat. In einer psychologischen Studie könnte es zeigen, dass ein Therapieprogramm die Angstwerte signifikant reduziert hat. Der Test setzt gepaarte Beobachtungen voraus — jede Beobachtung in Stichprobe 1 muss einer bestimmten Beobachtung in Stichprobe 2 entsprechen (dieselbe Person zu einem anderen Zeitpunkt oder gematchte Personen). Die Paare müssen voneinander unabhängig sein, und die Differenzen sollten aus einer symmetrischen Verteilung stammen, müssen aber nicht normalverteilt sein. Im Vergleich zum gepaarten t-Test ist der Wilcoxon-Vorzeichen-Rangtest robuster gegenüber Ausreißern und nichtnormalen Verteilungen, aber etwas weniger leistungsstark, wenn die Normalitätsannahme erfüllt ist. Er ist die empfohlene Wahl für kleine Stichproben, ordinale Daten oder wenn extreme Werte vorhanden sind.

Praktische Beispiele

An diesen Beispielen sehen Sie, wie der Rechner mit verschiedenen gepaarten Datensätzen arbeitet.

EingabeAusgabeHinweis
Vorher: 140,135,150,160,130,145,155,138,148,152 — Nachher: 132,130,142,151,125,137,145,130,140,148W=0, Z≈−2.80, p≈0.005Blutdruckmedikament — alle Unterschiede negativ, deutliche Senkung.
Vorher: 8,7,6,9,8,7,8,9 — Nachher: 6,5,5,7,6,6,7,7W=0, Z≈−2.52, p≈0.012Angstwerte nach Therapie — signifikante Verbesserung bei α = 0.05.
Vorher: 75,80,82,79,88,90,76,85,89,92,78,84 — Nachher: 80,85,85,83,90,94,81,88,92,95,81,89W=0, Z≈+3.06, p≈0.002Schülerleistungen vor/nach neuer Lehrmethode — hochsignifikanter Gewinn.

So verwenden Sie den Rechner

  1. Geben Sie die Messwerte vor der Behandlung (oder den Ausgangswert) im Feld für Stichprobe 1 durch Kommas getrennt ein.
  2. Geben Sie die entsprechenden Werte nach der Behandlung im Feld für Stichprobe 2 ein. Beide Stichproben müssen exakt gleich viele Werte enthalten.
  3. Klicken Sie auf Berechnen, um die Differenzen zu berechnen, zu rangieren und die W-Statistik, den Z-Wert und den p-Wert anzuzeigen.
  4. Ein p-Wert unter 0.05 (rot dargestellt) weist auf einen statistisch signifikanten Unterschied zwischen den beiden Bedingungen hin.
  5. Verwenden Sie die Beispiel-Buttons, um schnell reale Datensätze zu laden und den Rechner mit bekannten Ergebnissen zu prüfen.

FAQ

Was ist der Unterschied zwischen dem Wilcoxon-Test und dem gepaarten t-Test?
Beide Tests vergleichen gepaarte Messungen, aber der gepaarte t-Test setzt normalverteilte Differenzen voraus. Der Wilcoxon-Vorzeichen-Rangtest macht diese Annahme nicht und ist daher für kleine Stichproben, ordinale Daten oder Daten mit starken Ausreißern besser geeignet. Wenn Normalität vorliegt, hat der t-Test etwas mehr Teststärke.
Was passiert mit Paaren mit einer Differenz von null?
Paare, bei denen Vorher- und Nachher-Wert identisch sind (Differenz = 0), werden aus der Analyse ausgeschlossen. Die effektive Stichprobengröße n für die Berechnung der Teststatistik und des p-Werts zählt nur die nicht-null Unterschiede. Das ist das in den meisten Statistikbüchern empfohlene Standardverfahren.
Wie werden gebundene Differenzen behandelt?
Wenn mehrere Paare dieselbe absolute Differenz aufweisen, erhalten diese Werte den Mittelwert der Ränge, die sie einnehmen würden. Zum Beispiel erhält jedes von drei Paaren mit |d| = 5, die um die Ränge 4, 5 und 6 konkurrieren, den Rang 5. Diese Midrank-Korrektur erhält die Gültigkeit der Z-Approximation.
Warum gibt dieser Rechner nur einen zweiseitigen p-Wert aus?
Der zweiseitige Test ist am konservativsten und in den meisten explorativen Studien der Standard. Er prüft, ob die Mediandifferenz in beide Richtungen null ist. Für gerichtete Hypothesen (z. B. eine Behandlung verbessert die Ergebnisse immer) können Sie den ausgegebenen zweiseitigen p-Wert halbieren, um den einseitigen p-Wert zu erhalten.
Wie groß muss die Stichprobe für die Z-Approximation sein?
Die Normalapproximation für die W-Statistik ist im Allgemeinen zuverlässig, wenn n ≥ 10 ist (nach Entfernung der Null-Differenzen). Bei kleineren Stichproben sollten die exakten kritischen Werte aus der Wilcoxon-Tabelle verwendet werden. Dieser Rechner nutzt die Normalapproximation, daher ist bei n < 10 Vorsicht geboten.