Q: Was bedeutet der p-Wert eigentlich?

Der p-Wert ist die Wahrscheinlichkeit, unter der Annahme der wahren Nullhypothese eine Teststatistik zu erhalten, die mindestens so extrem ist wie die beobachtete. Er ist nicht die Wahrscheinlichkeit, dass H₀ wahr ist, und auch nicht die Wahrscheinlichkeit, dass Ihr Ergebnis zufällig entstanden ist. Ein p-Wert unter α (üblich 0.05) bedeutet, dass die beobachteten Daten überraschend wären, wenn H₀ wahr wäre, also verwerfen Sie H₀. Ein p-Wert über α bedeutet, dass die Daten mit H₀ vereinbar sind, also verwerfen Sie sie nicht — das beweist aber nicht, dass H₀ korrekt ist.

Q: Wann sollte ich einen einseitigen statt einen zweiseitigen Test verwenden?

Verwenden Sie einen zweiseitigen Test, wenn ein Unterschied in beide Richtungen wissenschaftlich relevant ist und Sie keinen starken Grund für eine bestimmte Richtung haben. Verwenden Sie einen einseitigen Test, wenn Theorie oder Vorwissen die Richtung des Effekts bereits vor der Datenerhebung klar festlegen. Nachträglich auf einen einseitigen Test umzuschalten, um Signifikanz zu erzielen, ist p-Hacking und ungültig. Ein einseitiger Test bei α=0.05 entspricht einem zweiseitigen Test bei α=0.10.

Q: Was ist das Signifikanzniveau α und wie wähle ich es?

Das Signifikanzniveau α ist die maximal akzeptable Wahrscheinlichkeit eines Fehlers 1. Art — also eine wahre Nullhypothese fälschlich zu verwerfen. Der übliche Wert ist 0.05 (5%), aber 0.01 wird verwendet, wenn Fehlalarme besonders teuer sind (medizinische Diagnostik, sicherheitskritische Systeme). In manchen Fachgebieten wird inzwischen empfohlen, exakte p-Werte statt eines festen Schwellenwerts zu berichten und sie mit Konfidenzintervallen und Effektgrößen zu kombinieren.

Q: Was sind Fehler 1. und 2. Art?

Ein Fehler 1. Art (falsch positiv) liegt vor, wenn Sie H₀ verwerfen, obwohl sie wahr ist; seine Wahrscheinlichkeit ist α. Ein Fehler 2. Art (falsch negativ) liegt vor, wenn Sie H₀ nicht verwerfen, obwohl sie falsch ist; seine Wahrscheinlichkeit ist β, und die Teststärke ist 1−β. Eine Senkung von α macht das Verwerfungs-Kriterium strenger, was Fehler 1. Art reduziert, aber Fehler 2. Art erhöht. Eine Erhöhung der Stichprobengröße ist der sauberste Weg, beide gleichzeitig zu verringern.

Q: Kann ich diesen Rechner für Anteilswerte aus Umfragen verwenden?

Ja — der Modus Z-Test für Anteile ist genau dafür gedacht. Geben Sie den hypothesisierten Populationsanteil p₀ (Ihren Basis- oder theoretischen Wert), Ihre Stichprobengröße n und den beobachteten Stichprobenanteil p̂ (Erfolge geteilt durch n) ein. Der Rechner verwendet die Standardformel Z = (p̂ − p₀) / √(p₀(1−p₀)/n). Die Normalapproximation ist zuverlässig, wenn sowohl n·p₀ als auch n·(1−p₀) größer als 5 oder 10 sind.

Question 1

Was ist der Unterschied zwischen einem Z-Test und einem T-Test?

Accepted Answer

Ein Z-Test wird verwendet, wenn die Populations-Standardabweichung σ bekannt ist, wodurch sich exakte p-Werte mit der Standardnormalverteilung berechnen lassen. Ein T-Test wird verwendet, wenn σ unbekannt ist und aus der Stichproben-Standardabweichung s geschätzt werden muss; die resultierende Teststatistik folgt einer t-Verteilung mit n−1 Freiheitsgraden, die zur Berücksichtigung der zusätzlichen Unsicherheit schwerere Tails als die Normalverteilung hat. Mit wachsender Stichprobengröße konvergiert die t-Verteilung gegen die Normalverteilung, daher ist der Unterschied vor allem bei kleinen Stichproben relevant (etwa n < 30).

Question 2

Was bedeutet der p-Wert eigentlich?

Accepted Answer

Der p-Wert ist die Wahrscheinlichkeit, unter der Annahme der wahren Nullhypothese eine Teststatistik zu erhalten, die mindestens so extrem ist wie die beobachtete. Er ist nicht die Wahrscheinlichkeit, dass H₀ wahr ist, und auch nicht die Wahrscheinlichkeit, dass Ihr Ergebnis zufällig entstanden ist. Ein p-Wert unter α (üblich 0.05) bedeutet, dass die beobachteten Daten überraschend wären, wenn H₀ wahr wäre, also verwerfen Sie H₀. Ein p-Wert über α bedeutet, dass die Daten mit H₀ vereinbar sind, also verwerfen Sie sie nicht — das beweist aber nicht, dass H₀ korrekt ist.

Question 3

Wann sollte ich einen einseitigen statt einen zweiseitigen Test verwenden?

Accepted Answer

Verwenden Sie einen zweiseitigen Test, wenn ein Unterschied in beide Richtungen wissenschaftlich relevant ist und Sie keinen starken Grund für eine bestimmte Richtung haben. Verwenden Sie einen einseitigen Test, wenn Theorie oder Vorwissen die Richtung des Effekts bereits vor der Datenerhebung klar festlegen. Nachträglich auf einen einseitigen Test umzuschalten, um Signifikanz zu erzielen, ist p-Hacking und ungültig. Ein einseitiger Test bei α=0.05 entspricht einem zweiseitigen Test bei α=0.10.

Question 4

Was ist das Signifikanzniveau α und wie wähle ich es?

Accepted Answer

Das Signifikanzniveau α ist die maximal akzeptable Wahrscheinlichkeit eines Fehlers 1. Art — also eine wahre Nullhypothese fälschlich zu verwerfen. Der übliche Wert ist 0.05 (5%), aber 0.01 wird verwendet, wenn Fehlalarme besonders teuer sind (medizinische Diagnostik, sicherheitskritische Systeme). In manchen Fachgebieten wird inzwischen empfohlen, exakte p-Werte statt eines festen Schwellenwerts zu berichten und sie mit Konfidenzintervallen und Effektgrößen zu kombinieren.

Question 5

Was sind Fehler 1. und 2. Art?

Accepted Answer

Ein Fehler 1. Art (falsch positiv) liegt vor, wenn Sie H₀ verwerfen, obwohl sie wahr ist; seine Wahrscheinlichkeit ist α. Ein Fehler 2. Art (falsch negativ) liegt vor, wenn Sie H₀ nicht verwerfen, obwohl sie falsch ist; seine Wahrscheinlichkeit ist β, und die Teststärke ist 1−β. Eine Senkung von α macht das Verwerfungs-Kriterium strenger, was Fehler 1. Art reduziert, aber Fehler 2. Art erhöht. Eine Erhöhung der Stichprobengröße ist der sauberste Weg, beide gleichzeitig zu verringern.

Question 6

Kann ich diesen Rechner für Anteilswerte aus Umfragen verwenden?

Accepted Answer

Ja — der Modus Z-Test für Anteile ist genau dafür gedacht. Geben Sie den hypothesisierten Populationsanteil p₀ (Ihren Basis- oder theoretischen Wert), Ihre Stichprobengröße n und den beobachteten Stichprobenanteil p̂ (Erfolge geteilt durch n) ein. Der Rechner verwendet die Standardformel Z = (p̂ − p₀) / √(p₀(1−p₀)/n). Die Normalapproximation ist zuverlässig, wenn sowohl n·p₀ als auch n·(1−p₀) größer als 5 oder 10 sind.

Szenario	Ergebnis	Interpretation
Qualitätskontrolle: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, zweiseitiger Z-Test	Z=2.357, p=0.0184 → H₀ verwerfen	Der mittlere Bolzendurchmesser hat sich signifikant vom 10-mm-Ziel verschoben; der Prozess muss angepasst werden.
Arzneimittelstudie: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, rechtsseitiger T-Test	T=3.651, df=29, p=0.0005 → H₀ verwerfen	Starker Hinweis darauf, dass das Medikament den Blutdruck im Mittel um mehr als 10 mmHg senkt.
A/B-Test: p̂=0.095, p₀=0.08, n=1000, α=0.05, rechtsseitiger Z-Test (Anteil)	Z=1.750, p=0.0401 → H₀ verwerfen	Das neue Button-Design erhöht die Klickrate signifikant über die Basis von 8%.
Kraftstoffeffizienz: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, linksseitiger Z-Test	Z=−3.162, p=0.0008 → H₀ verwerfen	Auf dem 1%-Niveau gibt es Evidenz dafür, dass die Kraftstoffeffizienz des Modells unter den beworbenen 30 mpg liegt.

Hypothesentest-Rechner - Z-, T-Test und p-Wert

Über den Hypothesentest-Rechner

Beispiele für Hypothesentests

So verwenden Sie den Hypothesentest-Rechner

Häufige Fragen zum Hypothesentest