Hypothesentest-Rechner - Z-, T-Test und p-Wert
Führen Sie Z- und T-Tests für Mittelwerte und Anteilswerte durch. Geben Sie Ihre Stichprobendaten ein, um in Sekunden Teststatistik, p-Wert und kritischen Wert zu berechnen.
Wählen Sie den Testtyp und die Alternativhypothese, geben Sie Ihre Daten ein und klicken Sie auf Berechnen, um festzustellen, ob die Nullhypothese verworfen werden soll.
Hypothesentest-Rechner - Z-, T-Test und p-Wert
Führen Sie Z- und T-Tests für Mittelwerte und Anteilswerte durch. Geben Sie Ihre Stichprobendaten ein, um in Sekunden Teststatistik, p-Wert und kritischen Wert zu berechnen.
Über den Hypothesentest-Rechner
Der Hypothesentest ist das Rückgrat der inferentiellen Statistik. Er bietet einen fundierten, probabilistischen Rahmen, um zu entscheiden, ob die gesammelten Daten mit einer theoretischen Behauptung — der Nullhypothese — vereinbar sind oder ob die Evidenz stark genug ist, diese Behauptung zugunsten einer Alternative zu verwerfen. Jedes Experiment in Medizin, Psychologie, Wirtschaft, technischer Qualitätskontrolle und A/B-Testing von Webseiten läuft am Ende auf irgendeine Form des Hypothesentests hinaus.
Die Nullhypothese (H₀) ist die Standardannahme: Es ist nichts passiert, die Behandlung hat keinen Effekt, der Prozess liegt im Soll oder die Anteile haben sich nicht geändert. Die Alternativhypothese (H₁) ist das, was Sie erkennen möchten: Der Mittelwert hat sich verschoben, der Anteil hat sich geändert oder eine Behandlung ist besser als eine andere. Das Signifikanzniveau α — üblicherweise 0.05 oder 0.01 — ist die Wahrscheinlichkeit, H₀ fälschlich zu verwerfen, obwohl sie tatsächlich wahr ist (Fehler 1. Art). Ist der vom Test zurückgegebene p-Wert kleiner als α, verwerfen Sie H₀.
Der Z-Test für Mittelwerte ist geeignet, wenn die Populations-Standardabweichung σ bekannt ist und entweder die Stichprobe groß ist (n ≥ 30) oder die Population normalverteilt ist. Die Teststatistik lautet Z = (x̄ − μ₀) / (σ / √n). Da σ bekannt ist, folgt die Statistik exakt der Standardnormalverteilung, und der p-Wert wird aus der Normalverteilung abgelesen. Der T-Test für Mittelwerte wird verwendet, wenn σ unbekannt ist, was in den meisten realen Studien die realistische Situation ist. Dann wird die Stichproben-Standardabweichung s verwendet, und die Teststatistik T = (x̄ − μ₀) / (s / √n) folgt einer t-Verteilung mit df = n − 1 Freiheitsgraden. Bei kleinen Stichproben hat die t-Verteilung schwerere Tails als die Normalverteilung, wodurch es schwieriger wird, Signifikanz zu erreichen — eine sinnvolle Strafe für die zusätzliche Unsicherheit über σ.
Der Z-Test für Anteile prüft, ob ein beobachteter Stichprobenanteil p̂ mit einem angenommenen Populationsanteil p₀ vereinbar ist. Der Standardfehler ist √(p₀(1 − p₀) / n), und die Teststatistik lautet Z = (p̂ − p₀) / SE. Dieser Test wird häufig in A/B-Tests, primären Endpunkten klinischer Studien und Qualitätsregelkarten für Ausschussanteile verwendet.
Bei einem zweiseitigen Test verwerfen Sie H₀, wenn |Statistik| > kritischer Wert, womit Abweichungen in beide Richtungen erfasst werden. Bei einem einseitigen Test (links oder rechts) legen Sie die Richtung im Voraus fest; das erhöht die Power, eine Verschiebung in dieser Richtung zu erkennen, kann aber eine unerwartete Verschiebung in die andere Richtung nicht markieren. Der angezeigte kritische Wert ist die rechte Grenzmarke; bei einem linksseitigen Test ist die relevante Grenze ihr Negativwert.
Der p-Wert ist die Wahrscheinlichkeit, unter der Annahme, dass H₀ wahr ist, eine Teststatistik zu beobachten, die mindestens so extrem ist wie die berechnete. Ein p-Wert von 0.03 bedeutet nicht, dass die Nullhypothese mit 3% Wahrscheinlichkeit wahr ist; er bedeutet, dass man bei wahrer H₀ nur mit 3% Wahrscheinlichkeit durch zufällige Stichproben derart extreme oder extremere Daten sehen würde. Statistische Signifikanz ist nicht dasselbe wie praktische Signifikanz: Ein kleiner Effekt kann bei großem n hochsignifikant sein, während ein großer Effekt bei kleinem n die Signifikanz verfehlen kann. Kombinieren Sie den p-Wert immer mit Effektgröße und Konfidenzintervall.
Beispiele für Hypothesentests
Praxisnahe Szenarien, die jeden Testtyp und jede Tails-Richtung illustrieren.
| Szenario | Ergebnis | Interpretation |
|---|---|---|
| Qualitätskontrolle: x̄=10.01mm, μ₀=10mm, σ=0.03, n=50, α=0.05, zweiseitiger Z-Test | Z=2.357, p=0.0184 → H₀ verwerfen | Der mittlere Bolzendurchmesser hat sich signifikant vom 10-mm-Ziel verschoben; der Prozess muss angepasst werden. |
| Arzneimittelstudie: x̄=12 mmHg, μ₀=10, s=3, n=30, α=0.05, rechtsseitiger T-Test | T=3.651, df=29, p=0.0005 → H₀ verwerfen | Starker Hinweis darauf, dass das Medikament den Blutdruck im Mittel um mehr als 10 mmHg senkt. |
| A/B-Test: p̂=0.095, p₀=0.08, n=1000, α=0.05, rechtsseitiger Z-Test (Anteil) | Z=1.750, p=0.0401 → H₀ verwerfen | Das neue Button-Design erhöht die Klickrate signifikant über die Basis von 8%. |
| Kraftstoffeffizienz: x̄=29 mpg, μ₀=30, σ=2, n=40, α=0.01, linksseitiger Z-Test | Z=−3.162, p=0.0008 → H₀ verwerfen | Auf dem 1%-Niveau gibt es Evidenz dafür, dass die Kraftstoffeffizienz des Modells unter den beworbenen 30 mpg liegt. |
So verwenden Sie den Hypothesentest-Rechner
- Wählen Sie den Testtyp: Z-Test (Mittelwert), wenn σ bekannt ist; T-Test (Mittelwert), wenn σ unbekannt ist und Sie eine Stichproben-Standardabweichung haben; oder Z-Test (Anteil) für kategoriale Ergebnisse.
- Wählen Sie die Richtung der Alternativhypothese — zweiseitig, um jede Änderung zu erkennen, linksseitig für eine Abnahme oder rechtsseitig für eine Zunahme.
- Geben Sie den Wert der Nullhypothese ein (μ₀ für Mittelwerttests oder p₀ für Anteilstests), Ihr gewähltes Signifikanzniveau α (typischerweise 0.05) und die Stichprobengröße n.
- Füllen Sie das verbleibende Feld aus: Stichprobenmittelwert x̄ und Populations-Standardabweichung σ für Z-Test (Mittelwert); Stichprobenmittelwert x̄ und Stichproben-Standardabweichung s für T-Test; oder Stichprobenanteil p̂ für Z-Test (Anteil).
- Klicken Sie auf Berechnen. Das Tool zeigt die Teststatistik, die Freiheitsgrade (nur T-Test), den p-Wert, den kritischen Wert und die Entscheidung Verwerfen/Nicht verwerfen an.
Häufige Fragen zum Hypothesentest
Was ist der Unterschied zwischen einem Z-Test und einem T-Test?
Ein Z-Test wird verwendet, wenn die Populations-Standardabweichung σ bekannt ist, wodurch sich exakte p-Werte mit der Standardnormalverteilung berechnen lassen. Ein T-Test wird verwendet, wenn σ unbekannt ist und aus der Stichproben-Standardabweichung s geschätzt werden muss; die resultierende Teststatistik folgt einer t-Verteilung mit n−1 Freiheitsgraden, die zur Berücksichtigung der zusätzlichen Unsicherheit schwerere Tails als die Normalverteilung hat. Mit wachsender Stichprobengröße konvergiert die t-Verteilung gegen die Normalverteilung, daher ist der Unterschied vor allem bei kleinen Stichproben relevant (etwa n < 30).
Was bedeutet der p-Wert eigentlich?
Der p-Wert ist die Wahrscheinlichkeit, unter der Annahme der wahren Nullhypothese eine Teststatistik zu erhalten, die mindestens so extrem ist wie die beobachtete. Er ist nicht die Wahrscheinlichkeit, dass H₀ wahr ist, und auch nicht die Wahrscheinlichkeit, dass Ihr Ergebnis zufällig entstanden ist. Ein p-Wert unter α (üblich 0.05) bedeutet, dass die beobachteten Daten überraschend wären, wenn H₀ wahr wäre, also verwerfen Sie H₀. Ein p-Wert über α bedeutet, dass die Daten mit H₀ vereinbar sind, also verwerfen Sie sie nicht — das beweist aber nicht, dass H₀ korrekt ist.
Wann sollte ich einen einseitigen statt einen zweiseitigen Test verwenden?
Verwenden Sie einen zweiseitigen Test, wenn ein Unterschied in beide Richtungen wissenschaftlich relevant ist und Sie keinen starken Grund für eine bestimmte Richtung haben. Verwenden Sie einen einseitigen Test, wenn Theorie oder Vorwissen die Richtung des Effekts bereits vor der Datenerhebung klar festlegen. Nachträglich auf einen einseitigen Test umzuschalten, um Signifikanz zu erzielen, ist p-Hacking und ungültig. Ein einseitiger Test bei α=0.05 entspricht einem zweiseitigen Test bei α=0.10.
Was ist das Signifikanzniveau α und wie wähle ich es?
Das Signifikanzniveau α ist die maximal akzeptable Wahrscheinlichkeit eines Fehlers 1. Art — also eine wahre Nullhypothese fälschlich zu verwerfen. Der übliche Wert ist 0.05 (5%), aber 0.01 wird verwendet, wenn Fehlalarme besonders teuer sind (medizinische Diagnostik, sicherheitskritische Systeme). In manchen Fachgebieten wird inzwischen empfohlen, exakte p-Werte statt eines festen Schwellenwerts zu berichten und sie mit Konfidenzintervallen und Effektgrößen zu kombinieren.
Was sind Fehler 1. und 2. Art?
Ein Fehler 1. Art (falsch positiv) liegt vor, wenn Sie H₀ verwerfen, obwohl sie wahr ist; seine Wahrscheinlichkeit ist α. Ein Fehler 2. Art (falsch negativ) liegt vor, wenn Sie H₀ nicht verwerfen, obwohl sie falsch ist; seine Wahrscheinlichkeit ist β, und die Teststärke ist 1−β. Eine Senkung von α macht das Verwerfungs-Kriterium strenger, was Fehler 1. Art reduziert, aber Fehler 2. Art erhöht. Eine Erhöhung der Stichprobengröße ist der sauberste Weg, beide gleichzeitig zu verringern.
Kann ich diesen Rechner für Anteilswerte aus Umfragen verwenden?
Ja — der Modus Z-Test für Anteile ist genau dafür gedacht. Geben Sie den hypothesisierten Populationsanteil p₀ (Ihren Basis- oder theoretischen Wert), Ihre Stichprobengröße n und den beobachteten Stichprobenanteil p̂ (Erfolge geteilt durch n) ein. Der Rechner verwendet die Standardformel Z = (p̂ − p₀) / √(p₀(1−p₀)/n). Die Normalapproximation ist zuverlässig, wenn sowohl n·p₀ als auch n·(1−p₀) größer als 5 oder 10 sind.