Oberer und unterer Zaun Rechner - IQR-Ausreißer

Erkennen Sie statistische Ausreißer in Ihrem Datensatz mit der Zaunmethode des Interquartilsabstands (IQR). Geben Sie kommagetrennte Zahlen ein, um Q1, Q3, IQR und beide Zäune sofort zu ermitteln.

Geben Sie Ihre Datenwerte durch Kommas getrennt ein, klicken Sie auf Berechnen und sehen Sie den oberen Zaun, den unteren Zaun und alle Ausreißer in Ihrem Datensatz.

Oberer und unterer Zaun Rechner - IQR-Ausreißer
Erkennen Sie statistische Ausreißer in Ihrem Datensatz mit der Zaunmethode des Interquartilsabstands (IQR). Geben Sie kommagetrennte Zahlen ein, um Q1, Q3, IQR und beide Zäune sofort zu ermitteln.

Über den Rechner für oberen und unteren Zaun

Die Methode des oberen und unteren Zauns ist die Standardtechnik, um Ausreißer in einem Datensatz mithilfe des Interquartilsabstands (IQR) zu identifizieren. Sie wurde 1977 als Teil von John Tukeys Rahmenwerk zur explorativen Datenanalyse entwickelt und bietet eine robuste, nichtparametrische Möglichkeit, ungewöhnliche Beobachtungen zu kennzeichnen, ohne anzunehmen, dass die Daten einer bestimmten Verteilung folgen. Die Methode wird in Einführungskursen zur Statistik breit gelehrt und ist der Standardansatz zur Ausreißererkennung in Boxplots. Die Berechnung beginnt damit, den Datensatz zu sortieren und das erste und dritte Quartil zu bestimmen. Q1 (25. Perzentil) ist der Wert, unter dem 25% der Daten liegen, während Q3 (75. Perzentil) der Wert ist, unter dem 75% liegen. Der IQR ist einfach Q3 minus Q1 und beschreibt die Streuung der mittleren Hälfte der Daten. Da der IQR die Extremwerte an beiden Enden der Verteilung ignoriert, ist er gegenüber genau den Ausreißern robust, die er erkennen soll. Diese Eigenschaft macht die Zaunmethode zuverlässiger als spannweitenbasierte Methoden. Sobald der IQR berechnet ist, werden die Zäune bei 1.5 × IQR unter Q1 (unterer Zaun) und 1.5 × IQR über Q3 (oberer Zaun) gesetzt. Jeder Datenpunkt unterhalb des unteren Zauns oder oberhalb des oberen Zauns wird als Ausreißer klassifiziert. Der Multiplikator 1.5 wurde von Tukey empirisch gewählt, weil er für annähernd normalverteilte Daten gut funktioniert: In einer Normalverteilung markiert diese Regel etwa 0.7% der Beobachtungen als Ausreißer, was Werten entspricht, die mehr als etwa 2.7 Standardabweichungen vom Mittelwert entfernt sind. Für extremere Ausreißer verwenden manche Anwendungen einen Multiplikator von 3 statt 1.5 und bezeichnen solche Punkte als entfernte oder extreme Ausreißer. Punkte außerhalb des 1.5 × IQR-Zauns, aber innerhalb des 3 × IQR-Zauns, werden manchmal milde Ausreißer genannt. Dieser Rechner verwendet die Standardregel 1.5 × IQR, die für die meisten explorativen Analysen geeignet ist. Die Ausreißererkennung ist ein entscheidender Schritt bei Datenbereinigung, Qualitätskontrolle und statistischer Modellierung. In der Fertigung kann ein Prozessmesswert außerhalb des Zauns auf ein fehlerhaftes Teil oder einen Messfehler hinweisen. In der Finanzwelt können extreme Renditen Datenfehler, Marktanomalien oder echte Ereignisse signalisieren, die untersucht werden müssen. In der klinischen Forschung werden physiologisch unmögliche Werte identifiziert und überprüft. Im maschinellen Lernen können Ausreißer das Modelltraining verzerren, wenn sie nicht behandelt werden. Es ist wichtig zu bedenken, dass statistische Ausreißer nicht zwangsläufig fehlerhafte Werte sind. Ein Ausreißer ist lediglich eine Beobachtung, die nach der IQR-Regel ungewöhnlich weit vom Großteil der Daten entfernt ist. Es ist eine Untersuchung erforderlich, um festzustellen, ob der Wert ein echtes Extremereignis, einen Messfehler oder einen Dateneingabefehler darstellt.

Beispiele für oberen und unteren Zaun

Schrittweise durchgerechnete Beispiele zeigen, wie die Zaunmethode Ausreißer in typischen Datensätzen erkennt.

DatensatzZäune und AusreißerInterpretation
10, 12, 14, 16, 18, 20, 100Unterer: 4 | Oberer: 28 | Ausreißer: 100Q1=13, Q3=19, IQR=6. Unterer Zaun = 13 − 9 = 4. Oberer Zaun = 19 + 9 = 28. Der Wert 100 überschreitet den oberen Zaun und wird als Ausreißer markiert.
5, 7, 8, 9, 10, 11, 12, 14Unterer: 2.5 | Oberer: 16.5 | Keine AusreißerQ1=7.75, Q3=11.25, IQR=3.5. Die Zäune liegen bei 2.5 und 16.5. Alle Werte (5 bis 14) liegen innerhalb der Zäune, daher gibt es keine Ausreißer.
2, 3, 5, 7, 8, 9, 10, 11, 12, 50Unterer: −2.375 | Oberer: 18.625 | Ausreißer: 50Q1=5.5, Q3=10.75, IQR=5.25. Oberer Zaun = 10.75 + 7.875 = 18.625. Der Wert 50 liegt deutlich über dem oberen Zaun und ist ein klarer Ausreißer.

So verwenden Sie den Zaunrechner

  1. Geben Sie Ihre Datenwerte in das Eingabefeld ein, getrennt durch Kommas oder Leerzeichen. Sie benötigen mindestens 4 Werte, um sinnvolle Quartile zu berechnen.
  2. Klicken Sie auf Berechnen, um Q1, Q3, den IQR, den unteren Zaun (Q1 − 1.5 × IQR) und den oberen Zaun (Q3 + 1.5 × IQR) zu ermitteln.
  3. Prüfen Sie die hervorgehobenen Zaunwerte: Jeder Datenpunkt unter dem unteren Zaun oder über dem oberen Zaun ist ein Ausreißer.
  4. Sehen Sie im Abschnitt Ausreißer nach, welche konkreten markierten Werte ausdrücklich aufgelistet sind.
  5. Klicken Sie auf Zurücksetzen, um die Eingabe zu löschen und mit einem neuen Datensatz neu zu beginnen.

FAQ zum oberen und unteren Zaun

Was sind der obere und der untere Zaun?
Der obere Zaun ist Q3 + 1.5 × IQR und der untere Zaun ist Q1 − 1.5 × IQR. Jeder Datenpunkt außerhalb dieser Zäune gilt als Ausreißer. Die Zäune bilden einen Bereich, der die erwartete Streuung einer ungefähr glockenförmigen Verteilung einschließt.
Warum das 1.5-Fache des IQR verwenden?
Der Multiplikator 1.5 wurde von John Tukey gewählt, weil er für die Erkennung von Ausreißern in normalen Daten annähernd optimal ist und zugleich die Falsch-positiv-Rate niedrig hält. In einer Normalverteilung markiert er etwa 0.7% der Beobachtungen. Wird der Multiplikator auf 3 verdoppelt, werden nur extreme Ausreißer erfasst.
Was ist der IQR und wie wird er berechnet?
Der IQR (Interquartilsabstand) ist Q3 minus Q1 und beschreibt die Streuung der mittleren 50% der Daten. Er wird berechnet, indem die Daten sortiert, das 25. Perzentil (Q1) und das 75. Perzentil (Q3) bestimmt und anschließend subtrahiert werden. Der IQR ist robust gegenüber Ausreißern, weil er die oberen und unteren 25% der Werte ignoriert.
Bedeutet ein Ausreißer, dass die Daten falsch sind?
Nicht unbedingt. Ein Ausreißer ist lediglich eine ungewöhnlich extreme Beobachtung im Verhältnis zum Großteil der Daten. Er kann ein echtes Extremereignis, ein Messfehler oder ein Dateneingabefehler sein. Jeder markierte Wert sollte im Kontext untersucht werden, bevor er entfernt oder korrigiert wird.
Wie hängen die Zäune mit Boxplots zusammen?
Der obere und der untere Zaun definieren die Whisker in einem Standard-Boxplot nach Tukey. Die Box umfasst den IQR (Q1 bis Q3), die Linie in der Box ist der Median, und die Whisker reichen bis zu den extremsten Datenpunkten, die noch innerhalb der Zäune liegen. Punkte außerhalb der Whisker werden einzeln als Ausreißerpunkte dargestellt.
Ist die Zaunmethode für kleine Datensätze geeignet?
Die Methode funktioniert am besten mit mindestens 10 bis 20 Beobachtungen. Bei weniger Werten sind Quartilsschätzungen ungenau und die Zäune können unzuverlässig sein. Bei sehr kleinen Datensätzen sollten Sie alle Werte visuell prüfen, statt sich allein auf die automatische Zaunregel zu verlassen.