Was sind Ausreißer?
Ausreißer sind Datenpunkte, die sich deutlich von anderen Beobachtungen unterscheiden. Sie können durch Messfehler, Eingabefehler entstehen oder tatsächlich ungewöhnliche Fälle darstellen, die näher untersucht werden sollten.
Der orangefarbene Punkt bei (10, 50) ist ein Ausreißer
Die 3-Sigma-Regel
Bei normalverteilten Daten gelten Punkte, die mehr als 3 Standardabweichungen vom Mittelwert entfernt sind, als Ausreißer. Sie treten rein zufällig in weniger als 0,3 % der Fälle auf.
Ausreißer wenn
Beispiel
Z-Wert-Methode
Berechnen Sie den Z-Wert für jeden Datenpunkt. Wenn |z| > 3 (oder manchmal 2,5), handelt es sich um einen Ausreißer.
Z-Wert
Schwellenwert-Optionen
IQR-Methode (Alternative)
Die Interquartilsabstand-Methode (IQR) ist robuster gegenüber Ausreißern, da sie weder Mittelwert noch Standardabweichung verwendet.
Schritt 1
Schritt 2
Schritt 3
Schritt 4
Schritt 5
Umgang mit Ausreißern
Nicht automatisch löschen!