Σ
SDCalc
FortgeschrittenAnwendungen·9 min

Ausreißer mit der Standardabweichung erkennen

Lernen Sie, wie Sie Ausreißer in Ihren Daten mithilfe der Standardabweichung identifizieren. Meistern Sie die 3-Sigma-Regel, die IQR-Methode und verstehen Sie, wann Ausreißer entfernt werden sollten.

Was sind Ausreißer?

Ausreißer sind Datenpunkte, die sich deutlich von anderen Beobachtungen unterscheiden. Sie können durch Messfehler, Eingabefehler entstehen oder tatsächlich ungewöhnliche Fälle darstellen, die näher untersucht werden sollten.

Der orangefarbene Punkt bei (10, 50) ist ein Ausreißer

Die 3-Sigma-Regel

Bei normalverteilten Daten gelten Punkte, die mehr als 3 Standardabweichungen vom Mittelwert entfernt sind, als Ausreißer. Sie treten rein zufällig in weniger als 0,3 % der Fälle auf.

Ausreißer wenn

x < μ - 3σ OR x > μ + 3σ

Beispiel

Wenn Testergebnisse μ = 75 und σ = 10 haben: - Untere Grenze: 75 - 30 = 45 - Obere Grenze: 75 + 30 = 105 - Jedes Ergebnis unter 45 oder über 105 ist ein Ausreißer

Z-Wert-Methode

Berechnen Sie den Z-Wert für jeden Datenpunkt. Wenn |z| > 3 (oder manchmal 2,5), handelt es sich um einen Ausreißer.

Z-Wert

z = (x - μ) / σ

Schwellenwert-Optionen

- |z| > 3: Konservativ (erkennt weniger Ausreißer) - |z| > 2,5: Moderat - |z| > 2: Liberal (erkennt mehr Ausreißer)

IQR-Methode (Alternative)

Die Interquartilsabstand-Methode (IQR) ist robuster gegenüber Ausreißern, da sie weder Mittelwert noch Standardabweichung verwendet.

1

Schritt 1

Q1 (25. Perzentil) und Q3 (75. Perzentil) bestimmen
2

Schritt 2

IQR = Q3 - Q1 berechnen
3

Schritt 3

Untere Grenze = Q1 - 1,5 × IQR
4

Schritt 4

Obere Grenze = Q3 + 1,5 × IQR
5

Schritt 5

Punkte außerhalb der Grenzen sind Ausreißer

Umgang mit Ausreißern

Nicht automatisch löschen!

Ausreißer sind nicht immer Fehler. Untersuchen Sie vor dem Entfernen: - Liegt ein Eingabe- oder Messfehler vor? - Handelt es sich um einen echten Extremwert? - Stellt er einen wichtigen Grenzfall dar?

Wann entfernen

- Bestätigte Eingabefehler - Fehlfunktion der Messgeräte - Außerhalb des möglichen Wertebereichs

Wann beibehalten

- Spiegelt reale Variabilität wider - Wichtig für Ihre Analyse - Entfernung würde Ergebnisse verzerren