Σ
SDCalc
GemiddeldToepassingen·9 min

Uitschieters detecteren met standaardafwijking

Leer hoe u uitschieters in uw gegevens identificeert met standaardafwijking. Beheers de 3-sigmaregel, IQR-methode en begrijp wanneer uitschieters verwijderd moeten worden.

Wat zijn uitschieters?

Uitschieters zijn gegevenspunten die aanzienlijk afwijken van andere waarnemingen. Ze kunnen worden veroorzaakt door meetfouten, invoerfouten of ze vertegenwoordigen werkelijk ongebruikelijke gevallen die nader onderzocht moeten worden.

Het oranje punt op (10, 50) is een uitschieter

De 3-sigmaregel

Voor normaal verdeelde gegevens worden punten buiten 3 standaardafwijkingen van het gemiddelde als uitschieters beschouwd. Ze komen door toeval minder dan 0,3% van de tijd voor.

Uitschieter als

x < μ - 3σ OF x > μ + 3σ

Voorbeeld

Als toetsscores μ = 75 en σ = 10 hebben: - Ondergrens: 75 - 30 = 45 - Bovengrens: 75 + 30 = 105 - Elke score onder 45 of boven 105 is een uitschieter

Z-scoremethode

Bereken de z-score voor elk gegevenspunt. Als |z| > 3 (of soms 2,5), is het een uitschieter.

Z-score

z = (x - μ) / σ

Drempelwaardeopties

- |z| > 3: Conservatief (vangt minder uitschieters) - |z| > 2,5: Gematigd - |z| > 2: Liberaal (vangt meer uitschieters)

IQR-methode (alternatief)

De interkwartielafstand (IQR)-methode is robuuster tegen uitschieters omdat deze het gemiddelde of de standaardafwijking niet gebruikt.

1

Stap 1

Bepaal Q1 (25e percentiel) en Q3 (75e percentiel)
2

Stap 2

Bereken IQR = Q3 - Q1
3

Stap 3

Ondergrens = Q1 - 1,5 × IQR
4

Stap 4

Bovengrens = Q3 + 1,5 × IQR
5

Stap 5

Punten buiten de grenzen zijn uitschieters

Omgaan met uitschieters

Niet automatisch verwijderen!

Uitschieters zijn niet altijd fouten. Onderzoek voordat u ze verwijdert: - Is het een invoer- of meetfout? - Is het een werkelijk extreme waarde? - Vertegenwoordigt het een belangrijk randgeval?

Wanneer verwijderen

- Bevestigde invoerfouten - Storing van meetapparatuur - Buiten het mogelijke waardenbereik

Wanneer behouden

- Vertegenwoordigt werkelijke variabiliteit - Belangrijk voor uw analyse - Verwijderen zou resultaten vertekenen