Wat zijn uitschieters?
Uitschieters zijn gegevenspunten die aanzienlijk afwijken van andere waarnemingen. Ze kunnen worden veroorzaakt door meetfouten, invoerfouten of ze vertegenwoordigen werkelijk ongebruikelijke gevallen die nader onderzocht moeten worden.
Het oranje punt op (10, 50) is een uitschieter
De 3-sigmaregel
Voor normaal verdeelde gegevens worden punten buiten 3 standaardafwijkingen van het gemiddelde als uitschieters beschouwd. Ze komen door toeval minder dan 0,3% van de tijd voor.
Uitschieter als
Voorbeeld
Z-scoremethode
Bereken de z-score voor elk gegevenspunt. Als |z| > 3 (of soms 2,5), is het een uitschieter.
Z-score
Drempelwaardeopties
IQR-methode (alternatief)
De interkwartielafstand (IQR)-methode is robuuster tegen uitschieters omdat deze het gemiddelde of de standaardafwijking niet gebruikt.
Stap 1
Stap 2
Stap 3
Stap 4
Stap 5
Omgaan met uitschieters
Niet automatisch verwijderen!