Qu’est-ce qu’une valeur aberrante ?
Les valeurs aberrantes sont des points de données qui diffèrent significativement des autres observations. Elles peuvent être causées par des erreurs de mesure, des erreurs de saisie, ou représenter des cas authentiquement inhabituels méritant d’être examinés.
Le point orange en (10, 50) est une valeur aberrante
La règle des 3 sigmas
Pour des données suivant une distribution normale, les points situés au-delà de 3 écarts types de la moyenne sont considérés comme aberrants. Ils surviennent moins de 0,3 % du temps par hasard.
Aberrant si
Exemple
Méthode du score Z
Calculez le score Z de chaque observation. Si |z| > 3 (ou parfois 2,5), c’est une valeur aberrante.
Score Z
Options de seuil
Méthode de l’IQR (alternative)
La méthode de l’écart interquartile (IQR) est plus robuste face aux valeurs aberrantes car elle n’utilise ni la moyenne ni l’écart type.
Étape 1
Étape 2
Étape 3
Étape 4
Étape 5
Traitement des valeurs aberrantes
Ne supprimez pas automatiquement !