Τι είναι οι Ακραίες Τιμές;
Οι ακραίες τιμές (outliers) είναι σημεία δεδομένων που διαφέρουν σημαντικά από τις υπόλοιπες παρατηρήσεις. Μπορεί να οφείλονται σε σφάλματα μέτρησης, λάθη καταχώρησης δεδομένων ή να αντιπροσωπεύουν πραγματικά ασυνήθιστες περιπτώσεις που αξίζει να διερευνηθούν.
Το πορτοκαλί σημείο στο (10, 50) είναι ακραία τιμή
Ο Κανόνας 3-Σίγμα
Για κανονικά κατανεμημένα δεδομένα, σημεία πέρα από 3 τυπικές αποκλίσεις από τον μέσο θεωρούνται ακραίες τιμές. Εμφανίζονται λιγότερο από 0,3% του χρόνου τυχαία.
Outlier if
Παράδειγμα
Μέθοδος Z-Score
Υπολογίστε το z-score για κάθε σημείο δεδομένων. Αν |z| > 3 (ή μερικές φορές 2,5), θεωρείται ακραία τιμή.
Z-Score
Επιλογές Κατωφλίου
Μέθοδος IQR (Εναλλακτική)
Η μέθοδος Ενδοτεταρτημοριακού Εύρους (IQR) είναι πιο ανθεκτική σε ακραίες τιμές επειδή δεν χρησιμοποιεί τον μέσο ούτε την τυπική απόκλιση.
Βήμα 1
Βήμα 2
Βήμα 3
Βήμα 4
Βήμα 5
Χειρισμός Ακραίων Τιμών
Μην τις Διαγράφετε Αυτόματα!