Τι είναι οι Ακραίες Τιμές;
Οι ακραίες τιμές (outliers) είναι σημεία δεδομένων που διαφέρουν σημαντικά από τις υπόλοιπες παρατηρήσεις. Μπορεί να οφείλονται σε σφάλματα μέτρησης, λάθη καταχώρησης δεδομένων ή να αντιπροσωπεύουν πραγματικά ασυνήθιστες περιπτώσεις που αξίζει να διερευνηθούν.
Το πορτοκαλί σημείο στο (10, 50) είναι ακραία τιμή
Ο Κανόνας 3-Σίγμα
Για κανονικά κατανεμημένα δεδομένα, σημεία πέρα από 3 τυπικές αποκλίσεις από τον μέσο θεωρούνται ακραίες τιμές. Εμφανίζονται λιγότερο από 0,3% του χρόνου τυχαία.
Outlier if
x < μ - 3σ OR x > μ + 3σ
Παράδειγμα
Αν οι βαθμολογίες τεστ έχουν μ = 75 και σ = 10:
- Κάτω όριο: 75 - 30 = 45
- Άνω όριο: 75 + 30 = 105
- Οποιαδήποτε βαθμολογία κάτω από 45 ή πάνω από 105 είναι ακραία τιμή
Μέθοδος Z-Score
Υπολογίστε το z-score για κάθε σημείο δεδομένων. Αν |z| > 3 (ή μερικές φορές 2,5), θεωρείται ακραία τιμή.
Επιλογές Κατωφλίου
- |z| > 3: Συντηρητικό (εντοπίζει λιγότερες ακραίες τιμές)
- |z| > 2,5: Μέτριο
- |z| > 2: Φιλελεύθερο (εντοπίζει περισσότερες ακραίες τιμές)
Μέθοδος IQR (Εναλλακτική)
Η μέθοδος Ενδοτεταρτημοριακού Εύρους (IQR) είναι πιο ανθεκτική σε ακραίες τιμές επειδή δεν χρησιμοποιεί τον μέσο ούτε την τυπική απόκλιση.
1
Βήμα 1
Βρείτε Q1 (25ο εκατοστημόριο) και Q3 (75ο εκατοστημόριο)
2
Βήμα 2
Υπολογίστε IQR = Q3 - Q1
3
Βήμα 3
Κάτω φράγμα = Q1 - 1,5 × IQR
4
Βήμα 4
Άνω φράγμα = Q3 + 1,5 × IQR
5
Βήμα 5
Σημεία εκτός φραγμάτων θεωρούνται ακραίες τιμές
Χειρισμός Ακραίων Τιμών
Μην τις Διαγράφετε Αυτόματα!
Οι ακραίες τιμές δεν είναι πάντα σφάλματα. Πριν τις αφαιρέσετε, διερευνήστε:
- Πρόκειται για σφάλμα καταχώρησης ή μέτρησης;
- Είναι πραγματικά ακραία τιμή;
- Αντιπροσωπεύει μια σημαντική ακραία περίπτωση;
Πότε να Αφαιρέσετε
- Επιβεβαιωμένα σφάλματα καταχώρησης
- Δυσλειτουργία εξοπλισμού μέτρησης
- Εκτός του πιθανού εύρους τιμών
Πότε να Διατηρήσετε
- Αντιπροσωπεύει πραγματική μεταβλητότητα
- Σημαντική για την ανάλυσή σας
- Η αφαίρεση θα μεροληπτούσε τα αποτελέσματα