Σ
SDCalc
ΑρχάριοιFundamentals·9 min

Τι είναι η Τυπική Απόκλιση; Ορισμός, Τύπος και Παραδείγματα

Μάθετε τι είναι η τυπική απόκλιση, πώς να την υπολογίσετε για δείγματα και πληθυσμούς, και γιατί είναι ζωτικής σημασίας για την ανάλυση δεδομένων. Κατακτήστε τους τύπους σήμερα.

By Standard Deviation Calculator Team · Data Science Team·Published

Τι είναι η Τυπική Απόκλιση;

Η τυπική απόκλιση είναι ένα στατιστικό μέτρο που ποσοτικοποιεί τη μεταβλητότητα ή τη διασπορά σε ένα σύνολο δεδομένων. Μια χαμηλή τυπική απόκλιση υποδηλώνει ότι τα σημεία δεδομένων τείνουν να βρίσκονται κοντά στη μέση τιμή (αναμενόμενη τιμή) του συνόλου, ενώ μια υψηλή τυπική απόκλιση υποδηλώνει ότι τα σημεία δεδομένων είναι απλωμένα σε ένα ευρύτερο φάσμα τιμών. Παριστάνεται με το ελληνικό γράμμα σ (σίγμα) για τους πληθυσμούς και με το s για τα δείγματα, και αποτελεί μια από τις πιο θεμελιώδεις έννοιες στην περιγραφική στατιστική.

Βασικός Ορισμός

Η τυπική απόκλιση μετρά την τυπική απόσταση κάθε σημείου δεδομένων από τη μέση τιμή. Σας λέει, κατά μέσο όρο, πόσο αποκλίνουν τα δεδομένα σας από το κέντρο.

Τυπική Απόκλιση Πληθυσμού vs. Δείγματος

Πριν υπολογίσετε την τυπική απόκλιση, πρέπει να προσδιορίσετε αν τα δεδομένα σας αντιπροσωπεύουν έναν ολόκληρο πληθυσμό ή ένα δείγμα ενός πληθυσμού. Ένας πληθυσμός περιλαμβάνει όλα τα μέλη μιας καθορισμένης ομάδας, ενώ ένα δείγμα είναι ένα αντιπροσωπευτικό υποσύνολο αυτής της ομάδας. Ο υπολογισμός της τυπικής απόκλισης για ένα δείγμα απαιτεί μια μαθηματική προσαρμογή—χρήση του n - 1 (βαθμοί ελευθερίας, ή df) αντί του N—ώστε το αποτέλεσμα να είναι ένα αμερόληπτο εκτιμητής της διακύμανσης του πληθυσμού.

Τυπική Απόκλιση Πληθυσμού

Χρησιμοποιείται όταν έχετε δεδομένα για ολόκληρη την ομάδα. Συμβολίζεται με σ. Ο παρονομαστής στον τύπο της διακύμανσης είναι N (το συνολικό μέγεθος του πληθυσμού).

Τυπική Απόκλιση Δείγματος

Χρησιμοποιείται όταν έχετε ένα υποσύνολο της ομάδας. Συμβολίζεται με s. Ο παρονομαστής στον τύπο της διακύμανσης είναι n - 1 (μέγεθος δείγματος μείον ένα) για τη διόρθωση της μεροληψίας.

Εξήγηση του Τύπου της Τυπικής Απόκλισης

Οι τύποι της τυπικής απόκλισης βασίζονται στον υπολογισμό της διακύμανσης πρώτα, και έπειτα στην εξαγωγή της τετραγωνικής ρίζας. Αυτό το βήμα της τετραγωνικής ρίζας είναι κρίσιμο, διότι επαναφέρει το μέτρο της διασποράς στις αρχικές μονάδες μέτρησης των δεδομένων. Τα βασικά στοιχεία είναι το xᵢ (κάθε ατομική τιμή), το μ ή (η μέση τιμή πληθυσμού ή δείγματος) και το N ή n (ο συνολικός αριθμός των τιμών).

Τυπική Απόκλιση Πληθυσμού

σ = √[ Σ(xᵢ - μ)² / N ]

Τυπική Απόκλιση Δείγματος

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Παράδειγμα Υπολογισμού Βήμα-Βήμα

Ας υπολογίσουμε την τυπική απόκλιση δείγματος για ένα μικρό σύνολο δεδομένων βαθμολογιών: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Ακολουθώντας τον τύπο βήμα-βήμα, αποκαλύπτεται ο τρόπος με τον οποίο συσσωρεύεται η διακύμανση πριν λάβουμε την τελική τετραγωνική ρίζα.

1

Υπολογισμός της Μέσης Τιμής (x̄)

Προσθέστε όλες τις τιμές και διαιρέστε με το πλήθος τους: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

Αφαίρεση της Μέσης Τιμής και Τετραγωνισμός του Αποτελέσματος

Για κάθε τιμή, βρείτε την τετραγωνική διαφορά: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, κ.ο.κ.
3

Άθροιση των Τετραγωνικών Διαφορών

Προσθέστε όλα τα τετραγωνικά αποτελέσματα: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

Διαίρεση με n - 1 (Βαθμοί Ελευθερίας)

Διαιρέστε το άθροισμα με το μέγεθος του δείγματος μείον ένα: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Αυτή είναι η διακύμανση του δείγματος (σ²).
5

Εξαγωγή της Τετραγωνικής Ρίζας

Βρείτε την τετραγωνική ρίζα της διακύμανσης: √6.4 ≈ 2.53. Η τυπική απόκλιση του δείγματος είναι 2.53.

Υπολογισμός Τυπικής Απόκλισης σε Python

Ο χειροκίνητος υπολογισμός της τυπικής απόκλισης είναι επιρρεπής σε σφάλματα, ειδικά με μεγάλα σύνολα δεδομένων. Στην πράξη, οι στατιστικοί και οι επιστήμονες δεδομένων χρησιμοποιούν γλώσσες προγραμματισμού όπως η Python για να την υπολογίσουν άμεσα, χρησιμοποιώντας ενσωματωμένες βιβλιοθήκες.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Υπολογισμός τυπικής απόκλισης δείγματος (προεπιλογή)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Υπολογισμός τυπικής απόκλισης πληθυσμού
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

Ο Εμπειρικός Κανόνας και η Τυπική Απόκλιση

Όταν τα δεδομένα ακολουθούν μια κανονική κατανομή (καμπύλη σε σχήμα καμπάνας), η τυπική απόκλιση γίνεται εξαιρετικά προβλεπτική. Ο Εμπειρικός Κανόνας, γνωστός και ως κανόνας 68-95-99.7, δηλώνει ότι σχεδόν όλα τα δεδομένα θα εμπίπτουν σε τρεις τυπικές αποκλίσεις από τη μέση τιμή. Αυτό επιτρέπει στους αναλυτές να εντοπίζουν γρήγορα ακραίες τιμές (outliers) και να κατανοούν την πιθανότητα εμφάνισης μιας συγκεκριμένης παρατήρησης.

Διάστημα από τη Μέση ΤιμήΠοσοστό ΔεδομένωνΕφαρμογή
±1σ68.27%Εντοπισμός τυπικών, καθημερινών τιμών
±2σ95.45%Ορισμός διαστημάτων εμπιστοσύνης
±3σ99.73%Ανίχνευση ακραίων τιμών (outliers)

Τυπική Απόκλιση vs. Διακύμανση

Η διακύμανση και η τυπική απόκλιση είναι στενά συνδεδεμένα μέτρα διασποράς. Η Διακύμανση (σ² ή s²) είναι ο μέσος όρος των τετραγωνικών διαφορών από τη μέση τιμή, ενώ η τυπική απόκλιση είναι η τετραγωνική ρίζα της διακύμανσης. Επειδή η διακύμανση εκφράζεται σε τετραγωνισμένες μονάδες (π.χ. τετραγωνικά ευρώ, τετραγωνικά εκατοστά), μπορεί να είναι δύσκολο να ερμηνευθεί στο πλαίσιο των αρχικών δεδομένων. Η τυπική απόκλιση επιλύει αυτό το ζήτημα μετατρέποντας το μέτρο πίσω στις αρχικές μονάδες.

Αναφορά των Δεδομένων σας

Αναφέρετε πάντα την τυπική απόκλιση μαζί με τη μέση τιμή όταν περιγράφετε τα δεδομένα σας. Επειδή η τυπική απόκλιση εκφράζεται στις ίδιες μονάδες με τη μέση τιμή (π.χ. ευρώ, εκατοστά, χιλιόγραμμα), προσφέρει ένα διαισθητικό μέτρο διασποράς που το κοινό σας μπορεί να κατανοήσει άμεσα.

Συνήθη Λάθη που Πρέπει να Αποφύγετε

Αν και η τυπική απόκλιση είναι ένα ισχυρό εργαλείο, συχνά χρησιμοποιείται λανθασμένα. Η εσφαλμένη εφαρμογή των τύπων ή η παρερμηνεία της τιμής μπορεί να οδηγήσει σε ελαττωματική ανάλυση δεδομένων και εσφαλμένα συμπεράσματα.

  • Χρήση του τύπου πληθυσμού για δείγμα: Η παράλειψη χρήσης του n - 1 για δείγματα μειώνει τεχνητά την υπολογιζόμενη διασπορά, υποτιμώντας την πραγματική διακύμανση του πληθυσμού.
  • Εφαρμογή τυπικής απόκλισης σε μη κανονικές κατανομές: Ο Εμπειρικός Κανόνας ισχύει μόνο για κανονικές κατανομές. Για έντονα ασύμμετρα δεδομένα, η τυπική απόκλιση μπορεί να μην αντικατοπτρίζει ακριβώς τη διασπορά.
  • Σύγχυση Τυπικής Απόκλισης με Τυπικό Σφάλμα: Το τυπικό σφάλμα (Standard Error) μετρά την ακρίβεια της εκτίμησης της μέσης τιμής του δείγματος, ενώ η τυπική απόκλιση μετρά τη διασπορά των ίδιων των υποκείμενων δεδομένων.

Προσοχή στα Ακραία Σημεία (Outliers)

Η τυπική απόκλιση είναι εξαιρετικά ευαίσθητη στα ακραία σημεία (outliers). Επειδή ο τύπος υψώνει στο τετράγωνο τις διαφορές από τη μέση τιμή, ένα μεμονωμένο τεράστιο outlier μπορεί να διογκώσει υπερβολικά την τυπική απόκλιση, κάνοντας τα δεδομένα να φαίνονται πιο μεταβλητά από ό,τι είναι στην πραγματικότητα.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipedia: Τυπική Απόκλιση
  2. NIST/SEMATECH e-Εγχειρίδιο Στατιστικών Μεθόδων
  3. Khan Academy: Στατιστική και Πιθανότητες