Τι είναι η Διακύμανση;
Η διακύμανση μετρά πόσο διασκορπισμένο είναι ένα σύνολο αριθμών σε σχέση με τη μέση τιμή τους. Είναι ο μέσος όρος των τετραγωνικών διαφορών από τον μέσο — και αποτελεί το θεμέλιο πάνω στο οποίο χτίζεται η τυπική απόκλιση.
Κάθε ράβδος δείχνει την τετραγωνική απόκλιση από τον μέσο. Διακύμανση = μέσος αυτών των ράβδων.
Τύπος Διακύμανσης
Πληθυσμιακή Διακύμανση
σ² = Σ(xᵢ - μ)² / N
Δειγματική Διακύμανση
s² = Σ(xᵢ - x̄)² / (n-1)
1
Υπολογισμός μέσου
Αθροίστε όλες τις τιμές και διαιρέστε με τον αριθμό τους.
2
Εύρεση κάθε απόκλισης
Αφαιρέστε τον μέσο από κάθε σημείο δεδομένων.
3
Ύψωση στο τετράγωνο κάθε απόκλισης
Αυτό εξαλείφει τις αρνητικές τιμές και τονίζει τις μεγάλες αποκλίσεις.
4
Μέσος των τετραγωνικών αποκλίσεων
Διαιρέστε με N (πληθυσμός) ή n-1 (δείγμα).
Γιατί Υψώνουμε τις Αποκλίσεις στο Τετράγωνο;
Τρεις Βασικοί Λόγοι
1. Εξάλειψη αρνητικών: Χωρίς ύψωση στο τετράγωνο, οι θετικές και αρνητικές αποκλίσεις θα αλληλοαναιρούνταν, κάνοντας το άθροισμα μηδέν.
2. Ποινή ακραίων τιμών: Η ύψωση στο τετράγωνο δίνει μεγαλύτερο βάρος σε τιμές μακριά από τον μέσο.
3. Μαθηματικές ιδιότητες: Η διακύμανση έχει χρήσιμες αλγεβρικές ιδιότητες για τη στατιστική συμπερασματολογία.
Παράδειγμα: Γιατί να Μη Χρησιμοποιούμε Απόλυτες Τιμές;
Δεδομένα: 2, 4, 4, 4, 5, 5, 7, 9 (Μέσος = 5)
Μέση Απόλυτη Απόκλιση:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Διακύμανση (τετραγωνική):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Διακύμανση vs Τυπική Απόκλιση
The Relationship
Standard Deviation = √Variance → σ = √σ²
Διακύμανση (σ²)
- Μονάδες σε τετράγωνο (π.χ. cm², €²)
- Δυσκολότερη η άμεση ερμηνεία
- Χρήσιμη για μαθηματικές πράξεις
- Αθροιστική για ανεξάρτητες μεταβλητές
Τυπική Απόκλιση (σ)
- Ίδιες μονάδες με τα αρχικά δεδομένα
- Ευκολότερη η ερμηνεία
- Καλύτερη για επικοινωνία
- Χρησιμοποιείται σε z-scores και διαστήματα εμπιστοσύνης
Εφαρμογές της Διακύμανσης
Ενώ η τυπική απόκλιση αναφέρεται πιο συχνά, η διακύμανση έχει ειδικές χρήσεις:
- ANOVA:Η Ανάλυση Διακύμανσης συγκρίνει μέσους μεταξύ ομάδων
- Θεωρία Χαρτοφυλακίου:Οι διακυμάνσεις αποδόσεων χρησιμοποιούνται στη βελτιστοποίηση
- Παλινδρόμηση:Το R² είναι η εξηγούμενη διακύμανση διαιρεμένη με τη συνολική διακύμανση
- PCA:Η Ανάλυση Κύριων Συνιστωσών μεγιστοποιεί την εξηγούμενη διακύμανση