Τυπική Απόκλιση (σ / s)
Μέτρο της ποσότητας μεταβολής ή διασποράς σε ένα σύνολο τιμών. Είναι η τετραγωνική ρίζα της διακύμανσης και εκφράζεται στις ίδιες μονάδες με τα δεδομένα.
Βασικοί στατιστικοί όροι και ορισμοί
Μέτρο της ποσότητας μεταβολής ή διασποράς σε ένα σύνολο τιμών. Είναι η τετραγωνική ρίζα της διακύμανσης και εκφράζεται στις ίδιες μονάδες με τα δεδομένα.
Ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο. Η διακύμανση ποσοτικοποιεί τον βαθμό διασποράς σε ένα σύνολο δεδομένων και είναι το τετράγωνο της τυπικής απόκλισης.
Ο αριθμητικός μέσος ενός συνόλου τιμών, που υπολογίζεται αθροίζοντας όλες τις τιμές και διαιρώντας με τον αριθμό τους. Αντιπροσωπεύει την κεντρική τάση των δεδομένων.
Η μεσαία τιμή σε ένα ταξινομημένο σύνολο δεδομένων. Αν υπάρχει ζυγός αριθμός τιμών, η διάμεσος είναι ο μέσος όρος των δύο μεσαίων τιμών. Είναι ανθεκτική στις ακραίες τιμές.
Η τιμή που εμφανίζεται πιο συχνά σε ένα σύνολο δεδομένων. Ένα σύνολο δεδομένων μπορεί να έχει μία επικρατούσα τιμή (μονοκόρυφο), πολλές (πολυκόρυφο) ή καμία.
Η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής σε ένα σύνολο δεδομένων. Αν και απλό στον υπολογισμό, λαμβάνει υπόψη μόνο τις δύο ακραίες τιμές και είναι ευαίσθητο σε ακραίες τιμές.
Το πλήρες σύνολο όλων των ατόμων ή παρατηρήσεων ενδιαφέροντος σε μια μελέτη. Οι παράμετροι πληθυσμού συμβολίζονται τυπικά με ελληνικά γράμματα (μ, σ).
Ένα υποσύνολο ενός πληθυσμού που επιλέγεται για ανάλυση. Οι δειγματικές στατιστικές συμβολίζονται τυπικά με λατινικά γράμματα (x̄, s) και χρησιμοποιούνται για την εκτίμηση παραμέτρων πληθυσμού.
Η χρήση n−1 αντί n στον παρονομαστή κατά τον υπολογισμό της δειγματικής διακύμανσης. Αυτή η διόρθωση παρέχει μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού από ένα δείγμα.
Μια συμμετρική κατανομή πιθανότητας σε σχήμα καμπάνας όπου ο μέσος, η διάμεσος και η επικρατούσα τιμή είναι όλα ίσα. Πολλά φυσικά φαινόμενα ακολουθούν περίπου κανονική κατανομή.
Για κανονικά κατανεμημένα δεδομένα, περίπου 68% των τιμών βρίσκεται εντός ±1σ, 95% εντός ±2σ και 99,7% εντός ±3σ από τον μέσο όρο.
Ο αριθμός τυπικών αποκλίσεων που απέχει ένα σημείο δεδομένων από τον μέσο, υπολογιζόμενο ως Z = (X − μ) / σ. Τα z-scores επιτρέπουν τη σύγκριση τιμών από διαφορετικές κατανομές.
Η τυπική απόκλιση της δειγματικής κατανομής μιας στατιστικής, πιο συχνά του μέσου. SE = σ/√n, μειώνεται καθώς αυξάνεται το μέγεθος του δείγματος.
Ένα εύρος τιμών που πιθανώς περιέχει την πραγματική παράμετρο του πληθυσμού με ένα καθορισμένο επίπεδο εμπιστοσύνης (π.χ. 95%). Ευρύτερα διαστήματα υποδεικνύουν μικρότερη ακρίβεια.
Ένα σημείο δεδομένων που διαφέρει σημαντικά από τις άλλες παρατηρήσεις. Κοινές μέθοδοι ανίχνευσης περιλαμβάνουν τιμές πέρα από ±2 ή ±3 τυπικές αποκλίσεις από τον μέσο.
Ο λόγος της τυπικής απόκλισης προς τον μέσο, εκφρασμένος ως ποσοστό (CV = σ/μ × 100%). Επιτρέπει τη σύγκριση μεταβλητότητας μεταξύ συνόλων δεδομένων με διαφορετικές κλίμακες.
Μέτρο της ασυμμετρίας μιας κατανομής πιθανότητας. Θετική ασυμμετρία σημαίνει ότι η ουρά εκτείνεται προς τα δεξιά· αρνητική ασυμμετρία σημαίνει ότι εκτείνεται προς τα αριστερά.
Μέτρο του βάρους των ουρών μιας κατανομής πιθανότητας. Υψηλή κύρτωση υποδεικνύει βαριές ουρές και αιχμηρή κορυφή· χαμηλή κύρτωση υποδεικνύει ελαφριές ουρές και επίπεδη κορυφή.
Ο αριθμός ανεξάρτητων τιμών που μπορούν να μεταβληθούν σε έναν στατιστικό υπολογισμό. Για τη δειγματική τυπική απόκλιση, df = n − 1, αντανακλώντας τη διόρθωση Bessel.
Δηλώνει ότι η δειγματική κατανομή του δειγματικού μέσου προσεγγίζει κανονική κατανομή καθώς αυξάνεται το μέγεθος του δείγματος, ανεξάρτητα από την κατανομή του πληθυσμού.
Μια στατιστική μέθοδος λήψης αποφάσεων βάσει δεδομένων. Περιλαμβάνει τη σύγκριση μιας στατιστικής ελέγχου με μια κρίσιμη τιμή ή p-τιμή για να καθοριστεί αν πρέπει να απορριφθεί η μηδενική υπόθεση.
Η πιθανότητα παρατήρησης ενός αποτελέσματος τόσο ακραίου όσο η στατιστική ελέγχου, υποθέτοντας ότι η μηδενική υπόθεση είναι αληθής. Μικρότερες p-τιμές παρέχουν ισχυρότερες ενδείξεις κατά της μηδενικής υπόθεσης.
Μια τιμή μεταξύ −1 και 1 που μετράει τη δύναμη και κατεύθυνση της γραμμικής σχέσης μεταξύ δύο μεταβλητών. Τιμές κοντά στο ±1 υποδεικνύουν ισχυρή γραμμική σχέση.
Η διαφορά μεταξύ του 75ου εκατοστημόριου (Q3) και του 25ου εκατοστημόριου (Q1). Το IQR μετράει τη διασπορά του μεσαίου 50% των δεδομένων και είναι ανθεκτικό στις ακραίες τιμές.
Μια τιμή κάτω από την οποία βρίσκεται ένα δεδομένο ποσοστό παρατηρήσεων. Για παράδειγμα, το 90ό εκατοστημόριο είναι η τιμή κάτω από την οποία βρίσκεται το 90% των σημείων δεδομένων.