Σ
SDCalc

Στατιστικό Γλωσσάριο

Βασικοί στατιστικοί όροι και ορισμοί

Τυπική Απόκλιση (σ / s)

Μέτρο της ποσότητας μεταβολής ή διασποράς σε ένα σύνολο τιμών. Είναι η τετραγωνική ρίζα της διακύμανσης και εκφράζεται στις ίδιες μονάδες με τα δεδομένα.

Διακύμανση (σ² / s²)

Ο μέσος όρος των τετραγώνων των αποκλίσεων από τον μέσο. Η διακύμανση ποσοτικοποιεί τον βαθμό διασποράς σε ένα σύνολο δεδομένων και είναι το τετράγωνο της τυπικής απόκλισης.

Μέσος Όρος (μ / x̄)

Ο αριθμητικός μέσος ενός συνόλου τιμών, που υπολογίζεται αθροίζοντας όλες τις τιμές και διαιρώντας με τον αριθμό τους. Αντιπροσωπεύει την κεντρική τάση των δεδομένων.

Διάμεσος

Η μεσαία τιμή σε ένα ταξινομημένο σύνολο δεδομένων. Αν υπάρχει ζυγός αριθμός τιμών, η διάμεσος είναι ο μέσος όρος των δύο μεσαίων τιμών. Είναι ανθεκτική στις ακραίες τιμές.

Επικρατούσα Τιμή

Η τιμή που εμφανίζεται πιο συχνά σε ένα σύνολο δεδομένων. Ένα σύνολο δεδομένων μπορεί να έχει μία επικρατούσα τιμή (μονοκόρυφο), πολλές (πολυκόρυφο) ή καμία.

Εύρος

Η διαφορά μεταξύ της μεγαλύτερης και της μικρότερης τιμής σε ένα σύνολο δεδομένων. Αν και απλό στον υπολογισμό, λαμβάνει υπόψη μόνο τις δύο ακραίες τιμές και είναι ευαίσθητο σε ακραίες τιμές.

Πληθυσμός

Το πλήρες σύνολο όλων των ατόμων ή παρατηρήσεων ενδιαφέροντος σε μια μελέτη. Οι παράμετροι πληθυσμού συμβολίζονται τυπικά με ελληνικά γράμματα (μ, σ).

Δείγμα

Ένα υποσύνολο ενός πληθυσμού που επιλέγεται για ανάλυση. Οι δειγματικές στατιστικές συμβολίζονται τυπικά με λατινικά γράμματα (x̄, s) και χρησιμοποιούνται για την εκτίμηση παραμέτρων πληθυσμού.

Διόρθωση Bessel

Η χρήση n−1 αντί n στον παρονομαστή κατά τον υπολογισμό της δειγματικής διακύμανσης. Αυτή η διόρθωση παρέχει μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού από ένα δείγμα.

Κανονική Κατανομή

Μια συμμετρική κατανομή πιθανότητας σε σχήμα καμπάνας όπου ο μέσος, η διάμεσος και η επικρατούσα τιμή είναι όλα ίσα. Πολλά φυσικά φαινόμενα ακολουθούν περίπου κανονική κατανομή.

Εμπειρικός Κανόνας (68-95-99,7)

Για κανονικά κατανεμημένα δεδομένα, περίπου 68% των τιμών βρίσκεται εντός ±1σ, 95% εντός ±2σ και 99,7% εντός ±3σ από τον μέσο όρο.

Z-Score

Ο αριθμός τυπικών αποκλίσεων που απέχει ένα σημείο δεδομένων από τον μέσο, υπολογιζόμενο ως Z = (X − μ) / σ. Τα z-scores επιτρέπουν τη σύγκριση τιμών από διαφορετικές κατανομές.

Τυπικό Σφάλμα (SE)

Η τυπική απόκλιση της δειγματικής κατανομής μιας στατιστικής, πιο συχνά του μέσου. SE = σ/√n, μειώνεται καθώς αυξάνεται το μέγεθος του δείγματος.

Διάστημα Εμπιστοσύνης

Ένα εύρος τιμών που πιθανώς περιέχει την πραγματική παράμετρο του πληθυσμού με ένα καθορισμένο επίπεδο εμπιστοσύνης (π.χ. 95%). Ευρύτερα διαστήματα υποδεικνύουν μικρότερη ακρίβεια.

Ακραία Τιμή

Ένα σημείο δεδομένων που διαφέρει σημαντικά από τις άλλες παρατηρήσεις. Κοινές μέθοδοι ανίχνευσης περιλαμβάνουν τιμές πέρα από ±2 ή ±3 τυπικές αποκλίσεις από τον μέσο.

Συντελεστής Μεταβλητότητας (CV)

Ο λόγος της τυπικής απόκλισης προς τον μέσο, εκφρασμένος ως ποσοστό (CV = σ/μ × 100%). Επιτρέπει τη σύγκριση μεταβλητότητας μεταξύ συνόλων δεδομένων με διαφορετικές κλίμακες.

Ασυμμετρία

Μέτρο της ασυμμετρίας μιας κατανομής πιθανότητας. Θετική ασυμμετρία σημαίνει ότι η ουρά εκτείνεται προς τα δεξιά· αρνητική ασυμμετρία σημαίνει ότι εκτείνεται προς τα αριστερά.

Κύρτωση

Μέτρο του βάρους των ουρών μιας κατανομής πιθανότητας. Υψηλή κύρτωση υποδεικνύει βαριές ουρές και αιχμηρή κορυφή· χαμηλή κύρτωση υποδεικνύει ελαφριές ουρές και επίπεδη κορυφή.

Βαθμοί Ελευθερίας (df)

Ο αριθμός ανεξάρτητων τιμών που μπορούν να μεταβληθούν σε έναν στατιστικό υπολογισμό. Για τη δειγματική τυπική απόκλιση, df = n − 1, αντανακλώντας τη διόρθωση Bessel.

Κεντρικό Οριακό Θεώρημα

Δηλώνει ότι η δειγματική κατανομή του δειγματικού μέσου προσεγγίζει κανονική κατανομή καθώς αυξάνεται το μέγεθος του δείγματος, ανεξάρτητα από την κατανομή του πληθυσμού.

Έλεγχος Υποθέσεων

Μια στατιστική μέθοδος λήψης αποφάσεων βάσει δεδομένων. Περιλαμβάνει τη σύγκριση μιας στατιστικής ελέγχου με μια κρίσιμη τιμή ή p-τιμή για να καθοριστεί αν πρέπει να απορριφθεί η μηδενική υπόθεση.

P-Τιμή

Η πιθανότητα παρατήρησης ενός αποτελέσματος τόσο ακραίου όσο η στατιστική ελέγχου, υποθέτοντας ότι η μηδενική υπόθεση είναι αληθής. Μικρότερες p-τιμές παρέχουν ισχυρότερες ενδείξεις κατά της μηδενικής υπόθεσης.

Συντελεστής Συσχέτισης (r)

Μια τιμή μεταξύ −1 και 1 που μετράει τη δύναμη και κατεύθυνση της γραμμικής σχέσης μεταξύ δύο μεταβλητών. Τιμές κοντά στο ±1 υποδεικνύουν ισχυρή γραμμική σχέση.

Ενδοτεταρτημοριακό Εύρος (IQR)

Η διαφορά μεταξύ του 75ου εκατοστημόριου (Q3) και του 25ου εκατοστημόριου (Q1). Το IQR μετράει τη διασπορά του μεσαίου 50% των δεδομένων και είναι ανθεκτικό στις ακραίες τιμές.

Εκατοστημόριο

Μια τιμή κάτω από την οποία βρίσκεται ένα δεδομένο ποσοστό παρατηρήσεων. Για παράδειγμα, το 90ό εκατοστημόριο είναι η τιμή κάτω από την οποία βρίσκεται το 90% των σημείων δεδομένων.