Σ
SDCalc
ΜέτριοιΕφαρμογές·12 min

Cohen's d και Υπολογισμοί Μεγέθους Επίδρασης

Κατακτήστε τους υπολογισμούς μεγέθους επίδρασης, συμπεριλαμβανομένων των Cohen's d, Hedges' g και Glass's delta. Μάθετε να μετράτε την πρακτική σημαντικότητα πέρα από τις τιμές p χρησιμοποιώντας την τυπική απόκλιση.

Πέρα από τη Στατιστική Σημαντικότητα: Κατανόηση του Μεγέθους Επίδρασης

Το μέγεθος επίδρασης μετρά το μέγεθος μιας διαφοράς ή σχέσης, ανεξάρτητα από το μέγεθος δείγματος. Ενώ οι τιμές p σας λένε αν μια επίδραση είναι στατιστικά σημαντική, τα μεγέθη επίδρασης σας λένε πόσο πρακτικά σημαντική είναι αυτή η επίδραση. Αυτή η διάκριση είναι κρίσιμη για τη λήψη αποφάσεων βασισμένων σε τεκμήρια στην έρευνα, την ιατρική, την εκπαίδευση και τις επιχειρήσεις.

Σκεφτείτε μια φαρμακευτική δοκιμή όπου ένα νέο φάρμακο δείχνει στατιστικά σημαντική βελτίωση (p < 0,001) σε σχέση με εικονικό φάρμακο. Χωρίς το μέγεθος επίδρασης, δεν ξέρετε αν η βελτίωση είναι 0,1% ή 50%. Το μέγεθος επίδρασης παρέχει αυτό το κρίσιμο πλαίσιο, βοηθώντας τους ενδιαφερόμενους να κρίνουν αν η επίδραση αξίζει το κόστος, τις παρενέργειες ή την προσπάθεια υλοποίησης.

Το πιο κοινό μέτρο μεγέθους επίδρασης για τη σύγκριση δύο ομάδων είναι το Cohen's d, που εκφράζει τη διαφορά μεταξύ μέσων σε μονάδες τυπικής απόκλισης. Αυτή η τυποποίηση επιτρέπει τη σύγκριση μεταξύ διαφορετικών μελετών και κλιμάκων μέτρησης.

Γιατί Είναι Σημαντικό το Μέγεθος Επίδρασης

Η στατιστική σημαντικότητα επηρεάζεται έντονα από το μέγεθος δείγματος. Με αρκετά μεγάλο δείγμα, ακόμη και ασήμαντες διαφορές γίνονται “σημαντικές”. Αντίστροφα, σημαντικές επιδράσεις μπορεί να μην φτάσουν σε σημαντικότητα σε μικρά δείγματα. Το μέγεθος επίδρασης λύνει αυτό το πρόβλημα παρέχοντας ένα μέτρο ανεξάρτητο από το μέγεθος δείγματος.

Η Παγίδα της Σημαντικότητας

Μια μελέτη με n=10.000 μπορεί να δείξει p < 0,001 για διαφορά 0,5 βαθμών σε κλίμακα 100 βαθμών. Αυτό είναι στατιστικά σημαντικό αλλά πρακτικά ανούσιο (d ≈ 0,05). Να αναφέρετε πάντα μεγέθη επίδρασης μαζί με τιμές p.

Βασικοί λόγοι χρήσης του μεγέθους επίδρασης:

  • Μετα-ανάλυση: Τα μεγέθη επίδρασης μπορούν να συνδυαστούν μεταξύ μελετών για εκτίμηση συνολικών επιδράσεων
  • Ανάλυση ισχύος: Απαιτείται για τον υπολογισμό αναγκαίων μεγεθών δείγματος σε μελλοντικές μελέτες
  • Πρακτικές αποφάσεις: Βοηθά να καθοριστεί αν οι παρεμβάσεις αξίζει να εφαρμοστούν
  • Αναπαραγωγή: Παρέχει στόχο για μελέτες αναπαραγωγής

Cohen's d: Το Πρότυπο Μέτρο Μεγέθους Επίδρασης

Το Cohen's d εκφράζει τη διαφορά μεταξύ δύο μέσων ομάδων σε μονάδες συγκεντρωτικής τυπικής απόκλισης:

Cohen's d

d = (M₁ - M₂) / sp

Όπου M₁ και M₂ είναι οι μέσοι ομάδων και sp η συγκεντρωτική τυπική απόκλιση που υπολογίζεται ως:

Pooled Standard Deviation

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Το πρόσημο του d δείχνει κατεύθυνση: θετικό όταν M₁ > M₂, αρνητικό όταν M₁ < M₂. Συχνά αναφέρεται η απόλυτη τιμή |d| όταν η κατεύθυνση είναι προφανής από τα συμφραζόμενα.

Γιατί Συγκεντρωτική Τυπική Απόκλιση;

Η συγκέντρωση προϋποθέτει ότι οι δύο ομάδες έχουν ίσες πληθυσμιακές διακυμάνσεις. Αυτό δίνει πιο σταθερή εκτίμηση από τη χρήση της ΤΑ μίας μόνο ομάδας και αντιστοιχεί στις υποθέσεις του t-test ανεξάρτητων δειγμάτων.

Εναλλακτικά Μέτρα Μεγέθους Επίδρασης

Ενώ το Cohen's d είναι το πιο κοινό, υπάρχουν εναλλακτικές για ειδικές περιπτώσεις:

Hedges' g: Διορθωμένο Μέγεθος Επίδρασης

Το Cohen's d ελαφρώς υπερεκτιμά το πληθυσμιακό μέγεθος επίδρασης σε μικρά δείγματα. Το Hedges' g εφαρμόζει διορθωτικό παράγοντα:

Hedges' g Correction

g = d × (1 - 3/(4(n₁+n₂) - 9))

Για δείγματα άνω των 20 ανά ομάδα, η διαφορά είναι αμελητέα. Για μικρά δείγματα (n < 20), προτιμάται το Hedges' g.

Glass's Δ: Όταν Διαφέρουν οι Διακυμάνσεις

Όταν μία ομάδα αποτελεί ομάδα ελέγχου με γνωστή μεταβλητότητα, χρησιμοποιήστε μόνο την τυπική απόκλιση της ομάδας ελέγχου ως παρονομαστή:

Glass's Delta

Δ = (M₁ - M₂) / s_control

Αυτό είναι χρήσιμο όταν η θεραπεία μπορεί να επηρεάσει τη διακύμανση (π.χ. μια παρέμβαση που βοηθά τους χαμηλών επιδόσεων περισσότερο από τους υψηλών).

Ερμηνεία Μεγεθών Επίδρασης: Κατευθυντήριες Γραμμές Cohen

Ο Jacob Cohen πρότεινε τις ακόλουθες συμβάσεις για την ερμηνεία τιμών d:

Μέγεθος Επίδρασης (d)ΕρμηνείαΕπικάλυψη
0.2Μικρό85% επικάλυψη μεταξύ ομάδων
0.5Μέτριο67% επικάλυψη μεταξύ ομάδων
0.8Μεγάλο53% επικάλυψη μεταξύ ομάδων
1.2Πολύ μεγάλο40% επικάλυψη μεταξύ ομάδων
2.0Τεράστιο19% επικάλυψη μεταξύ ομάδων

Το Πλαίσιο Μετράει

Αυτές είναι γενικές κατευθυντήριες γραμμές, όχι απόλυτοι κανόνες. Σε ορισμένους τομείς, d = 0,2 μπορεί να είναι εξαιρετικά σημαντικό (π.χ. μείωση κινδύνου εμφράγματος), ενώ σε άλλους d = 0,8 μπορεί να είναι αναμενόμενο (π.χ. ιδιαίτερα μαθήματα vs καμία διδασκαλία).

Αναλυτικό Παράδειγμα: Εκπαιδευτική Παρέμβαση

Ένα σχολείο δοκιμάζει ένα νέο πρόγραμμα ανάγνωσης. Ομάδα ελέγχου (n=25): μέσος=72, ΤΑ=12. Ομάδα θεραπείας (n=30): μέσος=79, ΤΑ=14. Υπολογισμός Cohen's d:

1

Υπολογισμός Συγκεντρωτικής Διακύμανσης

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45
2

Υπολογισμός Συγκεντρωτικής ΤΑ

sp = √172,45 = 13,13
3

Υπολογισμός Cohen's d

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53
4

Ερμηνεία

Μέτριο μέγεθος επίδρασης (d = 0,53). Η ομάδα θεραπείας βαθμολογεί περίπου μισή τυπική απόκλιση υψηλότερα από τον μάρτυρα.

Αυτό σημαίνει ότι αν παίρνατε τυχαία έναν μαθητή από την ομάδα θεραπείας και έναν από την ομάδα ελέγχου, ο μαθητής θεραπείας θα βαθμολογούσε υψηλότερα περίπου στο 64% των περιπτώσεων (υπολογισμένο από την επικάλυψη).

Υλοποίηση σε Python

Υπολογισμός μεγεθών επίδρασης προγραμματιστικά με διαστήματα εμπιστοσύνης:

python
import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")