מעבר למובהקות סטטיסטית: הבנת גודל אפקט
גודל אפקט מודד את עוצמת ההבדל או הקשר, ללא תלות בגודל המדגם. בעוד ערכי p מספרים לכם אם אפקט מובהק סטטיסטית, גודל האפקט מספר כמה משמעותי הוא מבחינה מעשית. הבחנה זו חיונית לקבלת החלטות מבוססות ראיות במחקר, רפואה, חינוך ועסקים.
חשבו על ניסוי תרופתי שבו תרופה חדשה מראה שיפור מובהק סטטיסטית (p < 0.001) לעומת פלצבו. ללא גודל אפקט, אינכם יודעים אם השיפור הוא 0.1% או 50%. גודל האפקט מספק הקשר חיוני זה, ועוזר לבעלי עניין לקבוע אם האפקט שווה את העלות, תופעות הלוואי או מאמץ ההטמעה.
מדד גודל האפקט הנפוץ ביותר להשוואת שתי קבוצות הוא d של כהן, המביע את ההפרש בין ממוצעים ביחידות של סטיית תקן. נורמליזציה זו מאפשרת השוואה בין מחקרים שונים וסקאלות מדידה שונות.
למה גודל אפקט חשוב
מובהקות סטטיסטית מושפעת מאוד מגודל המדגם. עם מדגם גדול מספיק, גם הבדלים זניחים הופכים “מובהקים”. מנגד, אפקטים חשובים עלולים שלא להגיע למובהקות במדגמים קטנים. גודל אפקט פותר בעיה זו על ידי מתן מדד שאינו תלוי בגודל המדגם.
מלכודת המובהקות
סיבות מרכזיות לשימוש בגודל אפקט:
- מטה-אנליזה: ניתן לשלב גדלי אפקט ממחקרים שונים לאומדן אפקט כולל
- ניתוח עוצמה: נדרש לחישוב גדלי מדגם הכרחיים למחקרים עתידיים
- החלטות מעשיות: מסייע לקבוע אם כדאי ליישם התערבויות
- שחזור: מספק מטרה למחקרי שחזור להתאים אליה
d של כהן: מדד גודל האפקט הסטנדרטי
d של כהן מביע את ההפרש בין שני ממוצעי קבוצות ביחידות של סטיית תקן משותפת:
Cohen's d
כאשר M₁ ו-M₂ הם ממוצעי הקבוצות, ו-sp היא סטיית התקן המשותפת המחושבת כך:
Pooled Standard Deviation
הסימן של d מציין כיוון: חיובי כאשר M₁ > M₂, שלילי כאשר M₁ < M₂. לעתים קרובות מדווחים על הערך המוחלט |d| כאשר הכיוון ברור מההקשר.
למה לאחד את סטיית התקן?
מדדי גודל אפקט חלופיים
בעוד d של כהן הוא הנפוץ ביותר, קיימות חלופות למצבים ספציפיים:
g של הדג'ס: גודל אפקט מתוקן הטיה
d של כהן מעט מגזים באומדן גודל האפקט האוכלוסייתי במדגמים קטנים. g של הדג'ס מחיל מקדם תיקון:
Hedges' g Correction
למדגמים מעל 20 בכל קבוצה, ההבדל זניח. למדגמים קטנים (n < 20), g של הדג'ס עדיף.
Δ של גלאס: כאשר השונויות שונות
כאשר קבוצה אחת היא קבוצת ביקורת עם שונות ידועה, השתמשו רק בסטיית התקן של קבוצת הביקורת כמכנה:
Glass's Delta
שימושי כאשר ההתערבות עשויה להשפיע על השונות (למשל, התערבות שעוזרת לבעלי ביצועים נמוכים יותר מאשר לבעלי ביצועים גבוהים).
פרשנות גודל אפקט: הנחיות כהן
ג'ייקוב כהן הציע מוסכמות אלה לפרשנות ערכי d:
| גודל אפקט (d) | פרשנות | חפיפה |
|---|---|---|
| 0.2 | קטן | 85% חפיפה בין הקבוצות |
| 0.5 | בינוני | 67% חפיפה בין הקבוצות |
| 0.8 | גדול | 53% חפיפה בין הקבוצות |
| 1.2 | גדול מאוד | 40% חפיפה בין הקבוצות |
| 2.0 | עצום | 19% חפיפה בין הקבוצות |
ההקשר חשוב
דוגמה מפורטת: התערבות חינוכית
בית ספר בודק תוכנית קריאה חדשה. קבוצת ביקורת (n=25): ממוצע=72, סט“ת=12. קבוצת טיפול (n=30): ממוצע=79, סט“ת=14. חשבו d של כהן:
חישוב שונות משותפת
חישוב סט“ת משותפת
חישוב d של כהן
פרשנות
משמעות הדבר היא שאם תיקחו תלמיד אקראי מקבוצת הטיפול ותלמיד אקראי מקבוצת הביקורת, תלמיד הטיפול יקבל ציון גבוה יותר בכ-64% מהמקרים (מחושב מהחפיפה).
מימוש ב-Python
חישוב גודל אפקט באופן תכנותי עם רווחי סמך:
import numpy as np
from scipy import stats
def cohens_d(group1, group2):
"""Calculate Cohen's d for two independent groups."""
n1, n2 = len(group1), len(group2)
var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
# Pooled standard deviation
pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
# Cohen's d
d = (np.mean(group1) - np.mean(group2)) / pooled_std
return d
def hedges_g(group1, group2):
"""Calculate Hedges' g (bias-corrected effect size)."""
n1, n2 = len(group1), len(group2)
d = cohens_d(group1, group2)
# Correction factor for small sample bias
correction = 1 - 3 / (4*(n1+n2) - 9)
return d * correction
# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]
d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")