Σ
SDCalc
متوسطالتطبيقات·12 min

Cohen's d وحسابات حجم الأثر

أتقن حسابات حجم الأثر بما في ذلك Cohen's d وHedges' g وGlass's delta. تعلّم قياس الأهمية العملية ما وراء القيم الاحتمالية باستخدام الانحراف المعياري.

ما وراء الدلالة الإحصائية: فهم حجم الأثر

حجم الأثر يقيس مقدار فرق أو علاقة، بشكل مستقل عن حجم العينة. بينما تخبرك القيم الاحتمالية ما إذا كان الأثر ذا دلالة إحصائية، يخبرك حجم الأثر بمدى أهميته عمليًا. هذا التمييز حاسم لاتخاذ القرارات المبنية على الأدلة في البحث والطب والتعليم والأعمال.

تأمل تجربة صيدلانية حيث يُظهر دواء جديد تحسنًا ذا دلالة إحصائية (p < 0.001) مقارنة بالعلاج الوهمي. بدون حجم الأثر، لا تعرف ما إذا كان التحسن 0.1% أم 50%. حجم الأثر يوفر هذا السياق الحاسم، ويساعد أصحاب المصلحة في تحديد ما إذا كان الأثر يستحق التكلفة والآثار الجانبية أو جهد التطبيق.

أكثر مقاييس حجم الأثر شيوعًا لمقارنة مجموعتين هو Cohen's d، الذي يعبّر عن الفرق بين المتوسطات بوحدات الانحراف المعياري. هذا التوحيد يتيح المقارنة عبر دراسات ومقاييس قياس مختلفة.

لماذا يهم حجم الأثر

تتأثر الدلالة الإحصائية بشدة بحجم العينة. مع عينة كبيرة بما فيه الكفاية، حتى الفروق الضئيلة تصبح “ذات دلالة”. وبالعكس، قد لا تصل الآثار المهمة إلى الدلالة في العينات الصغيرة. حجم الأثر يحل هذه المشكلة بتوفير مقياس مستقل عن حجم العينة.

فخ الدلالة

دراسة بـ n=10,000 قد تُظهر p < 0.001 لفرق 0.5 نقطة على مقياس من 100 نقطة. هذا ذو دلالة إحصائية لكنه بلا معنى عمليًا (d ≈ 0.05). أبلغ دائمًا عن أحجام الأثر إلى جانب القيم الاحتمالية.

أسباب رئيسية لاستخدام حجم الأثر:

  • التحليل التلوي: يمكن دمج أحجام الأثر عبر الدراسات لتقدير الآثار الإجمالية
  • تحليل القوة: مطلوب لحساب أحجام العينات اللازمة للدراسات المستقبلية
  • القرارات العملية: يساعد في تحديد ما إذا كانت التدخلات تستحق التطبيق
  • التكرار: يوفر هدفًا لدراسات التكرار للمطابقة

Cohen's d: مقياس حجم الأثر المعياري

يعبّر Cohen's d عن الفرق بين متوسطي مجموعتين بوحدات الانحراف المعياري المجمّع:

Cohen's d

d = (M₁ - M₂) / sp

حيث M₁ وM₂ هما متوسطا المجموعتين، وsp هو الانحراف المعياري المجمّع المحسوب كالتالي:

الانحراف المعياري المجمّع

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

إشارة d تدل على الاتجاه: موجبة عندما M₁ > M₂، سالبة عندما M₁ < M₂. غالبًا ما تُقدَّم القيمة المطلقة |d| عندما يكون الاتجاه واضحًا من السياق.

لماذا نجمّع الانحراف المعياري؟

التجميع يفترض أن المجموعتين لهما نفس تباين المجتمع. هذا يعطي تقديرًا أكثر استقرارًا من استخدام الانحراف المعياري لأي مجموعة بمفردها، ويتوافق مع افتراضات اختبار t للعينات المستقلة.

مقاييس حجم الأثر البديلة

بينما Cohen's d هو الأكثر شيوعًا، توجد بدائل لحالات محددة:

Hedges' g: حجم الأثر المصحح للتحيز

يبالغ Cohen's d قليلاً في تقدير حجم أثر المجتمع في العينات الصغيرة. يطبق Hedges' g معامل تصحيح:

تصحيح Hedges' g

g = d × (1 - 3/(4(n₁+n₂) - 9))

لعينات أكبر من 20 لكل مجموعة، الفرق ضئيل. للعينات الصغيرة (n < 20)، يُفضَّل Hedges' g.

Glass's Δ: عندما تختلف التباينات

عندما تكون إحدى المجموعتين مجموعة ضابطة بتباين معروف، استخدم فقط الانحراف المعياري للمجموعة الضابطة كمقام:

Glass's Delta

Δ = (M₁ - M₂) / s_control

هذا مفيد عندما يمكن أن يؤثر العلاج على التباين (مثل تدخل يساعد ذوي الأداء المنخفض أكثر من ذوي الأداء العالي).

تفسير أحجام الأثر: إرشادات كوهين

اقترح جاكوب كوهين هذه الاصطلاحات لتفسير قيم d:

حجم الأثر (d)التفسيرالتداخل
0.2صغير85% تداخل بين المجموعتين
0.5متوسط67% تداخل بين المجموعتين
0.8كبير53% تداخل بين المجموعتين
1.2كبير جدًا40% تداخل بين المجموعتين
2.0ضخم19% تداخل بين المجموعتين

السياق مهم

هذه إرشادات تقريبية وليست قواعد مطلقة. في بعض المجالات، d = 0.2 قد يكون ذا معنى كبير (مثل تقليل خطر النوبة القلبية)، بينما في مجالات أخرى d = 0.8 قد يكون متوقعًا (مثل التدريس الخصوصي مقابل عدم التعليم).

مثال محلول: تدخل تعليمي

مدرسة تختبر برنامج قراءة جديد. المجموعة الضابطة (n=25): المتوسط=72، الانحراف المعياري=12. مجموعة العلاج (n=30): المتوسط=79، الانحراف المعياري=14. احسب Cohen's d:

1

حساب التباين المجمّع

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172.45
2

حساب الانحراف المعياري المجمّع

sp = √172.45 = 13.13
3

حساب Cohen's d

d = (79 - 72) / 13.13 = 7 / 13.13 = 0.53
4

التفسير

حجم أثر متوسط (d = 0.53). مجموعة العلاج تسجل حوالي نصف انحراف معياري أعلى من المجموعة الضابطة.

هذا يعني أنه إذا أخذت طالبًا عشوائيًا من مجموعة العلاج وآخر من المجموعة الضابطة، فإن طالب العلاج سيسجل أعلى حوالي 64% من الوقت (محسوبة من التداخل).

التطبيق بلغة Python

حساب أحجام الأثر برمجيًا مع فترات الثقة:

python
import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.