How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Cohen's d وحسابات حجم الأثر | Standard Deviation Calculator

ما وراء الدلالة الإحصائية: فهم حجم الأثر

حجم الأثر يقيس مقدار فرق أو علاقة، بشكل مستقل عن حجم العينة. بينما تخبرك القيم الاحتمالية ما إذا كان الأثر ذا دلالة إحصائية، يخبرك حجم الأثر بمدى أهميته عمليًا. هذا التمييز حاسم لاتخاذ القرارات المبنية على الأدلة في البحث والطب والتعليم والأعمال.

تأمل تجربة صيدلانية حيث يُظهر دواء جديد تحسنًا ذا دلالة إحصائية (p < 0.001) مقارنة بالعلاج الوهمي. بدون حجم الأثر، لا تعرف ما إذا كان التحسن 0.1% أم 50%. حجم الأثر يوفر هذا السياق الحاسم، ويساعد أصحاب المصلحة في تحديد ما إذا كان الأثر يستحق التكلفة والآثار الجانبية أو جهد التطبيق.

أكثر مقاييس حجم الأثر شيوعًا لمقارنة مجموعتين هو Cohen's d، الذي يعبّر عن الفرق بين المتوسطات بوحدات الانحراف المعياري. هذا التوحيد يتيح المقارنة عبر دراسات ومقاييس قياس مختلفة.

لماذا يهم حجم الأثر

تتأثر الدلالة الإحصائية بشدة بحجم العينة. مع عينة كبيرة بما فيه الكفاية، حتى الفروق الضئيلة تصبح “ذات دلالة”. وبالعكس، قد لا تصل الآثار المهمة إلى الدلالة في العينات الصغيرة. حجم الأثر يحل هذه المشكلة بتوفير مقياس مستقل عن حجم العينة.

فخ الدلالة

دراسة بـ n=10,000 قد تُظهر p < 0.001 لفرق 0.5 نقطة على مقياس من 100 نقطة. هذا ذو دلالة إحصائية لكنه بلا معنى عمليًا (d ≈ 0.05). أبلغ دائمًا عن أحجام الأثر إلى جانب القيم الاحتمالية.

أسباب رئيسية لاستخدام حجم الأثر:

التحليل التلوي: يمكن دمج أحجام الأثر عبر الدراسات لتقدير الآثار الإجمالية
تحليل القوة: مطلوب لحساب أحجام العينات اللازمة للدراسات المستقبلية
القرارات العملية: يساعد في تحديد ما إذا كانت التدخلات تستحق التطبيق
التكرار: يوفر هدفًا لدراسات التكرار للمطابقة

Cohen's d: مقياس حجم الأثر المعياري

يعبّر Cohen's d عن الفرق بين متوسطي مجموعتين بوحدات الانحراف المعياري المجمّع:

Cohen's d

d = (M₁ - M₂) / sp

حيث M₁ وM₂ هما متوسطا المجموعتين، وsp هو الانحراف المعياري المجمّع المحسوب كالتالي:

الانحراف المعياري المجمّع

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

إشارة d تدل على الاتجاه: موجبة عندما M₁ > M₂، سالبة عندما M₁ < M₂. غالبًا ما تُقدَّم القيمة المطلقة |d| عندما يكون الاتجاه واضحًا من السياق.

لماذا نجمّع الانحراف المعياري؟

التجميع يفترض أن المجموعتين لهما نفس تباين المجتمع. هذا يعطي تقديرًا أكثر استقرارًا من استخدام الانحراف المعياري لأي مجموعة بمفردها، ويتوافق مع افتراضات اختبار t للعينات المستقلة.

مقاييس حجم الأثر البديلة

بينما Cohen's d هو الأكثر شيوعًا، توجد بدائل لحالات محددة:

Hedges' g: حجم الأثر المصحح للتحيز

يبالغ Cohen's d قليلاً في تقدير حجم أثر المجتمع في العينات الصغيرة. يطبق Hedges' g معامل تصحيح:

تصحيح Hedges' g

g = d × (1 - 3/(4(n₁+n₂) - 9))

لعينات أكبر من 20 لكل مجموعة، الفرق ضئيل. للعينات الصغيرة (n < 20)، يُفضَّل Hedges' g.

Glass's Δ: عندما تختلف التباينات

عندما تكون إحدى المجموعتين مجموعة ضابطة بتباين معروف، استخدم فقط الانحراف المعياري للمجموعة الضابطة كمقام:

Glass's Delta

Δ = (M₁ - M₂) / s_control

هذا مفيد عندما يمكن أن يؤثر العلاج على التباين (مثل تدخل يساعد ذوي الأداء المنخفض أكثر من ذوي الأداء العالي).

تفسير أحجام الأثر: إرشادات كوهين

اقترح جاكوب كوهين هذه الاصطلاحات لتفسير قيم d:

حجم الأثر (d)	التفسير	التداخل
0.2	صغير	85% تداخل بين المجموعتين
0.5	متوسط	67% تداخل بين المجموعتين
0.8	كبير	53% تداخل بين المجموعتين
1.2	كبير جدًا	40% تداخل بين المجموعتين
2.0	ضخم	19% تداخل بين المجموعتين

السياق مهم

هذه إرشادات تقريبية وليست قواعد مطلقة. في بعض المجالات، d = 0.2 قد يكون ذا معنى كبير (مثل تقليل خطر النوبة القلبية)، بينما في مجالات أخرى d = 0.8 قد يكون متوقعًا (مثل التدريس الخصوصي مقابل عدم التعليم).

مثال محلول: تدخل تعليمي

مدرسة تختبر برنامج قراءة جديد. المجموعة الضابطة (n=25): المتوسط=72، الانحراف المعياري=12. مجموعة العلاج (n=30): المتوسط=79، الانحراف المعياري=14. احسب Cohen's d:

حساب التباين المجمّع

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172.45

حساب الانحراف المعياري المجمّع

sp = √172.45 = 13.13

حساب Cohen's d

d = (79 - 72) / 13.13 = 7 / 13.13 = 0.53

التفسير

حجم أثر متوسط (d = 0.53). مجموعة العلاج تسجل حوالي نصف انحراف معياري أعلى من المجموعة الضابطة.

هذا يعني أنه إذا أخذت طالبًا عشوائيًا من مجموعة العلاج وآخر من المجموعة الضابطة، فإن طالب العلاج سيسجل أعلى حوالي 64% من الوقت (محسوبة من التداخل).

التطبيق بلغة Python

حساب أحجام الأثر برمجيًا مع فترات الثقة:

python

import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")

Reading goal	What to focus on	Common mistake
Definition	What the metric is and what quantity it summarizes	Treating the formula as self-explanatory
Formula choice	Sample versus population assumptions and notation	Using n when n-1 is required or vice versa
Interpretation	Whether the result indicates concentration, spread, or risk	Calling a large value good or bad without context

Cohen's d وحسابات حجم الأثر