ما هو الانحراف المعياري؟
الانحراف المعياري هو مقياس إحصائي يحدد مقدار التباين أو التشتت في مجموعة من قيم البيانات. يشير الانحراف المعياري المنخفض إلى أن نقاط البيانات تميل إلى أن تكون قريبة من المتوسط (القيمة المتوقعة) للمجموعة، بينما يشير الانحراف المعياري المرتفع إلى أن نقاط البيانات منتشرة عبر نطاق أوسع من القيم. يُمثَّل بالحرف اليوناني σ (سيغما) للمجتمعات الإحصائية و s للعينات، ويُعد من المفاهيم الأساسية في الإحصاء الوصفي.
التعريف الأساسي
الانحراف المعياري للمجتمع مقابل العينة
قبل حساب الانحراف المعياري، يجب عليك تحديد ما إذا كانت بياناتك تمثل مجتمعاً إحصائياً (Population) بأكمله أم عينة (Sample) منه. يشمل المجتمع الإحصائي جميع أفراد مجموعة محددة، في حين أن العينة هي مجموعة فرعية ممثلة من تلك المجموعة. يتطلب حساب الانحراف المعياري لعينة تعديلاً رياضياً — باستخدام n - 1 (درجات الحرية، أو df) بدلاً من N — لضمان أن النتيجة هي مقدر غير متحيز لتباين المجتمع الإحصائي.
الانحراف المعياري للمجتمع الإحصائي
الانحراف المعياري للعينة
شرح صيغة الانحراف المعياري
تعتمد صيغ الانحراف المعياري على حساب التباين أولاً، ثم أخذ الجذر التربيعي. خطوة الجذر التربيعي هذه حاسمة لأنها تعيد مقياس التشتت إلى الوحدات الأصلية للبيانات. المكونات الرئيسية هي xᵢ (كل قيمة فردية)، و μ أو x̄ (متوسط المجتمع أو العينة)، و N أو n (العدد الإجمالي للقيم).
انحراف معياري للمجتمع
انحراف معياري للعينة
مثال حسابي خطوة بخطوة
لنحسب الانحراف المعياري للعينة لمجموعة بيانات صغيرة من درجات الاختبار: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. يكشف اتباع الصيغة خطوة بخطوة كيف يتراكم التباين قبل أن نأخذ الجذر التربيعي النهائي.
حساب المتوسط (x̄)
طرح المتوسط وتربيع الناتج
مجموع الفروق التربيعية
القسمة على n - 1 (درجات الحرية)
أخذ الجذر التربيعي
حساب الانحراف المعياري في بايثون
حساب الانحراف المعياري يدوياً عرضة للخطأ، خاصة مع مجموعات البيانات الكبيرة. في الممارسة العملية، يستخدم الإحصائيون وعلماء البيانات لغات برمجة مثل بايثون لحسابه فوراً باستخدام المكتبات الجاهزة.
import statistics
data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]
# حساب الانحراف المعياري للعينة (الافتراضي)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")
# حساب الانحراف المعياري للمجتمع الإحصائي
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")القاعدة التجريبية والانحراف المعياري
عندما تتبع البيانات توزيعاً طبيعياً (منحنى الجرس)، يصبح الانحراف المعياري تنبؤياً للغاية. تنص القاعدة التجريبية، والمعروفة أيضاً بقاعدة 68-95-99.7، على أن جميع البيانات تقريباً ستقع ضمن ثلاثة انحرافات معيارية من المتوسط. يتيح ذلك للمحللين تحديد القيم المتطرفة بسرعة وفهم احتمالية حدوث ملاحظة معينة.
| المدى من المتوسط | نسبة البيانات | التطبيق |
|---|---|---|
| ±1σ | 68.27% | تحديد القيم النموذجية واليومية |
| ±2σ | 95.45% | تحديد فترات الثقة |
| ±3σ | 99.73% | اكتشاف القيم المتطرفة للغاية |
الانحراف المعياري مقابل التباين
التباين والانحراف المعياري هما مقاييس مرتبطة ارتباطاً وثيقاً للتشتت. التباين (σ² أو s²) هو متوسط الفروق التربيعية عن المتوسط، بينما الانحراف المعياري هو الجذر التربيعي للتباين. نظراً لأن التباين يُعبر عنه بوحدات تربيعية (مثل ريالات مربعة، سنتيمترات مربعة)، فقد يصعب تفسيره في سياق البيانات الأصلية. يحل الانحراف المعياري هذه المشكلة عن طريق تحويل المقياس مرة أخرى إلى الوحدات الأصلية.
الإبلاغ عن بياناتك
أخطاء شائعة يجب تجنبها
في حين أن الانحراف المعياري أداة قوية، إلا أنه يُساء استخدامها بشكل متكرر. يمكن أن يؤدي التطبيق الخاطئ للصيغ أو سوء فهم ما تمثله القيمة إلى تحليل بيانات معيب واستنتاجات غير صحيحة.
- استخدام صيغة المجتمع الإحصائي للعينة: نسيان استخدام n - 1 للعينات يقلل من التشتت المحسوب بشكل مصطنع، مما يؤدي إلى التقليل من تباين المجتمع الإحصائي الحقيقي.
- تطبيق الانحراف المعياري على توزيعات غير طبيعية: القاعدة التجريبية تنطبق فقط على التوزيع الطبيعي. بالنسبة للبيانات شديدة الانحراف، قد لا يعكس الانحراف المعياري التشتت بدقة.
- الخلط بين الانحراف المعياري والخطأ المعياري: يقيس الخطأ المعياري دقة تقدير متوسط العينة، بينما يقيس الانحراف المعياري تشتت البيانات الأساسية نفسها.
احذر من القيم المتطرفة
Further Reading
Sources
References and further authoritative reading used in preparing this article.