مسرد الإحصاء
المصطلحات والتعريفات الإحصائية الأساسية
الانحراف المعياري (σ / s)
مقياس لمقدار التباين أو التشتت في مجموعة من القيم. وهو الجذر التربيعي للتباين ويُعبَّر عنه بنفس وحدات البيانات.
التباين (σ² / s²)
متوسط مربعات الفروقات عن المتوسط. يحدد التباين درجة الانتشار في مجموعة بيانات وهو مربع الانحراف المعياري.
المتوسط (μ / x̄)
الوسط الحسابي لمجموعة من القيم، يُحسب بجمع جميع القيم وقسمتها على العدد. يمثل النزعة المركزية للبيانات.
الوسيط
القيمة الوسطى في مجموعة بيانات مرتبة. إذا كان عدد القيم زوجياً، فإن الوسيط هو متوسط القيمتين الوسطيتين. وهو مقاوم للقيم الشاذة.
المنوال
القيمة الأكثر تكراراً في مجموعة بيانات. يمكن أن تحتوي مجموعة البيانات على منوال واحد (أحادية المنوال)، أو عدة منوالات (متعددة المنوال)، أو لا منوال على الإطلاق.
المدى
الفرق بين أكبر وأصغر القيم في مجموعة بيانات. رغم سهولة حسابه، فإنه يأخذ في الاعتبار القيمتين المتطرفتين فقط وهو حساس للقيم الشاذة.
المجتمع
المجموعة الكاملة لجميع الأفراد أو الملاحظات محل الاهتمام في دراسة ما. تُرمز معلمات المجتمع عادةً بالحروف اليونانية (μ, σ).
العينة
مجموعة فرعية من المجتمع يتم اختيارها للتحليل. تُرمز إحصاءات العينة عادةً بالحروف اللاتينية (x̄, s) وتُستخدم لتقدير معلمات المجتمع.
تصحيح بيسل
استخدام n−1 بدلاً من n في المقام عند حساب تباين العينة. يوفر هذا التصحيح تقديراً غير متحيز لتباين المجتمع من العينة.
التوزيع الطبيعي
توزيع احتمالي متماثل على شكل جرس حيث يكون المتوسط والوسيط والمنوال متساوين جميعاً. تتبع العديد من الظواهر الطبيعية توزيعاً طبيعياً تقريبياً.
القاعدة التجريبية (68-95-99.7)
بالنسبة للبيانات الموزعة توزيعاً طبيعياً، تقع حوالي 68% من القيم ضمن ±1σ، و95% ضمن ±2σ، و99.7% ضمن ±3σ من المتوسط.
الدرجة المعيارية (Z-Score)
عدد الانحرافات المعيارية التي تبعدها نقطة بيانات عن المتوسط، وتُحسب بالصيغة Z = (X − μ) / σ. تسمح الدرجات المعيارية بمقارنة القيم من توزيعات مختلفة.
الخطأ المعياري (SE)
الانحراف المعياري لتوزيع العينات لإحصاء ما، وأكثرها شيوعاً هو المتوسط. SE = σ/√n، ويتناقص مع زيادة حجم العينة.
فترة الثقة
مجال من القيم يُرجَّح أن يحتوي على المعلمة الحقيقية للمجتمع بمستوى ثقة محدد (مثلاً 95%). تشير الفترات الأوسع إلى دقة أقل.
القيمة الشاذة
نقطة بيانات تختلف بشكل كبير عن الملاحظات الأخرى. تشمل طرق الكشف الشائعة القيم التي تتجاوز ±2 أو ±3 انحرافات معيارية عن المتوسط.
معامل التباين (CV)
نسبة الانحراف المعياري إلى المتوسط، معبراً عنها كنسبة مئوية (CV = σ/μ × 100%). يسمح بمقارنة التباين بين مجموعات بيانات بمقاييس مختلفة.
الالتواء
مقياس لعدم تماثل توزيع احتمالي. الالتواء الموجب يعني أن الذيل يمتد إلى اليمين؛ والالتواء السالب يعني أنه يمتد إلى اليسار.
التفلطح
مقياس لثقل ذيول توزيع احتمالي. التفلطح العالي يشير إلى ذيول ثقيلة وقمة حادة؛ والتفلطح المنخفض يشير إلى ذيول خفيفة وقمة مسطحة.
درجات الحرية (df)
عدد القيم المستقلة التي يمكن أن تتغير في حساب إحصائي. بالنسبة للانحراف المعياري للعينة، df = n − 1، مما يعكس تصحيح بيسل.
نظرية النهاية المركزية
تنص على أن توزيع العينات لمتوسط العينة يقترب من التوزيع الطبيعي مع زيادة حجم العينة، بغض النظر عن توزيع المجتمع.
اختبار الفرضيات
طريقة إحصائية لاتخاذ القرارات بناءً على البيانات. تتضمن مقارنة إحصاء الاختبار بقيمة حرجة أو قيمة p لتحديد ما إذا كان يجب رفض فرضية العدم.
القيمة الاحتمالية (P-Value)
احتمال ملاحظة نتيجة متطرفة مثل إحصاء الاختبار، بافتراض صحة فرضية العدم. القيم الأصغر توفر دليلاً أقوى ضد فرضية العدم.
معامل الارتباط (r)
قيمة بين −1 و1 تقيس قوة واتجاه العلاقة الخطية بين متغيرين. القيم القريبة من ±1 تشير إلى علاقة خطية قوية.
المدى الربيعي (IQR)
الفرق بين المئين الخامس والسبعين (Q3) والمئين الخامس والعشرين (Q1). يقيس المدى الربيعي انتشار الـ 50% الوسطى من البيانات وهو مقاوم للقيم الشاذة.
المئين
قيمة تقع تحتها نسبة مئوية معينة من الملاحظات. على سبيل المثال، المئين التسعين هو القيمة التي تقع تحتها 90% من نقاط البيانات.