الانحراف المعياري (σ / s)
مقياس لمقدار التباين أو التشتت في مجموعة من القيم. وهو الجذر التربيعي للتباين ويُعبَّر عنه بنفس وحدات البيانات.
المصطلحات والتعريفات الإحصائية الأساسية
مقياس لمقدار التباين أو التشتت في مجموعة من القيم. وهو الجذر التربيعي للتباين ويُعبَّر عنه بنفس وحدات البيانات.
متوسط مربعات الفروقات عن المتوسط. يحدد التباين درجة الانتشار في مجموعة بيانات وهو مربع الانحراف المعياري.
الوسط الحسابي لمجموعة من القيم، يُحسب بجمع جميع القيم وقسمتها على العدد. يمثل النزعة المركزية للبيانات.
القيمة الوسطى في مجموعة بيانات مرتبة. إذا كان عدد القيم زوجياً، فإن الوسيط هو متوسط القيمتين الوسطيتين. وهو مقاوم للقيم الشاذة.
القيمة الأكثر تكراراً في مجموعة بيانات. يمكن أن تحتوي مجموعة البيانات على منوال واحد (أحادية المنوال)، أو عدة منوالات (متعددة المنوال)، أو لا منوال على الإطلاق.
الفرق بين أكبر وأصغر القيم في مجموعة بيانات. رغم سهولة حسابه، فإنه يأخذ في الاعتبار القيمتين المتطرفتين فقط وهو حساس للقيم الشاذة.
المجموعة الكاملة لجميع الأفراد أو الملاحظات محل الاهتمام في دراسة ما. تُرمز معلمات المجتمع عادةً بالحروف اليونانية (μ, σ).
مجموعة فرعية من المجتمع يتم اختيارها للتحليل. تُرمز إحصاءات العينة عادةً بالحروف اللاتينية (x̄, s) وتُستخدم لتقدير معلمات المجتمع.
استخدام n−1 بدلاً من n في المقام عند حساب تباين العينة. يوفر هذا التصحيح تقديراً غير متحيز لتباين المجتمع من العينة.
توزيع احتمالي متماثل على شكل جرس حيث يكون المتوسط والوسيط والمنوال متساوين جميعاً. تتبع العديد من الظواهر الطبيعية توزيعاً طبيعياً تقريبياً.
بالنسبة للبيانات الموزعة توزيعاً طبيعياً، تقع حوالي 68% من القيم ضمن ±1σ، و95% ضمن ±2σ، و99.7% ضمن ±3σ من المتوسط.
عدد الانحرافات المعيارية التي تبعدها نقطة بيانات عن المتوسط، وتُحسب بالصيغة Z = (X − μ) / σ. تسمح الدرجات المعيارية بمقارنة القيم من توزيعات مختلفة.
الانحراف المعياري لتوزيع العينات لإحصاء ما، وأكثرها شيوعاً هو المتوسط. SE = σ/√n، ويتناقص مع زيادة حجم العينة.
مجال من القيم يُرجَّح أن يحتوي على المعلمة الحقيقية للمجتمع بمستوى ثقة محدد (مثلاً 95%). تشير الفترات الأوسع إلى دقة أقل.
نقطة بيانات تختلف بشكل كبير عن الملاحظات الأخرى. تشمل طرق الكشف الشائعة القيم التي تتجاوز ±2 أو ±3 انحرافات معيارية عن المتوسط.
نسبة الانحراف المعياري إلى المتوسط، معبراً عنها كنسبة مئوية (CV = σ/μ × 100%). يسمح بمقارنة التباين بين مجموعات بيانات بمقاييس مختلفة.
مقياس لعدم تماثل توزيع احتمالي. الالتواء الموجب يعني أن الذيل يمتد إلى اليمين؛ والالتواء السالب يعني أنه يمتد إلى اليسار.
مقياس لثقل ذيول توزيع احتمالي. التفلطح العالي يشير إلى ذيول ثقيلة وقمة حادة؛ والتفلطح المنخفض يشير إلى ذيول خفيفة وقمة مسطحة.
عدد القيم المستقلة التي يمكن أن تتغير في حساب إحصائي. بالنسبة للانحراف المعياري للعينة، df = n − 1، مما يعكس تصحيح بيسل.
تنص على أن توزيع العينات لمتوسط العينة يقترب من التوزيع الطبيعي مع زيادة حجم العينة، بغض النظر عن توزيع المجتمع.
طريقة إحصائية لاتخاذ القرارات بناءً على البيانات. تتضمن مقارنة إحصاء الاختبار بقيمة حرجة أو قيمة p لتحديد ما إذا كان يجب رفض فرضية العدم.
احتمال ملاحظة نتيجة متطرفة مثل إحصاء الاختبار، بافتراض صحة فرضية العدم. القيم الأصغر توفر دليلاً أقوى ضد فرضية العدم.
قيمة بين −1 و1 تقيس قوة واتجاه العلاقة الخطية بين متغيرين. القيم القريبة من ±1 تشير إلى علاقة خطية قوية.
الفرق بين المئين الخامس والسبعين (Q3) والمئين الخامس والعشرين (Q1). يقيس المدى الربيعي انتشار الـ 50% الوسطى من البيانات وهو مقاوم للقيم الشاذة.
قيمة تقع تحتها نسبة مئوية معينة من الملاحظات. على سبيل المثال، المئين التسعين هو القيمة التي تقع تحتها 90% من نقاط البيانات.