Σ
SDCalc
متوسطالتطبيقات·9 min

كشف القيم المتطرفة باستخدام الانحراف المعياري

تعلّم كيفية تحديد القيم المتطرفة في بياناتك باستخدام الانحراف المعياري. أتقن قاعدة 3-سيجما وطريقة المدى الربيعي وافهم متى يجب إزالة القيم المتطرفة.

ما هي القيم المتطرفة؟

القيم المتطرفة هي نقاط بيانات تختلف بشكل ملحوظ عن الملاحظات الأخرى. قد تنتج عن أخطاء في القياس أو أخطاء في إدخال البيانات، أو قد تمثل حالات غير اعتيادية حقيقية تستحق التحقيق.

النقطة البرتقالية عند (10, 50) هي قيمة متطرفة

قاعدة 3-سيجما

بالنسبة للبيانات ذات التوزيع الطبيعي، تُعتبر النقاط التي تتجاوز 3 انحرافات معيارية من المتوسط قيمًا متطرفة. تحدث أقل من 0.3% من الوقت بالصدفة.

قيمة متطرفة إذا

x < μ - 3σ OR x > μ + 3σ

مثال

إذا كانت درجات الاختبار لها μ = 75 وσ = 10: - الحد الأدنى: 75 - 30 = 45 - الحد الأعلى: 75 + 30 = 105 - أي درجة أقل من 45 أو أعلى من 105 تُعد قيمة متطرفة

طريقة الدرجة المعيارية

احسب الدرجة المعيارية لكل نقطة بيانات. إذا كانت |z| > 3 (أو أحيانًا 2.5)، فهي قيمة متطرفة.

الدرجة المعيارية

z = (x - μ) / σ

خيارات العتبة

- |z| > 3: متحفظ (يلتقط قيمًا متطرفة أقل) - |z| > 2.5: معتدل - |z| > 2: متساهل (يلتقط قيمًا متطرفة أكثر)

طريقة المدى الربيعي (بديل)

طريقة المدى الربيعي (IQR) أكثر متانة تجاه القيم المتطرفة لأنها لا تستخدم المتوسط أو الانحراف المعياري.

1

الخطوة 1

أوجد Q1 (المئين الخامس والعشرون) وQ3 (المئين الخامس والسبعون)
2

الخطوة 2

احسب IQR = Q3 - Q1
3

الخطوة 3

الحد الأدنى = Q1 - 1.5 × IQR
4

الخطوة 4

الحد الأعلى = Q3 + 1.5 × IQR
5

الخطوة 5

النقاط خارج الحدود هي قيم متطرفة

التعامل مع القيم المتطرفة

لا تحذفها تلقائيًا!

القيم المتطرفة ليست دائمًا أخطاء. قبل إزالتها، حقق في: - هل هي خطأ في إدخال البيانات أو القياس؟ - هل هي قيمة متطرفة حقيقية؟ - هل تمثل حالة حافة مهمة؟

متى تُزيلها

- أخطاء مؤكدة في إدخال البيانات - عطل في معدات القياس - خارج النطاق الممكن للقيم

متى تُبقيها

- تمثل تباينًا حقيقيًا - مهمة لتحليلك - إزالتها ستحيّز النتائج