מהם ערכים חריגים?
ערכים חריגים הם נקודות נתונים השונות באופן משמעותי מתצפיות אחרות. הם יכולים לנבוע משגיאות מדידה, טעויות בהזנת נתונים, או שהם מייצגים מקרים חריגים באמת שראוי לחקור.
הנקודה הכתומה ב-(10, 50) היא ערך חריג
כלל 3-סיגמא
עבור נתונים בהתפלגות נורמלית, נקודות מעבר ל-3 סטיות תקן מהממוצע נחשבות לערכים חריגים. הן מתרחשות פחות מ-0.3% מהזמן במקרה.
חריג אם
דוגמה
שיטת ציון Z
חשבו את ציון ה-Z לכל נקודת נתונים. אם |z| > 3 (או לעיתים 2.5), מדובר בערך חריג.
ציון Z
אפשרויות סף
שיטת IQR (חלופית)
שיטת הטווח הבין-רבעוני (IQR) חסינה יותר לערכים חריגים כי היא אינה משתמשת בממוצע או בסטיית תקן.
שלב 1
שלב 2
שלב 3
שלב 4
שלב 5
טיפול בערכים חריגים
אל תמחקו אוטומטית!