שתי דרכים למדוד פיזור
הן טווח והן סטיית תקן מודדים כמה הנתונים מפוזרים, אך הם לוכדים היבטים שונים מהותית של הפיזור. הבנת מתי להשתמש בכל אחד חיונית לניתוח נתונים נכון.
הטווח מספר על הקצוות — כמה רחוקים הערך הגבוה ביותר והנמוך ביותר. סטיית תקן מספרת על הפיזור האופייני סביב הממוצע. שניהם שימושיים, אך למטרות שונות.
מדריך החלטה מהיר
השתמשו בטווח כשאכפת לכם מהקצוות (גבולות בקרת איכות, שונות טמפרטורה). השתמשו בסטיית תקן כשאכפת לכם מהשתנות אופיינית ואתם זקוקים לקפדנות סטטיסטית.
הגדרות ונוסחאות
טווח
טווח = מקסימום - מינימום
מדד הפיזור הפשוט ביותר. מתחשב רק בשני ערכים, ללא קשר לגודל מערך הנתונים.
סטיית תקן
s = √[Σ(xᵢ - x̄)² / (n-1)]
משתמשת בכל נקודת נתונים למדידת המרחק הממוצע מהממוצע.
השוואה ישירה
יתרונות וחסרונות הטווח
יתרונות:
- פשוט ביותר לחישוב — רק חיסור
- קל להבנה ולתקשורת
- מציג ישירות את מתח הנתונים
- שימושי לבדיקות איכות מהירות
חסרונות:
- מתעלם מכל הערכים האמצעיים
- רגיש ביותר לחריגים
- צפוי לגדול עם גודל המדגם
- לא יעיל סטטיסטית
יתרונות וחסרונות סט“ת
יתרונות:
- משתמשת בכל נקודות הנתונים
- יעילה סטטיסטית וחסינה
- יציבה עם הגדלת המדגם
- בסיס לסטטיסטיקה מתקדמת
חסרונות:
- מורכבת יותר לחישוב ידני
- פחות אינטואיטיבית למי שאינם סטטיסטיקאים
- עלולה להסתיר ערכים קיצוניים חשובים
- עדיין מושפעת מחריגים (השתמשו ב-MAD במקום)
מתי להשתמש בכל אחד
השתמשו בטווח כאשר:
- דרוש אומדן גס ומהיר של פיזור
- ערכים קיצוניים הם מה שחשוב (למשל, טווח טמפרטורות לתכנון מיזוג אוויר)
- ידוע שהנתונים נקיים ללא חריגים
- מתקשרים עם קהל שאינו מכיר סטטיסטיקה
- גודל המדגם קטן וקבוע (אותו גודל לכל ההשוואות)
השתמשו בסטיית תקן כאשר:
- מבצעים ניתוח סטטיסטי או בדיקות השערות
- משווים שונות בין גדלי מדגם שונים
- מחשבים רווחי סמך או ערכי p
- מעריכים שתנות אופיינית ולא קצוות
- הנתונים עלולים להכיל חריגים שלא צריכים לשלוט במדד
דוגמאות מעשיות
דוגמה: טמפרטורות יומיות
נתונים: 22°C, 24°C, 23°C, 23°C, 24°C, 22°C, 23°C
טווח: 24 - 22 = 2°C (תנודת הטמפרטורה)
סט“ת: 0.82°C (שונות אופיינית מיום ליום)
שניהם שימושיים — טווח לקיבולת מיזוג אוויר, סט“ת לעקביות נוחות.
דוגמה: ציוני מבחן עם חריג
נתונים: 85, 88, 87, 86, 89, 42 (תלמיד אחד לא למד)
טווח: 89 - 42 = 47 נקודות (נשלט על ידי החריג!)
סט“ת: 17.4 נקודות (עדיין מושפעת אך פחות)
הטווח מטעה כאן. שקלו שימוש בסט“ת או הסרת החריג.
שיקולים מתקדמים
הקשר בין טווח לסט“ת: לנתונים מתפלגים נורמלית, טווח ≈ 4-6 × סט“ת לגדלי מדגם אופייניים. זה מאפשר המרה גסה ביניהם.
טווח בין-רבעוני (IQR): פשרה המשתמשת ב-Q3 - Q1 במקום מקסימום - מינימום. חסין יותר מטווח ופשוט יותר מסט“ת.
שיטה מומלצת
דווחו על שני המדדים כשזה מתאים. “טווח הטמפרטורה היה 15°C (סט“ת = 4.2°C)” נותן לקוראים מידע מלא הן על הקצוות והן על השונות האופיינית.