Σ
SDCalc
מתחיליםFundamentals·10 min

הבנת שונות: הבסיס לסטיית תקן

שליטה במושג השונות ובקשר שלה לסטיית תקן. למדו נוסחאות, חישובים ויישומים מעשיים של שונות בסטטיסטיקה.

מהי שונות?

שונות מודדת כמה קבוצת מספרים מפוזרת סביב ערכם הממוצע. היא הממוצע של הפרשי הריבוע מהממוצע — והיא הבסיס שעליו בנויה סטיית התקן.

כל עמודה מציגה סטייה ריבועית מהממוצע. שונות = ממוצע עמודות אלה.

נוסחת שונות

שונות אוכלוסייה

σ² = Σ(xᵢ - μ)² / N

שונות מדגם

s² = Σ(xᵢ - x̄)² / (n-1)
1

חישוב הממוצע

חברו את כל הערכים וחלקו בכמותם.
2

מציאת כל סטייה

חסרו את הממוצע מכל נקודת נתונים.
3

ריבוע כל סטייה

זה מבטל ערכים שליליים ומדגיש סטיות גדולות.
4

ממוצע הסטיות הריבועיות

חלקו ב-N (אוכלוסייה) או ב-n-1 (מדגם).

למה מעלים סטיות בריבוע?

שלוש סיבות מרכזיות

1. ביטול ערכים שליליים: ללא ריבוע, סטיות חיוביות ושליליות היו מתקזזות ויוצרות סכום אפס. 2. ענישת חריגים: הריבוע נותן משקל רב יותר לערכים רחוקים מהממוצע. 3. תכונות מתמטיות: לשונות תכונות אלגבריות שימושיות להסקה סטטיסטית.

דוגמה: למה לא להשתמש רק בערכים מוחלטים?

מערך נתונים: 2, 4, 4, 4, 5, 5, 7, 9 (ממוצע = 5) סטייה מוחלטת ממוצעת: |2-5| + |4-5| + ... = 14 MAD = 14/8 = 1.75 שונות (ריבועית): (2-5)² + (4-5)² + ... = 32 Var = 32/8 = 4

שונות לעומת סטיית תקן

The Relationship

Standard Deviation = √Variance → σ = √σ²

שונות (σ²)

- יחידות ריבועיות (למשל, ס“מ², ₪²) - קשה יותר לפרשנות ישירה - שימושית לפעולות מתמטיות - חיבורית עבור משתנים בלתי תלויים

סטיית תקן (σ)

- אותן יחידות כמו הנתונים המקוריים - קלה יותר לפרשנות - טובה יותר לתקשורת - משמשת בציוני z וברווחי סמך

יישומי שונות

בעוד סטיית תקן מדווחת בתדירות גבוהה יותר, לשונות שימושים ספציפיים:

  • ANOVA:ניתוח שונות משווה ממוצעים בין קבוצות
  • תורת תיקים:שונויות תשואות משמשות באופטימיזציה
  • רגרסיה:R² הוא שונות מוסברת חלקי שונות כוללת
  • PCA:ניתוח רכיבים ראשיים ממקסם שונות מוסברת