מהי שונות?
שונות מודדת כמה קבוצת מספרים מפוזרת סביב ערכם הממוצע. היא הממוצע של הפרשי הריבוע מהממוצע — והיא הבסיס שעליו בנויה סטיית התקן.
כל עמודה מציגה סטייה ריבועית מהממוצע. שונות = ממוצע עמודות אלה.
נוסחת שונות
שונות אוכלוסייה
σ² = Σ(xᵢ - μ)² / N
שונות מדגם
s² = Σ(xᵢ - x̄)² / (n-1)
1
חישוב הממוצע
חברו את כל הערכים וחלקו בכמותם.
2
מציאת כל סטייה
חסרו את הממוצע מכל נקודת נתונים.
3
ריבוע כל סטייה
זה מבטל ערכים שליליים ומדגיש סטיות גדולות.
4
ממוצע הסטיות הריבועיות
חלקו ב-N (אוכלוסייה) או ב-n-1 (מדגם).
למה מעלים סטיות בריבוע?
שלוש סיבות מרכזיות
1. ביטול ערכים שליליים: ללא ריבוע, סטיות חיוביות ושליליות היו מתקזזות ויוצרות סכום אפס.
2. ענישת חריגים: הריבוע נותן משקל רב יותר לערכים רחוקים מהממוצע.
3. תכונות מתמטיות: לשונות תכונות אלגבריות שימושיות להסקה סטטיסטית.
דוגמה: למה לא להשתמש רק בערכים מוחלטים?
מערך נתונים: 2, 4, 4, 4, 5, 5, 7, 9 (ממוצע = 5)
סטייה מוחלטת ממוצעת:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1.75
שונות (ריבועית):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
שונות לעומת סטיית תקן
The Relationship
Standard Deviation = √Variance → σ = √σ²
שונות (σ²)
- יחידות ריבועיות (למשל, ס“מ², ₪²)
- קשה יותר לפרשנות ישירה
- שימושית לפעולות מתמטיות
- חיבורית עבור משתנים בלתי תלויים
סטיית תקן (σ)
- אותן יחידות כמו הנתונים המקוריים
- קלה יותר לפרשנות
- טובה יותר לתקשורת
- משמשת בציוני z וברווחי סמך
יישומי שונות
בעוד סטיית תקן מדווחת בתדירות גבוהה יותר, לשונות שימושים ספציפיים:
- ANOVA:ניתוח שונות משווה ממוצעים בין קבוצות
- תורת תיקים:שונויות תשואות משמשות באופטימיזציה
- רגרסיה:R² הוא שונות מוסברת חלקי שונות כוללת
- PCA:ניתוח רכיבים ראשיים ממקסם שונות מוסברת