סקירה כללית
אחת השאלות הנפוצות ביותר בסטטיסטיקה היא: “האם לחלק ב-n או ב-n-1?” התשובה תלויה בשאלה האם אתם עובדים עם אוכלוסייה שלמה או רק עם מדגם.
אוכלוסייה (N)
מדגם (n-1)
סטיית תקן של אוכלוסייה (σ)
סטיית תקן של אוכלוסייה משמשת כאשר יש לכם מדידות מכל חבר בודד בקבוצה שאתם מנתחים. מצב זה נדיר יחסית בפועל.
דוגמאות לאוכלוסיות אמיתיות:
- כל 50 העובדים בחברה קטנה
- כל תלמיד בכיתה ספציפית של 30
- כל העסקאות בשנת כספים סגורה
- נתוני מפקד שלמים של מדינה
סטיית תקן של מדגם (s)
סטיית תקן של מדגם משמשת כאשר אתם עובדים עם תת-קבוצה של אוכלוסייה גדולה יותר. זה התרחיש השכיח יותר בניתוח בעולם האמיתי.
דוגמאות למדגמים:
- סקר של 1,000 בוחרים לניבוי תוצאות בחירות
- בדיקת 50 מוצרים ממנת ייצור של 10,000
- מדידת לחץ דם של 200 מטופלים במחקר קליני
- ניתוח 5 שנים של נתוני מניות לניבוי תנודתיות עתידית
הסבר תיקון בסל
תיקון בסל הוא הסיבה שאנו משתמשים ב-(n-1) במקום ב-n בחישוב סטיית תקן של מדגם. על שם המתמטיקאי הגרמני פרידריך בסל, התאמה זו מייצרת הערכה חסרת הטיה של שונות האוכלוסייה.
מדוע (n-1) עובד
אינטואיציה מתמטית
נקודות נתונים במדגם נוטות להתקבץ קרוב יותר לממוצע המדגם מאשר לממוצע האוכלוסייה האמיתי. הדבר גורם לסכום הסטיות הריבועיות להיות קטן באופן שיטתי מהערך הנכון.
חלוקה ב-(n-1) במקום ב-n מנפחת מעט את התוצאה, ומפצה על ההערכה הנמוכה ומייצרת הערכה חסרת הטיה.
מתי להשתמש בכל אחת
| תרחיש | שימוש | חלוקה ב- |
|---|---|---|
| יש לכם את כל נקודות הנתונים הקיימות | סטיית תקן אוכלוסייה (σ) | N |
| אתם מתארים רק את הנתונים שברשותכם | סטיית תקן אוכלוסייה (σ) | N |
| אתם מעריכים עבור אוכלוסייה גדולה יותר | סטיית תקן מדגם (s) | n-1 |
| תשתמשו בסטיית תקן לסטטיסטיקה היסקית | סטיית תקן מדגם (s) | n-1 |
כלל אצבע