Σ
SDCalc
בינונייםמושגים·8 min

סטיית תקן של מדגם לעומת אוכלוסייה: מתי להשתמש בכל אחת

למדו את ההבדל בין סטיית תקן של מדגם לאוכלוסייה. הבינו את תיקון בסל, מתי להשתמש ב-n-1 לעומת n, עם דוגמאות ברורות.

סקירה כללית

אחת השאלות הנפוצות ביותר בסטטיסטיקה היא: “האם לחלק ב-n או ב-n-1?” התשובה תלויה בשאלה האם אתם עובדים עם אוכלוסייה שלמה או רק עם מדגם.

אוכלוסייה (N)

השתמשו כאשר יש לכם נתונים עבור כל חבר בקבוצה שאתם חוקרים. σ = √[Σ(x-μ)² / N]

מדגם (n-1)

השתמשו כאשר יש לכם נתונים מתת-קבוצה של האוכלוסייה הגדולה יותר. s = √[Σ(x-x̄)² / (n-1)]

סטיית תקן של אוכלוסייה (σ)

סטיית תקן של אוכלוסייה משמשת כאשר יש לכם מדידות מכל חבר בודד בקבוצה שאתם מנתחים. מצב זה נדיר יחסית בפועל.

דוגמאות לאוכלוסיות אמיתיות:

  • כל 50 העובדים בחברה קטנה
  • כל תלמיד בכיתה ספציפית של 30
  • כל העסקאות בשנת כספים סגורה
  • נתוני מפקד שלמים של מדינה

סטיית תקן של מדגם (s)

סטיית תקן של מדגם משמשת כאשר אתם עובדים עם תת-קבוצה של אוכלוסייה גדולה יותר. זה התרחיש השכיח יותר בניתוח בעולם האמיתי.

דוגמאות למדגמים:

  • סקר של 1,000 בוחרים לניבוי תוצאות בחירות
  • בדיקת 50 מוצרים ממנת ייצור של 10,000
  • מדידת לחץ דם של 200 מטופלים במחקר קליני
  • ניתוח 5 שנים של נתוני מניות לניבוי תנודתיות עתידית

הסבר תיקון בסל

תיקון בסל הוא הסיבה שאנו משתמשים ב-(n-1) במקום ב-n בחישוב סטיית תקן של מדגם. על שם המתמטיקאי הגרמני פרידריך בסל, התאמה זו מייצרת הערכה חסרת הטיה של שונות האוכלוסייה.

מדוע (n-1) עובד

כאשר מחשבים ממוצע מדגם, אתם “משתמשים” בדרגת חופש אחת. ממוצע המדגם מגביל את הנתונים — ברגע שאתם יודעים n-1 ערכים ואת הממוצע, הערך האחרון נקבע. חלוקה ב-(n-1) מתקנת את אובדן החופש הזה.

אינטואיציה מתמטית

נקודות נתונים במדגם נוטות להתקבץ קרוב יותר לממוצע המדגם מאשר לממוצע האוכלוסייה האמיתי. הדבר גורם לסכום הסטיות הריבועיות להיות קטן באופן שיטתי מהערך הנכון.

חלוקה ב-(n-1) במקום ב-n מנפחת מעט את התוצאה, ומפצה על ההערכה הנמוכה ומייצרת הערכה חסרת הטיה.

מתי להשתמש בכל אחת

תרחיששימושחלוקה ב-
יש לכם את כל נקודות הנתונים הקיימותסטיית תקן אוכלוסייה (σ)N
אתם מתארים רק את הנתונים שברשותכםסטיית תקן אוכלוסייה (σ)N
אתם מעריכים עבור אוכלוסייה גדולה יותרסטיית תקן מדגם (s)n-1
תשתמשו בסטיית תקן לסטטיסטיקה היסקיתסטיית תקן מדגם (s)n-1

כלל אצבע

כאשר יש ספק, השתמשו בסטיית תקן של מדגם (n-1). זה בטוח יותר כי: - רוב הנתונים בעולם האמיתי מגיעים ממדגמים, לא מאוכלוסיות שלמות - שימוש ב-n-1 על אוכלוסייה אמיתית מעריך מעט ביתר (בטוח יותר מאשר להעריך בחסר) - עבור n גדול, ההבדל זניח ממילא

דוגמאות מעשיות

דוגמה: בקרת איכות

מפעל מייצר 10,000 רכיבים ביום. בקרת האיכות בודקת 100 רכיבים ומוצאת שמשקלם הממוצע הוא 50 גרם. תשובה: השתמשו בסטיית תקן של מדגם (n-1) כי 100 רכיבים הם מדגם מתוך 10,000 שיוצרו. אתם משתמשים במדגם זה כדי להעריך את השונות של כל הרכיבים.

דוגמה: ציוני כיתה

מורה רוצה לתאר את השונות בציוני מבחן בכיתה שלה בת 25 תלמידים. היא לא מנסה להכליל לכיתות אחרות. תשובה: השתמשו בסטיית תקן של אוכלוסייה (N) כי יש לה ציונים עבור הכיתה כולה (האוכלוסייה הרלוונטית שלה) והיא לא מסיקה מסקנות על קבוצות אחרות.