Σ
SDCalc
מתקדמיםמתקדם·14 min

בדיקת השערות עם סטיית תקן

למדו כיצד סטיית תקן משמשת בבדיקת השערות. הבינו מבחני t, מבחני z, וכיצד לקבוע מובהקות סטטיסטית.

סקירה כללית

בדיקת השערות היא שיטה סטטיסטית לקבלת החלטות לגבי אוכלוסיות על בסיס נתוני מדגם. סטיית תקן ממלאת תפקיד מכריע בקביעה האם הבדלים שנצפו הם מובהקים סטטיסטית או נובעים רק ממקריות.

1

ניסוח השערות

נסחו את השערת האפס (H₀) ואת ההשערה האלטרנטיבית (H₁)
2

בחירת רמת מובהקות

בחרו רמת מובהקות (α), בדרך כלל 0.05
3

חישוב סטטיסטי מבחן

חשבו את הסטטיסטי של המבחן באמצעות סטיית תקן
4

השוואה לערך קריטי

השוו לערך קריטי או חשבו את ערך ה-p
5

קבלת החלטה

קבלו החלטה: דחו או אל תדחו את H₀

מבחן Z

השתמשו במבחן Z כאשר אתם יודעים את סטיית התקן של האוכלוסייה (σ) ויש לכם גודל מדגם גדול (n ≥ 30).

סטטיסטי מבחן Z

z = (x̄ - μ₀) / (σ / √n)

דוגמה

יצרן טוען שסוללות מחזיקות 100 שעות בממוצע (μ₀ = 100). אתם בודקים 36 סוללות ומוצאים x̄ = 98 שעות. אם σ = 12 שעות: z = (98 - 100) / (12 / √36) = -2 / 2 = -1 עם z = -1 ו-α = 0.05 (דו-זנבי), אין אנו דוחים את H₀. ההבדל אינו מובהק סטטיסטית.

מבחן T

השתמשו במבחן t כאשר אינכם יודעים את סטיית התקן של האוכלוסייה וצריכים להעריך אותה מהמדגם (באמצעות s במקום σ).

סטטיסטי מבחן T

t = (x̄ - μ₀) / (s / √n)

מתי להשתמש במבחן T לעומת מבחן Z

- מבחן Z: σ ידוע, n ≥ 30 - מבחן T: σ אינו ידוע (משתמשים ב-s), כל גודל מדגם בפועל, מבחני t נפוצים הרבה יותר כי לעיתים רחוקות אנו יודעים את ה-σ האמיתי של האוכלוסייה.

שגיאת תקן

שגיאת התקן (SE) מודדת עד כמה ממוצעי מדגמים משתנים מממוצע האוכלוסייה. היא הקשר המרכזי בין סטיית תקן לבדיקת השערות.

שגיאת התקן של הממוצע

SE = σ / √n (או s / √n כאשר משתמשים בסטיית תקן של מדגם)

שגיאת התקן יורדת ככל שגודל המדגם עולה. מדגמים גדולים יותר נותנים הערכות מדויקות יותר ומקלים על זיהוי הבדלים אמיתיים.

מובהקות סטטיסטית

תוצאה היא מובהקת סטטיסטית כאשר ההסתברות לצפות בה במקרה (ערך p) נמוכה מהסף שבחרתם (α).

אם ערך p < α

דחו את H₀. התוצאה מובהקת סטטיסטית.

אם ערך p ≥ α

אל תדחו את H₀. התוצאה עשויה לנבוע ממקריות.

מובהקות סטטיסטית לעומת מובהקות מעשית

תוצאה מובהקת סטטיסטית אינה בהכרח חשובה מבחינה מעשית. עם מדגמים גדולים מאוד, הבדלים זעירים יכולים להיות “מובהקים” אך חסרי משמעות בפועל. שקלו תמיד את גודל האפקט לצד ערכי p.