Mi a konfidenciaintervallum?
A konfidenciaintervallum (CI) egy értéktartomány, amely valószínűleg tartalmazza a valódi populációs paramétert. Egyetlen pontbecslés helyett a CI a bizonytalanságot is figyelembe veszi egy tartomány megadásával.
“95%-os bizonyossággal állítjuk, hogy a valódi átlag 48,2 és 51,8 közé esik”
95% CI: [48,2; 51,8]
A képlet
A populációs átlagra vonatkozó konfidenciaintervallum:
Konfidenciaintervallum képlete
CI = x̄ ± z* × (σ / √n)
- x̄ = mintaátlag
- z* = kritikus érték (1,96 a 95%-os CI-hez)
- σ = szórás
- n = mintaméret
- σ/√n = standard hiba
| Konfidenciaszint | z* érték |
|---|---|
| 90% | 1,645 |
| 95% | 1,960 |
| 99% | 2,576 |
Helyes értelmezés
Gyakori tévhit
A 95%-os CI NEM azt jelenti, hogy “95% a valószínűsége, hogy a valódi átlag ebben az intervallumban van.” A valódi átlag vagy benne van, vagy nincs — ez egy rögzített érték.
Helyes értelmezés
“Ha sokszor megismételnénk ezt a mintavételi eljárást, a kiszámított intervallumok 95%-a tartalmazná a valódi populációs átlagot.”
Kidolgozott példák
Példa: Ügyfél-elégedettség
100 ügyfelet kérdezel meg, és az átlagos elégedettségi pontszám 7,5, a szórás 1,5. Számítsd ki a 95%-os CI-t.
1
Számítsd ki a standard hibát
SE = 1,5 / √100 = 0,15
2
Számítsd ki a hibahatárt
ME = 1,96 × 0,15 = 0,294
3
Építsd meg az intervallumot
CI = 7,5 ± 0,294 = [7,21; 7,79]
Értelmezés: 95%-os bizonyossággal állítjuk, hogy az ügyfél-elégedettség valódi átlaga 7,21 és 7,79 között van.
Mi befolyásolja a CI szélességét?
Mintaméret (n)
Nagyobb n = szűkebb CI
Több adat = nagyobb pontosság
Szórás (σ)
Nagyobb σ = szélesebb CI
Nagyobb változékonyság = kisebb bizonyosság
Konfidenciaszint
Magasabb konfidencia = szélesebb CI
A 99%-os CI szélesebb, mint a 95%-os CI