Szórás (σ / s)
Egy értékhalmaz variációjának vagy szóródásának mértéke. A variancia négyzetgyöke, és az adatokkal azonos mértékegységben fejezik ki.
Kulcsfontosságú statisztikai fogalmak és definíciók
Egy értékhalmaz variációjának vagy szóródásának mértéke. A variancia négyzetgyöke, és az adatokkal azonos mértékegységben fejezik ki.
Az átlagtól vett négyzetes eltérések átlaga. A variancia számszerűsíti a szóródás mértékét egy adathalmazban, és a szórás négyzete.
Egy értékhalmaz számtani középértéke, amelyet az összes érték összeadásával és a darabszámmal való osztással számítunk ki. Az adatok központi tendenciáját képviseli.
A rendezett adathalmaz középső értéke. Ha páros számú érték van, a medián a két középső érték átlaga. Ellenálló a kiugró értékekkel szemben.
Az az érték, amely leggyakrabban fordul elő egy adathalmazban. Egy adathalmaznak lehet egy módusza (unimodális), több módusza (multimodális), vagy egyáltalán nincs módusza.
A legnagyobb és legkisebb érték közötti különbség egy adathalmazban. Bár egyszerűen kiszámítható, csak a két szélső értéket veszi figyelembe, és érzékeny a kiugró értékekre.
Egy vizsgálatban szereplő összes egyednek vagy megfigyelésnek a teljes halmaza. A populációs paramétereket általában görög betűkkel jelölik (μ, σ).
Egy populáció elemzésre kiválasztott részhalmaza. A mintastatisztikákat általában latin betűkkel jelölik (x̄, s), és a populációs paraméterek becslésére használják.
Az n−1 használata n helyett a nevezőben a mintavariancia kiszámításakor. Ez a korrekció torzítatlan becslést ad a populációs varianciára egy mintából.
Egy szimmetrikus, harang alakú valószínűségi eloszlás, ahol az átlag, a medián és a módusz egyenlő. Sok természeti jelenség közelítőleg normális eloszlást követ.
Normális eloszlású adatok esetén az értékek kb. 68%-a esik ±1σ, 95%-a ±2σ, és 99,7%-a ±3σ távolságra az átlagtól.
Egy adatpont átlagtól vett szórásnyi távolsága, Z = (X − μ) / σ képlettel számítva. A z-értékek lehetővé teszik különböző eloszlásokból származó értékek összehasonlítását.
Egy statisztika mintavételi eloszlásának szórása, leggyakrabban az átlagé. SE = σ/√n, és a mintaméret növekedésével csökken.
Egy értéktartomány, amely meghatározott konfidenciaszinten (pl. 95%) valószínűleg tartalmazza a valódi populációs paramétert. A szélesebb intervallumok kisebb pontosságot jeleznek.
Egy adatpont, amely jelentősen különbözik a többi megfigyeléstől. Gyakori felismerési módszerek közé tartoznak az átlagtól ±2 vagy ±3 szórásnál távolabb eső értékek.
A szórás és az átlag aránya, százalékban kifejezve (CV = σ/μ × 100%). Lehetővé teszi a változékonyság összehasonlítását különböző skálájú adathalmazok között.
Egy valószínűségi eloszlás aszimmetriájának mértéke. Pozitív ferdeség azt jelenti, hogy a farok jobbra nyúlik; negatív ferdeség azt jelenti, hogy balra nyúlik.
Egy valószínűségi eloszlás faroktulajdonságának mértéke. Magas csúcsosság nehéz farkakat és éles csúcsot jelez; alacsony csúcsosság könnyű farkakat és lapos csúcsot jelez.
Egy statisztikai számításban szabadon változtatható független értékek száma. Mintaszórás esetén df = n − 1, ami a Bessel-korrekciót tükrözi.
Kimondja, hogy a mintaátlag mintavételi eloszlása a mintaméret növekedésével normális eloszláshoz közelít, függetlenül a populáció eloszlásától.
Statisztikai módszer az adatokon alapuló döntéshozatalhoz. Magában foglalja egy tesztstatisztika összehasonlítását egy kritikus értékkel vagy p-értékkel annak meghatározására, hogy el kell-e utasítani a nullhipotézist.
Annak valószínűsége, hogy a tesztstatisztikához hasonlóan szélsőséges eredményt kapunk, feltéve, hogy a nullhipotézis igaz. A kisebb p-értékek erősebb bizonyítékot nyújtanak a nullhipotézis ellen.
Egy −1 és 1 közötti érték, amely két változó közötti lineáris kapcsolat erősségét és irányát méri. A ±1-hez közeli értékek erős lineáris kapcsolatot jeleznek.
A 75. percentilis (Q3) és a 25. percentilis (Q1) közötti különbség. Az IQR az adatok középső 50%-ának szóródását méri, és ellenálló a kiugró értékekkel szemben.
Az az érték, amely alatt a megfigyelések adott százaléka található. Például a 90. percentilis az az érték, amely alatt az adatpontok 90%-a található.