Hvad er normalfordeling?
Normalfordelingen, også kaldet Gaussfordelingen eller “klokkekurven”, er den vigtigste sandsynlighedsfordeling i statistik. Den beskriver, hvordan dataværdier er fordelt omkring en central middelværdi.
The Classic Bell Curve
Normalfordelingen er fuldstændig defineret af kun to parametre: gennemsnittet (μ), som bestemmer centrum, og standardafvigelsen (σ), som bestemmer spredningen.
Vigtige egenskaber
Symmetri
Gennemsnit = Median = Typetal
Asymptotisk
Samlet areal = 1
Hvordan standardafvigelse påvirker formen
Standardafvigelse styrer “spredningen” af normalfordelingen. En mindre σ skaber en høj, smal kurve; en større σ skaber en kort, bred kurve.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Z-scorer og standardisering
En z-score fortæller dig, hvor mange standardafvigelser en værdi er fra gennemsnittet. Dette giver dig mulighed for at sammenligne værdier fra forskellige normalfordelinger.
Z-score-formel
| Z-score | Betydning | Percentil |
|---|---|---|
| -2 | 2 SA under gennemsnittet | ~2,3% |
| -1 | 1 SA under gennemsnittet | ~15,9% |
| 0 | Ved gennemsnittet | 50% |
| +1 | 1 SA over gennemsnittet | ~84,1% |
| +2 | 2 SA over gennemsnittet | ~97,7% |
Eksempler fra den virkelige verden
Mange naturfænomener følger en normalfordeling:
- Menneskehøjder:De fleste mennesker er tæt på gennemsnitshøjden, med færre meget høje eller meget lave individer
- IQ-scorer:Designet til at følge en normalfordeling med gennemsnit 100 og SA 15
- Målefejl:Tilfældige fejl i videnskabelige målinger
- Blodtryk:Blodtryksmålinger i en population
Når data ikke er normalfordelt
Ikke alle data følger en normalfordeling. Vær forsigtig med:
Ikke-normale fordelinger