Wat is de normale verdeling?
De normale verdeling, ook wel de Gaussverdeling of “klokcurve” genoemd, is de belangrijkste kansverdeling in de statistiek. Ze beschrijft hoe gegevenswaarden verdeeld zijn rond een centraal gemiddelde.
The Classic Bell Curve
De normale verdeling wordt volledig bepaald door slechts twee parameters: het gemiddelde (μ) dat het centrum bepaalt, en de standaardafwijking (σ) die de spreiding bepaalt.
Belangrijke eigenschappen
Symmetrie
Gemiddelde = Mediaan = Modus
Asymptotisch
Totale oppervlakte = 1
Hoe standaardafwijking de vorm beïnvloedt
Standaardafwijking bepaalt de “spreiding” van de normale verdeling. Een kleinere σ creëert een hoge, smalle curve; een grotere σ creëert een lage, brede curve.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Z-scores en standaardisatie
Een z-score vertelt u hoeveel standaardafwijkingen een waarde van het gemiddelde verwijderd is. Dit stelt u in staat waarden uit verschillende normale verdelingen te vergelijken.
Z-scoreformule
| Z-score | Betekenis | Percentiel |
|---|---|---|
| -2 | 2 SD onder het gemiddelde | ~2,3% |
| -1 | 1 SD onder het gemiddelde | ~15,9% |
| 0 | Op het gemiddelde | 50% |
| +1 | 1 SD boven het gemiddelde | ~84,1% |
| +2 | 2 SD boven het gemiddelde | ~97,7% |
Praktijkvoorbeelden
Veel natuurlijke verschijnselen volgen een normale verdeling:
- Lichaamslengte:De meeste mensen zijn rond de gemiddelde lengte, met minder zeer lange of zeer kleine individuen
- IQ-scores:Ontworpen om een normale verdeling te volgen met gemiddelde 100 en SD 15
- Meetfouten:Willekeurige fouten bij wetenschappelijke metingen
- Bloeddruk:Bloeddrukwaarden in de bevolking
Wanneer gegevens niet normaal verdeeld zijn
Niet alle gegevens volgen een normale verdeling. Wees voorzichtig met:
Niet-normale verdelingen