Che cos’è la distribuzione normale?
La distribuzione normale, chiamata anche distribuzione gaussiana o “curva a campana”, è la distribuzione di probabilità più importante nella statistica. Descrive come i valori dei dati si distribuiscono attorno a un valore medio centrale.
The Classic Bell Curve
La distribuzione normale è completamente definita da soli due parametri: la media (μ) che ne determina il centro, e la deviazione standard (σ) che ne determina la dispersione.
Proprietà principali
Simmetria
Media = Mediana = Moda
Asintotica
Area totale = 1
Come la deviazione standard influenza la forma
La deviazione standard controlla la “dispersione” della distribuzione normale. Un σ più piccolo crea una curva alta e stretta; un σ più grande crea una curva bassa e larga.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Punteggi Z e standardizzazione
Il punteggio Z indica quante deviazioni standard un valore dista dalla media. Questo permette di confrontare valori provenienti da distribuzioni normali diverse.
Formula del punteggio Z
| Punteggio Z | Significato | Percentile |
|---|---|---|
| -2 | 2 DS sotto la media | ~2,3% |
| -1 | 1 DS sotto la media | ~15,9% |
| 0 | Alla media | 50% |
| +1 | 1 DS sopra la media | ~84,1% |
| +2 | 2 DS sopra la media | ~97,7% |
Esempi dal mondo reale
Molti fenomeni naturali seguono una distribuzione normale:
- Altezze umane:La maggior parte delle persone ha un’altezza vicina alla media, con pochi individui molto alti o molto bassi
- Punteggi QI:Progettati per seguire una distribuzione normale con media 100 e DS 15
- Errori di misurazione:Errori casuali nelle misurazioni scientifiche
- Pressione arteriosa:Valori di pressione arteriosa nella popolazione
Quando i dati non sono normali
Non tutti i dati seguono una distribuzione normale. Bisogna fare attenzione con:
Distribuzioni non normali