Σ
SDCalc
PrincipianteFundamentals·9 min

Cos'è la Deviazione Standard? Definizione, Formula ed Esempi

Scopri cos'è la deviazione standard, come calcolarla per campioni e popolazioni e perché è fondamentale nell'analisi dei dati. Padroneggia le formule oggi.

By Standard Deviation Calculator Team · Data Science Team·Published

Cos'è la Deviazione Standard?

La deviazione standard è una misura statistica che quantifica l'entità della variazione o della dispersione in un insieme di valori. Una deviazione standard bassa indica che i dati tendono a essere vicini alla media (valore atteso) dell'insieme, mentre una deviazione standard alta indica che i dati sono distribuiti su un intervallo più ampio. Rappresentata dalla lettera greca σ (sigma) per le popolazioni e da s per i campioni, è uno dei concetti più fondamentali nella statistica descrittiva.

Definizione Chiave

La deviazione standard misura la distanza tipica di ciascun punto dati dalla media. Ti dice, in media, di quanto i tuoi dati si discostano dal centro.

Deviazione Standard della Popolazione vs. Campione

Prima di calcolare la deviazione standard, devi determinare se i tuoi dati rappresentano un'intera popolazione o un campione di una popolazione. Una popolazione include tutti i membri di un gruppo specificato, mentre un campione è un sottoinsieme rappresentativo di quel gruppo. Il calcolo della deviazione standard per un campione richiede un aggiustamento matematico, ovvero usare n - 1 (gradi di libertà, o df) invece di N, per garantire che il risultato sia uno stimatore non distorto della varianza della popolazione.

Deviazione Standard della Popolazione

Usata quando si hanno i dati dell'intero gruppo. Denotata con σ. Il denominatore nella formula della varianza è N (la dimensione totale della popolazione).

Deviazione Standard del Campione

Usata quando si ha un sottoinsieme del gruppo. Denotata con s. Il denominatore nella formula della varianza è n - 1 (dimensione del campione meno uno) per correggere il bias.

La Formula della Deviazione Standard Spiegata

Le formule per la deviazione standard si basano sul calcolo prima della varianza, per poi estrarre la radice quadrata. Questo passaggio della radice quadrata è fondamentale perché riporta la misura di dispersione alle unità originali dei dati. I componenti chiave sono xᵢ (ciascun valore individuale), μ o (la media della popolazione o del campione) e N o n (il numero totale di valori).

DS Popolazione

σ = √[ Σ(xᵢ - μ)² / N ]

DS Campione

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Esempio di Calcolo Passo dopo Passo

Calcoliamo la deviazione standard del campione per un piccolo set di dati sui voti di un esame: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Seguendo la formula passo dopo passo, vedremo come si accumula la varianza prima di estrarre la radice quadrata finale.

1

Calcola la Media (x̄)

Somma tutti i valori e dividi per il loro numero: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

Sottrai la Media e Quadra il Risultato

Per ogni valore, trova la differenza al quadrato: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, ecc.
3

Somma le Differenze al Quadrato

Somma tutti i risultati al quadrato: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

Dividi per n - 1 (Gradi di Libertà)

Dividi la somma per la dimensione del campione meno uno: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Questa è la varianza del campione (σ²).
5

Estrai la Radice Quadrata

Calcola la radice quadrata della varianza: √6.4 ≈ 2.53. La deviazione standard del campione è 2.53.

Calcolare la Deviazione Standard in Python

Calcolare la deviazione standard manualmente è soggetto a errori, specialmente con grandi set di dati. Nella pratica, statistici e data scientist usano linguaggi di programmazione come Python per calcolarla istantaneamente usando librerie integrate.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Calcola la deviazione standard del campione (predefinito)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Calcola la deviazione standard della popolazione
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

La Regola Empirica e la Deviazione Standard

Quando i dati seguono una distribuzione normale (curva a campana), la deviazione standard diventa incredibilmente predittiva. La Regola Empirica, nota anche come regola 68-95-99.7, afferma che quasi tutti i dati ricadranno entro tre deviazioni standard dalla media. Questo permette agli analisti di identificare rapidamente i valori anomali e di comprendere la probabilità che si verifichi un'osservazione specifica.

Intervallo dalla MediaPercentuale di DatiApplicazione
±1σ68.27%Identificare valori tipici e quotidiani
±2σ95.45%Impostare intervalli di confidenza
±3σ99.73%Rilevare valori anomali estremi

Deviazione Standard vs. Varianza

Varianza e deviazione standard sono misure di dispersione strettamente correlate. La varianza (σ² o s²) è la media delle differenze al quadrato rispetto alla media, mentre la deviazione standard è la radice quadrata della varianza. Poiché la varianza è espressa in unità al quadrato (ad es. euro al quadrato, centimetri quadrati), può essere difficile da interpretare nel contesto dei dati originali. La deviazione standard risolve questo problema convertendo la misura nelle unità originali.

Riportare i Dati

Riporta sempre la deviazione standard insieme alla media quando descrivi i tuoi dati. Poiché la DS è nelle stesse unità della media (es. euro, centimetri, chilogrammi), fornisce una misura intuitiva della dispersione che il tuo pubblico può comprendere immediatamente.

Errori Comuni da Evitare

Sebbene la deviazione standard sia uno strumento potente, viene spesso usata in modo improprio. L'applicazione errata delle formule o l'incomprensione di ciò che il valore rappresenta può portare a un'analisi dei dati difettosa e a conclusioni errate.

  • Usare la formula della popolazione per un campione: Dimenticare di usare n - 1 per i campioni riduce artificialmente la dispersione calcolata, sottostimando la vera varianza della popolazione.
  • Applicare la DS a distribuzioni non normali: La Regola Empirica si applica solo alle distribuzioni normali. Per dati fortemente asimmetrici, la DS potrebbe non riflettere accuratamente la dispersione.
  • Confondere la DS con l'Errore Standard: L'errore standard misura la precisione della stima di una media campionaria, mentre la deviazione standard misura la dispersione dei dati sottostanti stessi.

Attenzione ai Valori Anomali

La deviazione standard è altamente sensibile ai valori anomali estremi. Poiché la formula eleva al quadrato le differenze dalla media, un singolo valore anomalo di entità sproporzionata può gonfiare la deviazione standard, facendo sembrare i dati più variabili di quanto non siano in realtà.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipedia: Deviazione standard
  2. NIST/SEMATECH Manuale Elettronico di Metodi Statistici
  3. Khan Academy: Statistica e Probabilità