Σ
SDCalc
IntermedioConcetti·8 min

Deviazione standard campionaria e della popolazione: quando usare ciascuna

Scopri la differenza tra deviazione standard campionaria e della popolazione. Comprendi la correzione di Bessel, quando dividere per n-1 o per n, con esempi chiari.

Panoramica

Una delle domande più frequenti in statistica è: “Devo dividere per n o per n-1?” La risposta dipende dal fatto che si stia lavorando con un’intera popolazione o con un semplice campione.

Popolazione (N)

Si usa quando si possiedono i dati di ogni singolo membro del gruppo oggetto di studio. σ = √[Σ(x-μ)² / N]

Campione (n-1)

Si usa quando si dispone di dati provenienti da un sottoinsieme della popolazione più ampia. s = √[Σ(x-x̄)² / (n-1)]

Deviazione standard della popolazione (σ)

La deviazione standard della popolazione si utilizza quando si possiedono le misurazioni di ogni singolo membro del gruppo analizzato. Nella pratica questa situazione è piuttosto rara.

Esempi di popolazioni complete:

  • Tutti i 50 dipendenti di una piccola azienda
  • Ogni studente di una specifica classe di 30 persone
  • Tutte le transazioni di un esercizio fiscale concluso
  • Dati censuari completi di un Paese

Deviazione standard campionaria (s)

La deviazione standard campionaria si utilizza quando si lavora con un sottoinsieme di una popolazione più ampia. Questa è la situazione più comune nelle analisi del mondo reale.

Esempi di campioni:

  • Sondare 1.000 elettori per prevedere i risultati elettorali
  • Testare 50 prodotti da un lotto di 10.000
  • Misurare la pressione arteriosa di 200 pazienti in uno studio clinico
  • Analizzare 5 anni di dati azionari per prevedere la volatilità futura

La correzione di Bessel spiegata

La correzione di Bessel è il motivo per cui si usa (n-1) invece di n nel calcolo della deviazione standard campionaria. Prende il nome dal matematico tedesco Friedrich Bessel e produce una stima non distorta della varianza della popolazione.

Perché funziona (n-1)

Quando si calcola la media campionaria, si “consuma” un grado di libertà. La media campionaria vincola i dati: una volta noti n-1 valori e la media, l’ultimo valore è determinato. Dividere per (n-1) corregge questa perdita di libertà.

Intuizione matematica

I dati campionari tendono a raggrupparsi più vicino alla media campionaria che alla vera media della popolazione. Ciò fa sì che la somma degli scarti al quadrato sia sistematicamente inferiore al valore reale.

Dividere per (n-1) anziché per n aumenta leggermente il risultato, compensando questa sottostima e producendo una stima non distorta.

Quando usare ciascuna

ScenarioUtilizzareDividere per
Si possiedono tutti i dati esistentiDS della popolazione (σ)N
Si descrivono solo i dati disponibiliDS della popolazione (σ)N
Si fa una stima per una popolazione più ampiaDS campionaria (s)n-1
Si userà la DS per la statistica inferenzialeDS campionaria (s)n-1

Regola pratica

In caso di dubbio, usa la deviazione standard campionaria (n-1). È più sicuro perché: - La maggior parte dei dati reali proviene da campioni, non da popolazioni complete - Usare n-1 su una vera popolazione sovrastima leggermente (più sicuro che sottostimare) - Per n grande, la differenza è comunque trascurabile

Esempi pratici

Esempio: Controllo qualità

Una fabbrica produce 10.000 componenti al giorno. Il controllo qualità testa 100 componenti e rileva che il loro peso ha una media di 50 g. Risposta: Usare la DS campionaria (n-1) perché 100 componenti sono un campione dei 10.000 prodotti. Si usa questo campione per stimare la variabilità di tutti i componenti.

Esempio: Voti di una classe

Un’insegnante vuole descrivere la variabilità dei voti di un esame nella sua classe di 25 studenti. Non intende generalizzare i risultati ad altre classi. Risposta: Usare la DS della popolazione (N) perché dispone dei voti dell’intera classe (la sua popolazione di interesse) e non intende fare inferenze su altri gruppi.