Σ
SDCalc
IntermediarConcepte·8 min

Deviația standard de eșantion vs. de populație: când să le folosești

Învață diferența dintre deviația standard de eșantion și de populație. Înțelege corecția lui Bessel, când să folosești n-1 vs n, cu exemple clare.

Prezentare generală

Una dintre cele mai frecvente întrebări în statistică este: “Ar trebui să împart la n sau la n-1?” Răspunsul depinde de lucrul cu o populație întreagă sau doar cu un eșantion.

Populație (N)

Folosește când ai date pentru fiecare membru al grupului studiat. σ = √[Σ(x-μ)² / N]

Eșantion (n-1)

Folosește când ai date de la un subset al populației mai mari. s = √[Σ(x-x̄)² / (n-1)]

Deviația standard a populației (σ)

Deviația standard a populației se folosește atunci când ai măsurători de la fiecare membru al grupului pe care îl analizezi. Acest lucru este relativ rar în practică.

Exemple de populații reale:

  • Toți cei 50 de angajați dintr-o companie mică
  • Fiecare elev dintr-o clasă specifică de 30
  • Toate tranzacțiile dintr-un an fiscal încheiat
  • Datele complete ale recensământului unei țări

Deviația standard a eșantionului (s)

Deviația standard a eșantionului se folosește atunci când lucrezi cu un subset al unei populații mai mari. Acesta este scenariul mai frecvent în analiza din lumea reală.

Exemple de eșantioane:

  • Sondarea a 1.000 de alegători pentru a prezice rezultatele alegerilor
  • Testarea a 50 de produse dintr-un lot de producție de 10.000
  • Măsurarea tensiunii arteriale a 200 de pacienți într-un studiu clinic
  • Analiza a 5 ani de date bursiere pentru a prezice volatilitatea viitoare

Corecția lui Bessel explicată

Corecția lui Bessel este motivul pentru care folosim (n-1) în loc de n la calcularea deviației standard a eșantionului. Numită după matematicianul german Friedrich Bessel, această ajustare produce o estimare nedeformată a varianței populației.

De ce funcționează (n-1)

Când calculezi media eșantionului, “folosești” un grad de libertate. Media eșantionului constrânge datele — odată ce cunoști n-1 valori și media, ultima valoare este determinată. Împărțirea la (n-1) corectează această pierdere de libertate.

Intuiția matematică

Punctele de date ale eșantionului tind să se grupeze mai aproape de media eșantionului decât de media reală a populației. Acest lucru face ca suma abaterilor pătratice să fie sistematic mai mică decât ar trebui.

Împărțirea la (n-1) în loc de n mărește ușor rezultatul, compensând această subestimare și producând o estimare nedeformată.

Când să le folosești

ScenariuFoloseșteÎmparte la
Ai toate punctele de date existenteDS a populației (σ)N
Descrii doar datele pe care le aiDS a populației (σ)N
Estimezi pentru o populație mai mareDS a eșantionului (s)n-1
Vei folosi DS pentru statistică inferențialăDS a eșantionului (s)n-1

Regulă generală

Când ai dubii, folosește deviația standard a eșantionului (n-1). Este mai sigură deoarece: - Majoritatea datelor din lumea reală provin din eșantioane, nu din populații complete - Folosirea n-1 pe o populație reală supraestimează ușor (mai sigur decât subestimarea) - Pentru n mare, diferența este oricum neglijabilă

Exemple practice

Exemplu: Control al calității

O fabrică produce 10.000 de piese pe zi. Controlul calității testează 100 de piese și constată că greutățile lor au o medie de 50g. Răspuns: Folosește DS a eșantionului (n-1) deoarece 100 de piese reprezintă un eșantion din cele 10.000 produse. Folosești acest eșantion pentru a estima variabilitatea tuturor pieselor.

Exemplu: Note la clasă

O profesoară vrea să descrie variabilitatea notelor la test pentru clasa ei de 25 de elevi. Nu încearcă să generalizeze la alte clase. Răspuns: Folosește DS a populației (N) deoarece are notele pentru întreaga clasă (populația ei de interes) și nu face inferențe despre alte grupuri.