Două moduri de a măsura dispersia
Atât amplitudinea (range), cât și deviația standard măsoară cât de răspândite sunt datele, dar surprind aspecte fundamental diferite ale dispersiei. A înțelege când să folosești fiecare este esențial pentru o analiză corectă a datelor.
Amplitudinea îți spune despre extreme — cât de departe sunt cele mai mari și cele mai mici valori. Deviația standard îți spune despre dispersia tipică în jurul mediei. Ambele sunt utile, dar în scopuri diferite.
Ghid rapid de decizie
Folosește amplitudinea când te interesează extremele (limite de control al calității, variația temperaturii). Folosește deviația standard când te interesează variabilitatea tipică și ai nevoie de rigoare statistică.
Definiții și formule
Amplitudinea
Amplitudine = Maximum - Minimum
Cea mai simplă măsură a dispersiei. Ia în considerare doar două valori, indiferent de dimensiunea setului de date.
Deviația standard
s = √[Σ(xᵢ - x̄)² / (n-1)]
Utilizează fiecare punct de date pentru a măsura distanța medie față de medie.
Comparație directă
Avantaje și dezavantaje ale amplitudinii
Avantaje:
- Extrem de simplă de calculat — doar o scădere
- Ușor de înțeles și comunicat
- Arată direct întinderea datelor
- Utilă pentru verificări rapide de calitate
Dezavantaje:
- Ignoră toate valorile de mijloc
- Extrem de sensibilă la valori aberante
- Tinde să crească odată cu dimensiunea eșantionului
- Ineficientă din punct de vedere statistic
Avantaje și dezavantaje ale DS
Avantaje:
- Utilizează toate punctele de date
- Eficientă din punct de vedere statistic și robustă
- Stabilă pe măsură ce dimensiunea eșantionului crește
- Baza statisticilor avansate
Dezavantaje:
- Mai complexă de calculat manual
- Mai puțin intuitivă pentru non-statisticieni
- Poate ascunde valori extreme importante
- Totuși afectată de valori aberante (folosește MAD în schimb)
Când să folosești fiecare măsură
Folosește amplitudinea când:
- Ai nevoie de o estimare rapidă și aproximativă a dispersiei
- Valorile extreme sunt cele care contează (de ex., intervalul de temperatură pentru proiectarea HVAC)
- Se știe că datele sunt curate, fără valori aberante
- Comunici cu un public nefamiliarizat cu statistica
- Dimensiunea eșantionului este mică și fixă (aceeași dimensiune pentru toate comparațiile)
Folosește deviația standard când:
- Efectuezi analiză statistică sau teste de ipoteze
- Compari variabilitatea între eșantioane de dimensiuni diferite
- Calculezi intervale de încredere sau valori p
- Evaluezi variația tipică, nu extremele
- Datele pot conține valori aberante care nu ar trebui să domine măsura
Exemple practice
Exemplu: temperaturi zilnice
Date: 72°F, 75°F, 74°F, 73°F, 76°F, 71°F, 74°F
Amplitudine: 76 - 71 = 5°F (oscilația de temperatură)
DS: 1,72°F (variația tipică de la o zi la alta)
Ambele sunt utile aici — amplitudinea pentru capacitatea HVAC, DS pentru consistența confortului.
Exemplu: note la test cu valoare aberantă
Date: 85, 88, 87, 86, 89, 42 (un elev nu a studiat)
Amplitudine: 89 - 42 = 47 puncte (dominată de valoarea aberantă!)
DS: 17,4 puncte (afectată, dar mai puțin)
Amplitudinea este înșelătoare aici. Ia în considerare folosirea DS sau eliminarea valorii aberante.
Considerații avansate
Relația dintre amplitudine și DS: Pentru date distribuite normal, amplitudinea ≈ 4-6 × DS pentru dimensiuni tipice ale eșantionului. Aceasta permite conversii aproximative între ele.
Intervalul intercuartilic (IQR): Un compromis care folosește Q3 - Q1 în loc de max - min. Este mai robust decât amplitudinea, dar mai simplu decât DS.
Bună practică
Raportează ambele măsuri atunci când este adecvat. “Intervalul de temperatură a fost de 15°F (DS = 4,2°F)” oferă cititorilor informații complete atât despre extreme, cât și despre variația tipică.