Dwa sposoby mierzenia rozproszenia
Zarówno rozstęp, jak i odchylenie standardowe mierzą rozproszenie danych, ale uchwytują zasadniczo różne aspekty zmienności. Zrozumienie, kiedy stosować każdą z tych miar, jest kluczowe dla prawidłowej analizy danych.
Rozstęp informuje o ekstremach — jak daleko od siebie są najwyższa i najniższa wartość. Odchylenie standardowe informuje o typowym rozproszeniu wokół średniej. Obie miary są przydatne, ale do różnych celów.
Szybka zasada wyboru
Definicje i wzory
Rozstęp
Odchylenie standardowe
Bezpośrednie porównanie
Rozstęp — zalety i wady
Odchylenie — zalety i wady
Kiedy stosować każde z nich
Stosuj rozstęp, gdy:
- Potrzebujesz szybkiego, przybliżonego oszacowania rozproszenia
- Wartości ekstremalne są kluczowe (np. zakres temperatury do projektowania HVAC)
- Dane są czyste i nie zawierają wartości odstających
- Komunikujesz się z odbiorcami niezaznajomionymi ze statystyką
- Próbka jest mała i stała (taki sam rozmiar we wszystkich porównaniach)
Stosuj odchylenie standardowe, gdy:
- Przeprowadzasz analizę statystyczną lub testowanie hipotez
- Porównujesz zmienność między próbkami o różnych wielkościach
- Obliczasz przedziały ufności lub wartości p
- Oceniasz typową zmienność, a nie ekstrema
- Dane mogą zawierać wartości odstające, które nie powinny dominować miary
Przykłady praktyczne
Przykład: Temperatury dzienne
Przykład: Wyniki testu z wartością odstającą
Zagadnienia zaawansowane
Związek między rozstępem a odchyleniem: Dla danych o rozkładzie normalnym rozstęp ≈ 4–6 × odchylenie standardowe dla typowych wielkości prób. Pozwala to na przybliżone przeliczanie między nimi.
Rozstęp międzykwartylowy (IQR): Kompromis wykorzystujący Q3 - Q1 zamiast max - min. Jest bardziej odporny niż rozstęp, a jednocześnie prostszy niż odchylenie standardowe.
Najlepsza praktyka