Czym jest rozkład normalny?
Rozkład normalny, zwany również rozkładem Gaussa lub “krzywą dzwonową”, jest najważniejszym rozkładem prawdopodobieństwa w statystyce. Opisuje, w jaki sposób wartości danych rozkładają się wokół centralnej wartości średniej.
The Classic Bell Curve
Rozkład normalny jest w pełni określony przez zaledwie dwa parametry: średnią (μ), która wyznacza środek, oraz odchylenie standardowe (σ), które określa rozproszenie.
Kluczowe właściwości
Symetria
Średnia = Mediana = Moda
Asymptotyczność
Pole całkowite = 1
Wpływ odchylenia standardowego na kształt
Odchylenie standardowe kontroluje “rozproszenie” rozkładu normalnego. Mniejsze σ tworzy wysoką, wąską krzywą; większe σ tworzy niską, szeroką krzywą.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Wyniki standaryzowane (Z-score) i standaryzacja
Wynik standaryzowany (Z-score) informuje, o ile odchyleń standardowych dana wartość odbiega od średniej. Pozwala to porównywać wartości z różnych rozkładów normalnych.
Wzór na Z-score
| Z-score | Znaczenie | Percentyl |
|---|---|---|
| -2 | 2 odchylenia poniżej średniej | ~2,3% |
| -1 | 1 odchylenie poniżej średniej | ~15,9% |
| 0 | Na poziomie średniej | 50% |
| +1 | 1 odchylenie powyżej średniej | ~84,1% |
| +2 | 2 odchylenia powyżej średniej | ~97,7% |
Przykłady z życia
Wiele zjawisk naturalnych podlega rozkładowi normalnemu:
- Wzrost człowieka:Większość ludzi ma wzrost zbliżony do średniego, a osoby bardzo wysokie lub bardzo niskie są rzadkie
- Wyniki IQ:Zaprojektowane tak, aby miały rozkład normalny ze średnią 100 i odchyleniem standardowym 15
- Błędy pomiarowe:Losowe błędy w pomiarach naukowych
- Ciśnienie krwi:Odczyty ciśnienia krwi w populacji
Gdy dane nie mają rozkładu normalnego
Nie wszystkie dane mają rozkład normalny. Zachowaj ostrożność w przypadku:
Rozkłady inne niż normalny