Что такое нормальное распределение?
Нормальное распределение, также называемое распределением Гаусса или «колоколообразной кривой», — это важнейшее вероятностное распределение в статистике. Оно описывает, как значения данных распределяются вокруг центрального среднего значения.
The Classic Bell Curve
Нормальное распределение полностью определяется всего двумя параметрами: средним (μ), которое задаёт центр, и стандартным отклонением (σ), которое определяет разброс.
Основные свойства
Симметрия
Среднее = Медиана = Мода
Асимптотичность
Общая площадь = 1
Влияние стандартного отклонения на форму
Стандартное отклонение управляет «шириной» нормального распределения. Меньшее σ создаёт высокую узкую кривую, большее σ — низкую широкую кривую.
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
Z-оценки и стандартизация
Z-оценка показывает, на сколько стандартных отклонений значение удалено от среднего. Это позволяет сравнивать значения из разных нормальных распределений.
Формула Z-оценки
| Z-оценка | Значение | Процентиль |
|---|---|---|
| -2 | 2 СО ниже среднего | ~2,3% |
| -1 | 1 СО ниже среднего | ~15,9% |
| 0 | На уровне среднего | 50% |
| +1 | 1 СО выше среднего | ~84,1% |
| +2 | 2 СО выше среднего | ~97,7% |
Примеры из реальной жизни
Многие природные явления подчиняются нормальному распределению:
- Рост людей:Большинство людей имеют рост, близкий к среднему, а очень высоких или очень низких — меньшинство
- Баллы IQ:Спроектированы так, чтобы следовать нормальному распределению со средним 100 и СО 15
- Ошибки измерений:Случайные ошибки в научных измерениях
- Артериальное давление:Показатели артериального давления в популяции
Когда данные не нормальны
Не все данные подчиняются нормальному распределению. Будьте осторожны с:
Ненормальные распределения