Σ
SDCalc
СреднийКонцепции·8 min

Выборочное и генеральное стандартное отклонение: когда какое использовать

Разберитесь в различиях между выборочным и генеральным стандартным отклонением. Поправка Бесселя, деление на n-1 или n — с наглядными примерами.

Обзор

Один из самых распространённых вопросов в статистике: «Делить на n или на n-1?» Ответ зависит от того, работаете ли вы с генеральной совокупностью или только с выборкой.

Генеральная совокупность (N)

Используйте, когда у вас есть данные по каждому элементу исследуемой группы. σ = √[Σ(x-μ)² / N]

Выборка (n-1)

Используйте, когда у вас есть данные по части более крупной совокупности. s = √[Σ(x-x̄)² / (n-1)]

Стандартное отклонение генеральной совокупности (σ)

Стандартное отклонение генеральной совокупности используется, когда у вас есть измерения по каждому без исключения элементу анализируемой группы. На практике это встречается относительно редко.

Примеры генеральных совокупностей:

  • Все 50 сотрудников небольшой компании
  • Каждый ученик конкретного класса из 30 человек
  • Все транзакции за завершённый финансовый год
  • Полные данные переписи населения страны

Выборочное стандартное отклонение (s)

Выборочное стандартное отклонение используется, когда вы работаете с подмножеством более крупной совокупности. Это наиболее распространённый сценарий в реальном анализе.

Примеры выборок:

  • Опрос 1 000 избирателей для прогнозирования результатов выборов
  • Проверка 50 изделий из партии в 10 000 штук
  • Измерение артериального давления у 200 пациентов в клиническом исследовании
  • Анализ данных по акциям за 5 лет для прогнозирования будущей волатильности

Поправка Бесселя

Поправка Бесселя — это причина, по которой мы используем (n-1) вместо n при расчёте выборочного стандартного отклонения. Названная в честь немецкого математика Фридриха Бесселя, эта корректировка обеспечивает несмещённую оценку дисперсии генеральной совокупности.

Почему (n-1) работает

Когда вы вычисляете выборочное среднее, вы «расходуете» одну степень свободы. Выборочное среднее накладывает ограничение на данные — зная n-1 значений и среднее, последнее значение определяется однозначно. Деление на (n-1) компенсирует эту потерю свободы.

Математическая интуиция

Значения выборки обычно группируются ближе к выборочному среднему, чем к истинному среднему генеральной совокупности. Это приводит к систематическому занижению суммы квадратов отклонений.

Деление на (n-1) вместо n немного увеличивает результат, компенсируя эту недооценку и обеспечивая несмещённую оценку.

Когда какое использовать

СценарийЧто использоватьДелить на
У вас есть все существующие данныеГенеральное СО (σ)N
Вы описываете только имеющиеся данныеГенеральное СО (σ)N
Вы оцениваете для более крупной совокупностиВыборочное СО (s)n-1
Вы будете использовать СО для статистического выводаВыборочное СО (s)n-1

Практическое правило

Если сомневаетесь, используйте выборочное стандартное отклонение (n-1). Это безопаснее, потому что: - Большинство реальных данных — это выборки, а не полные совокупности - Использование n-1 для истинной совокупности немного завышает оценку (безопаснее, чем занижение) - При большом n разница пренебрежимо мала

Практические примеры

Пример: Контроль качества

Завод производит 10 000 изделий в день. Отдел контроля качества проверяет 100 изделий и определяет, что их средняя масса составляет 50 г. Ответ: Используйте выборочное СО (n-1), так как 100 изделий — это выборка из 10 000 произведённых. Вы используете эту выборку для оценки вариабельности всех изделий.

Пример: Оценки в классе

Учитель хочет описать разброс результатов экзамена в своём классе из 25 учеников. Он не пытается обобщить результаты на другие классы. Ответ: Используйте генеральное СО (N), так как у него есть оценки за весь класс (его генеральная совокупность), и он не делает выводов о других группах.