Что такое объединённое стандартное отклонение?
Объединённое стандартное отклонение комбинирует оценки дисперсии из двух или более групп, чтобы получить единую взвешенную оценку. Оно необходимо для двухвыборочных t-критериев при допущении равенства дисперсий.
Идея проста: если мы полагаем, что две группы происходят из совокупностей с одинаковой вариабельностью, мы можем объединить их данные для получения лучшей оценки этой общей вариабельности. Больше данных — более точная оценка.
Представьте: у вас 20 наблюдений из группы A и 30 из группы B, и обе группы имеют одинаковую истинную дисперсию. Теперь у вас 50 наблюдений для оценки этой дисперсии вместо раздельных оценок по меньшим выборкам.
Когда объединять
Формула объединённого СО
Для двух групп объединённое стандартное отклонение рассчитывается как:
Объединённое СО для двух групп
Где n₁ и n₂ — объёмы выборок, а s₁ и s₂ — выборочные стандартные отклонения.
Для k групп (как в дисперсионном анализе) формула обобщается:
Объединённое СО для нескольких групп
Обратите внимание, что формула использует множители (n-1) как в числителе, так и в знаменателе. Такое взвешивание гарантирует, что более крупные выборки вносят больший вклад в объединённую оценку, что обосновано, поскольку крупные выборки дают более надёжные оценки дисперсии.
Предпосылки
Объединённое стандартное отклонение предполагает однородность дисперсий — то есть все группы имеют одинаковую дисперсию в генеральной совокупности. Это допущение особенно важно, когда:
- Объёмы выборок неравны (особенно проблематично, если более крупная группа имеет меньшую дисперсию)
- Отношение наибольшей дисперсии к наименьшей превышает 2–3
- Объёмы выборок малы (большие выборки более устойчивы к нарушениям)
Когда дисперсии различаются
Решённый пример
Задача: Сравнение результатов экзамена между двумя классами:
- Класс A: n₁ = 25, среднее = 78, s₁ = 12
- Класс B: n₂ = 30, среднее = 82, s₂ = 14
Расчёт объединённого СО:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Объединённое СО 13,13 находится между индивидуальными СО (12 и 14), с весом в сторону большей выборки. Это объединённое значение затем используется в формуле t-критерия или при расчёте d Коэна.
Статистические применения
- Двухвыборочный t-критерий: объединённое СО используется для расчёта стандартной ошибки разности средних.
- d Коэна: размер эффекта стандартизируется с помощью объединённого СО: d = (M₁ - M₂) / sp
- Дисперсионный анализ (ANOVA): среднеквадратичная ошибка (MSE) в ANOVA по сути является объединённой оценкой дисперсии по всем группам.
- Мета-анализ: при объединении исследований объединённые оценки помогают стандартизировать эффекты в различных контекстах.