Що таке об’єднане стандартне відхилення?
Об’єднане стандартне відхилення поєднує оцінки дисперсії з двох або більше груп для отримання єдиної зваженої оцінки. Воно є необхідним для двовибіркових t-тестів за умови рівності дисперсій.
Концепція є інтуїтивно зрозумілою: якщо ми вважаємо, що дві групи походять із генеральних сукупностей з однаковою варіабельністю, ми можемо об’єднати їхні дані для отримання кращої оцінки цієї спільної варіабельності. Більше даних означає точнішу оцінку.
Уявіть це так: якщо у вас є 20 спостережень із групи A та 30 із групи B, і обидві групи мають однакову справжню дисперсію, тепер у вас є 50 спостережень для оцінки цієї дисперсії замість окремого оцінювання з менших вибірок.
Коли об’єднувати
Формула об’єднаного СВ
Для двох груп об’єднане стандартне відхилення обчислюється як:
Two-Group Pooled SD
Де n₁ та n₂ — обсяги вибірок, а s₁ та s₂ — вибіркові стандартні відхилення.
Для k груп (як у дисперсійному аналізі) формула узагальнюється:
Multi-Group Pooled SD
Зверніть увагу, що формула використовує множники (n-1) як у чисельнику, так і в знаменнику. Таке зважування забезпечує більший внесок більших вибірок до об’єднаної оцінки, що є обґрунтованим, оскільки більші вибірки дають надійніші оцінки дисперсії.
Базові припущення
Об’єднане стандартне відхилення передбачає однорідність дисперсій — що всі групи мають однакову дисперсію генеральної сукупності. Це припущення є найважливішим, коли:
- Обсяги вибірок нерівні (особливо проблематично, якщо більша група має меншу дисперсію)
- Відношення найбільшої до найменшої дисперсії перевищує 2–3
- Обсяги вибірок малі (великі вибірки стійкіші до порушень)
Коли дисперсії різняться
Розібраний приклад
Сценарій: порівняння результатів тестів двох класів:
- Клас A: n₁ = 25, середнє = 78, s₁ = 12
- Клас B: n₂ = 30, середнє = 82, s₂ = 14
Обчислення об’єднаного СВ:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Об’єднане СВ, рівне 13,13, знаходиться між індивідуальними СВ (12 та 14), зміщене до більшої вибірки. Це об’єднане значення потім використовується у формулі t-тесту або обчисленні d Коена.
Статистичні застосування
- t-тест для незалежних вибірок: об’єднане СВ використовується для обчислення стандартної похибки різниці середніх.
- Розмір ефекту d Коена: розміри ефектів стандартизуються за допомогою об’єднаного СВ: d = (M₁ - M₂) / sp
- Дисперсійний аналіз (ANOVA): середній квадрат похибки (MSE) в ANOVA є, по суті, об’єднаною оцінкою дисперсії по всіх групах.
- Метааналіз: при об’єднанні досліджень об’єднані оцінки допомагають стандартизувати ефекти в різних контекстах.