Σ
SDCalc
ПросунутийПросунутий·14 min

Об’єднане стандартне відхилення для кількох груп

Навчіться обчислювати об’єднане стандартне відхилення для об’єднання даних кількох груп у t-тестах та дисперсійному аналізі.

Що таке об’єднане стандартне відхилення?

Об’єднане стандартне відхилення поєднує оцінки дисперсії з двох або більше груп для отримання єдиної зваженої оцінки. Воно є необхідним для двовибіркових t-тестів за умови рівності дисперсій.

Концепція є інтуїтивно зрозумілою: якщо ми вважаємо, що дві групи походять із генеральних сукупностей з однаковою варіабельністю, ми можемо об’єднати їхні дані для отримання кращої оцінки цієї спільної варіабельності. Більше даних означає точнішу оцінку.

Уявіть це так: якщо у вас є 20 спостережень із групи A та 30 із групи B, і обидві групи мають однакову справжню дисперсію, тепер у вас є 50 спостережень для оцінки цієї дисперсії замість окремого оцінювання з менших вибірок.

Коли об’єднувати

Об’єднуйте стандартні відхилення лише тоді, коли є підстави вважати, що дисперсії генеральних сукупностей рівні. Використовуйте тест Левена або F-тест для перевірки цього припущення перед об’єднанням.

Формула об’єднаного СВ

Для двох груп об’єднане стандартне відхилення обчислюється як:

Two-Group Pooled SD

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Де n₁ та n₂ — обсяги вибірок, а s₁ та s₂ — вибіркові стандартні відхилення.

Для k груп (як у дисперсійному аналізі) формула узагальнюється:

Multi-Group Pooled SD

sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]

Зверніть увагу, що формула використовує множники (n-1) як у чисельнику, так і в знаменнику. Таке зважування забезпечує більший внесок більших вибірок до об’єднаної оцінки, що є обґрунтованим, оскільки більші вибірки дають надійніші оцінки дисперсії.

Базові припущення

Об’єднане стандартне відхилення передбачає однорідність дисперсій — що всі групи мають однакову дисперсію генеральної сукупності. Це припущення є найважливішим, коли:

  • Обсяги вибірок нерівні (особливо проблематично, якщо більша група має меншу дисперсію)
  • Відношення найбільшої до найменшої дисперсії перевищує 2–3
  • Обсяги вибірок малі (великі вибірки стійкіші до порушень)

Коли дисперсії різняться

Якщо дисперсії нерівні, використовуйте t-тест Велча замість об’єднаного t-тесту або окремі оцінки дисперсій. Тест Велча не припускає рівності дисперсій і часто рекомендується як метод за замовчуванням.

Розібраний приклад

Сценарій: порівняння результатів тестів двох класів:

  • Клас A: n₁ = 25, середнє = 78, s₁ = 12
  • Клас B: n₂ = 30, середнє = 82, s₂ = 14

Обчислення об’єднаного СВ:

sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13

Об’єднане СВ, рівне 13,13, знаходиться між індивідуальними СВ (12 та 14), зміщене до більшої вибірки. Це об’єднане значення потім використовується у формулі t-тесту або обчисленні d Коена.

Статистичні застосування

  • t-тест для незалежних вибірок: об’єднане СВ використовується для обчислення стандартної похибки різниці середніх.
  • Розмір ефекту d Коена: розміри ефектів стандартизуються за допомогою об’єднаного СВ: d = (M₁ - M₂) / sp
  • Дисперсійний аналіз (ANOVA): середній квадрат похибки (MSE) в ANOVA є, по суті, об’єднаною оцінкою дисперсії по всіх групах.
  • Метааналіз: при об’єднанні досліджень об’єднані оцінки допомагають стандартизувати ефекти в різних контекстах.