Σ
SDCalc
ZaawansowanyZaawansowane·14 min

Łączone odchylenie standardowe dla wielu grup

Naucz się obliczać łączone odchylenie standardowe do łączenia danych z wielu grup w testach t i analizie wariancji ANOVA.

Czym jest łączone odchylenie standardowe?

Łączone odchylenie standardowe łączy oszacowania wariancji z dwóch lub więcej grup w jedno, ważone oszacowanie. Jest niezbędne w testach t dla dwóch prób przy założeniu równych wariancji.

Koncepcja jest prosta: jeśli wierzymy, że dwie grupy pochodzą z populacji o takiej samej zmienności, możemy połączyć ich dane, aby uzyskać lepsze oszacowanie tej wspólnej zmienności. Więcej danych oznacza dokładniejsze oszacowanie.

Pomyśl o tym w ten sposób: jeśli masz 20 obserwacji z grupy A i 30 z grupy B, a obie grupy mają tę samą prawdziwą wariancję, dysponujesz teraz 50 obserwacjami do oszacowania tej wariancji zamiast szacować ją osobno z mniejszych prób.

Kiedy łączyć

Łącz odchylenia standardowe tylko wtedy, gdy masz powody sądzić, że wariancje populacyjne są równe. Użyj testu Levene’a lub testu F, aby sprawdzić to założenie przed łączeniem.

Wzór na łączone odchylenie

Dla dwóch grup łączone odchylenie standardowe wynosi:

Łączone odchylenie dla dwóch grup

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Gdzie n₁ i n₂ to wielkości prób, a s₁ i s₂ to odchylenia standardowe prób.

Dla k grup (jak w ANOVA) wzór uogólnia się:

Łączone odchylenie dla wielu grup

sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]

Zauważ, że wzór używa wyrażeń (n-1) zarówno w liczniku, jak i mianowniku. To ważenie zapewnia, że większe próbki wnoszą więcej do łączonego oszacowania, co jest uzasadnione, ponieważ większe próbki dostarczają bardziej wiarygodnych oszacowań wariancji.

Założenia

Łączone odchylenie standardowe zakłada jednorodność wariancji — że wszystkie grupy mają tę samą wariancję populacyjną. Założenie to jest szczególnie istotne, gdy:

  • Wielkości prób są nierówne (szczególnie problematyczne, gdy większa grupa ma mniejszą wariancję)
  • Stosunek największej do najmniejszej wariancji przekracza 2–3
  • Próbki są małe (duże próbki są bardziej odporne na naruszenia)

Gdy wariancje się różnią

Jeśli wariancje są nierówne, użyj testu t Welcha zamiast łączonego testu t lub zastosuj osobne oszacowania wariancji. Test Welcha nie zakłada równych wariancji i jest często rekomendowany jako podejście domyślne.

Rozwiązany przykład

Scenariusz: Porównanie wyników testów między dwiema klasami:

  • Klasa A: n₁ = 25, średnia = 78, s₁ = 12
  • Klasa B: n₂ = 30, średnia = 82, s₂ = 14

Obliczenie łączonego odchylenia:

sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13

Łączone odchylenie 13,13 mieści się między poszczególnymi odchyleniami (12 i 14), z przechyłem w stronę większej próbki. Ta łączona wartość zostanie następnie użyta we wzorze testu t lub obliczeniu d Cohena.

Zastosowania statystyczne

  • Test t dla prób niezależnych: Łączone odchylenie służy do obliczenia błędu standardowego różnicy między średnimi.
  • d Cohena — wielkość efektu: Wielkości efektu są standaryzowane za pomocą łączonego odchylenia: d = (M₁ - M₂) / sp
  • ANOVA: Średni kwadrat błędu (MSE) w ANOVA jest zasadniczo łączonym oszacowaniem wariancji ze wszystkich grup.
  • Metaanaliza: Przy łączeniu badań łączone oszacowania pomagają standaryzować efekty w różnych kontekstach.