Czym jest łączone odchylenie standardowe?
Łączone odchylenie standardowe łączy oszacowania wariancji z dwóch lub więcej grup w jedno, ważone oszacowanie. Jest niezbędne w testach t dla dwóch prób przy założeniu równych wariancji.
Koncepcja jest prosta: jeśli wierzymy, że dwie grupy pochodzą z populacji o takiej samej zmienności, możemy połączyć ich dane, aby uzyskać lepsze oszacowanie tej wspólnej zmienności. Więcej danych oznacza dokładniejsze oszacowanie.
Pomyśl o tym w ten sposób: jeśli masz 20 obserwacji z grupy A i 30 z grupy B, a obie grupy mają tę samą prawdziwą wariancję, dysponujesz teraz 50 obserwacjami do oszacowania tej wariancji zamiast szacować ją osobno z mniejszych prób.
Kiedy łączyć
Wzór na łączone odchylenie
Dla dwóch grup łączone odchylenie standardowe wynosi:
Łączone odchylenie dla dwóch grup
Gdzie n₁ i n₂ to wielkości prób, a s₁ i s₂ to odchylenia standardowe prób.
Dla k grup (jak w ANOVA) wzór uogólnia się:
Łączone odchylenie dla wielu grup
Zauważ, że wzór używa wyrażeń (n-1) zarówno w liczniku, jak i mianowniku. To ważenie zapewnia, że większe próbki wnoszą więcej do łączonego oszacowania, co jest uzasadnione, ponieważ większe próbki dostarczają bardziej wiarygodnych oszacowań wariancji.
Założenia
Łączone odchylenie standardowe zakłada jednorodność wariancji — że wszystkie grupy mają tę samą wariancję populacyjną. Założenie to jest szczególnie istotne, gdy:
- Wielkości prób są nierówne (szczególnie problematyczne, gdy większa grupa ma mniejszą wariancję)
- Stosunek największej do najmniejszej wariancji przekracza 2–3
- Próbki są małe (duże próbki są bardziej odporne na naruszenia)
Gdy wariancje się różnią
Rozwiązany przykład
Scenariusz: Porównanie wyników testów między dwiema klasami:
- Klasa A: n₁ = 25, średnia = 78, s₁ = 12
- Klasa B: n₂ = 30, średnia = 82, s₂ = 14
Obliczenie łączonego odchylenia:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Łączone odchylenie 13,13 mieści się między poszczególnymi odchyleniami (12 i 14), z przechyłem w stronę większej próbki. Ta łączona wartość zostanie następnie użyta we wzorze testu t lub obliczeniu d Cohena.
Zastosowania statystyczne
- Test t dla prób niezależnych: Łączone odchylenie służy do obliczenia błędu standardowego różnicy między średnimi.
- d Cohena — wielkość efektu: Wielkości efektu są standaryzowane za pomocą łączonego odchylenia: d = (M₁ - M₂) / sp
- ANOVA: Średni kwadrat błędu (MSE) w ANOVA jest zasadniczo łączonym oszacowaniem wariancji ze wszystkich grup.
- Metaanaliza: Przy łączeniu badań łączone oszacowania pomagają standaryzować efekty w różnych kontekstach.