Co je sloučená směrodatná odchylka?
Sloučená směrodatná odchylka kombinuje odhady rozptylu ze dvou nebo více skupin do jediného váženého odhadu. Je nezbytná pro dvouvýběrové t-testy za předpokladu rovnosti rozptylů.
Koncept je přímočarý: pokud věříme, že dvě skupiny pocházejí z populací se stejnou variabilitou, můžeme jejich data zkombinovat a získat lepší odhad této sdílené variability. Více dat znamená přesnější odhad.
Představte si to takto: pokud máte 20 pozorování ze skupiny A a 30 ze skupiny B a obě skupiny mají stejný skutečný rozptyl, máte nyní k dispozici 50 pozorování pro odhad tohoto rozptylu místo samostatných odhadů z menších výběrů.
Kdy slučovat
Vzorec sloučené SO
Pro dvě skupiny je sloučená směrodatná odchylka:
Two-Group Pooled SD
Kde n₁ a n₂ jsou velikosti výběrů a s₁ a s₂ jsou výběrové směrodatné odchylky.
Pro k skupin (jako v ANOVA) se vzorec zobecňuje:
Multi-Group Pooled SD
Všimněte si, že vzorec používá členy (n-1) v čitateli i jmenovateli. Toto vážení zajišťuje, že větší výběry přispívají více ke sloučenému odhadu, což je vhodné, protože větší výběry poskytují spolehlivější odhady rozptylu.
Základní předpoklady
Sloučená směrodatná odchylka předpokládá homogenitu rozptylů — že všechny skupiny sdílejí stejný populační rozptyl. Tento předpoklad je nejdůležitější, když:
- Velikosti výběrů jsou nerovné (obzvláště problematické, pokud větší skupina má menší rozptyl)
- Poměr největšího k nejmenšímu rozptylu přesahuje 2–3
- Velikosti výběrů jsou malé (velké výběry jsou odolnější vůči porušení)
Když se rozptyly liší
Řešený příklad
Situace: Porovnání výsledků testů dvou tříd:
- Třída A: n₁ = 25, průměr = 78, s₁ = 12
- Třída B: n₂ = 30, průměr = 82, s₂ = 14
Výpočet sloučené SO:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Sloučená SO 13,13 leží mezi jednotlivými SO (12 a 14) s váhou směrem k většímu výběru. Tato sloučená hodnota se pak použije ve vzorci t-testu nebo při výpočtu Cohenova d.
Statistické aplikace
- Dvouvýběrový t-test: Sloučená SO se používá k výpočtu standardní chyby rozdílu průměrů.
- Cohenovo d: Velikost účinku je standardizována sloučenou SO: d = (M₁ - M₂) / sp
- ANOVA: Průměrný čtverec chyby (MSE) v ANOVA je v podstatě sloučený odhad rozptylu napříč všemi skupinami.
- Metaanalýza: Při kombinování studií pomáhají sloučené odhady standardizovat účinky napříč různými kontexty.