Vad är poolad standardavvikelse?
Poolad standardavvikelse kombinerar variansskattningar från två eller flera grupper för att erhålla en enda, viktad skattning. Det är avgörande för tvåstickprovs-t-test när man antar lika varianser.
Konceptet är rättframt: om vi tror att två grupper kommer från populationer med samma underliggande variabilitet, kan vi kombinera deras data för att få en bättre skattning av den gemensamma variabiliteten. Mer data innebär en mer precis skattning.
Tänk på det så här: om du har 20 observationer från grupp A och 30 från grupp B, och båda grupperna har samma sanna varians, har du nu 50 observationer för att skatta den variansen istället för att skatta den separat från mindre stickprov.
När ska man poola
Formeln för poolad SA
För två grupper beräknas den poolade standardavvikelsen som:
Two-Group Pooled SD
Där n₁ och n₂ är stickprovsstorlekar, och s₁ och s₂ är stickprovens standardavvikelser.
För k grupper (som i ANOVA) generaliseras formeln:
Multi-Group Pooled SD
Observera att formeln använder (n-1)-termer i både täljare och nämnare. Denna viktning säkerställer att större stickprov bidrar mer till den poolade skattningen, vilket är lämpligt eftersom större stickprov ger mer tillförlitliga variansskattningar.
Underliggande antaganden
Poolad standardavvikelse förutsätter varianshomogenitet – att alla grupper delar samma populationsvarians. Detta antagande spelar störst roll när:
- Stickprovsstorlekarna är ojämna (särskilt problematiskt om den större gruppen har mindre varians)
- Kvoten mellan den största och minsta variansen överstiger 2–3
- Stickprovsstorlekarna är små (stora stickprov är mer robusta mot överträdelser)
När varianserna skiljer sig
Genomarbetat exempel
Scenario: Jämförelse av provresultat mellan två klasser:
- Klass A: n₁ = 25, medelvärde = 78, s₁ = 12
- Klass B: n₂ = 30, medelvärde = 82, s₂ = 14
Beräkning av poolad SA:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Den poolade SA:en på 13,13 hamnar mellan de individuella SA-värdena (12 och 14), viktad mot det större stickprovet. Detta poolade värde skulle sedan användas i t-testformeln eller beräkningen av Cohens d.
Statistiska tillämpningar
- Oberoende t-test: Den poolade SA:en används för att beräkna standardfelet för skillnaden mellan medelvärden.
- Cohens d effektstorlek: Effektstorlekar standardiseras med den poolade SA:en: d = (M₁ - M₂) / sp
- ANOVA: Mean Square Error (MSE) i ANOVA är i grunden en poolad variansskattning över alla grupper.
- Metaanalys: Vid kombination av studier hjälper poolade skattningar till att standardisera effekter över olika kontexter.