Hvad er poolet standardafvigelse?
Poolet standardafvigelse kombinerer variansestimater fra to eller flere grupper til ét enkelt, vægtet estimat. Den er uundværlig i to-stikprøve t-tests, når man antager ens varianser.
Konceptet er ligetil: hvis vi mener, at to grupper stammer fra populationer med den samme underliggende variabilitet, kan vi kombinere deres data for at få et bedre estimat af denne fælles variabilitet. Flere data giver et mere præcist estimat.
Tænk over det på denne måde: hvis du har 20 observationer fra Gruppe A og 30 fra Gruppe B, og begge grupper har den samme sande varians, har du nu 50 observationer til at estimere den varians i stedet for at estimere den separat fra mindre stikprøver.
Hvornår skal man poole
Formlen for poolet SA
For to grupper er den poolede standardafvigelse:
Two-Group Pooled SD
Hvor n₁ og n₂ er stikprøvestørrelser, og s₁ og s₂ er stikprøvestandardafvigelser.
For k grupper (som i ANOVA) generaliserer formlen til:
Multi-Group Pooled SD
Bemærk, at formlen bruger (n-1)-led i både tæller og nævner. Denne vægtning sikrer, at større stikprøver bidrager mere til det poolede estimat, hvilket er hensigtsmæssigt, da større stikprøver giver mere pålidelige variansestimater.
Underliggende antagelser
Poolet standardafvigelse forudsætter varianshomogenitet – at alle grupper deler den samme populationsvarians. Denne antagelse er mest kritisk, når:
- Stikprøvestørrelserne er ulige (særligt problematisk, hvis den større gruppe har mindre varians)
- Forholdet mellem den største og mindste varians overstiger 2-3
- Stikprøvestørrelserne er små (store stikprøver er mere robuste over for overtrædelser)
Når varianserne er forskellige
Gennemregnet eksempel
Scenarie: Sammenligning af testresultater mellem to klasser:
- Klasse A: n₁ = 25, gennemsnit = 78, s₁ = 12
- Klasse B: n₂ = 30, gennemsnit = 82, s₂ = 14
Beregning af poolet SA:
sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13
Den poolede SA på 13,13 ligger mellem de individuelle SA-værdier (12 og 14), vægtet mod den større stikprøve. Denne poolede værdi ville derefter bruges i t-testformlen eller til beregning af Cohens d.
Statistiske anvendelser
- Uafhængig to-stikprøve t-test: Den poolede SA bruges til at beregne standardfejlen for forskellen mellem gennemsnit.
- Cohens d-effektstørrelse: Effektstørrelser standardiseres ved hjælp af den poolede SA: d = (M₁ - M₂) / sp
- ANOVA: Middelkvadratsummen af fejl (MSE) i ANOVA er i det væsentlige et poolet variansestimat på tværs af alle grupper.
- Metaanalyse: Ved sammenlægning af studier hjælper poolede estimater med at standardisere effekter på tværs af forskellige sammenhænge.