Σ
SDCalc
AvanceretAvanceret·14 min

Poolet standardafvigelse for flere grupper

Lær at beregne poolet standardafvigelse til at kombinere data fra flere grupper i t-tests og ANOVA.

Hvad er poolet standardafvigelse?

Poolet standardafvigelse kombinerer variansestimater fra to eller flere grupper til ét enkelt, vægtet estimat. Den er uundværlig i to-stikprøve t-tests, når man antager ens varianser.

Konceptet er ligetil: hvis vi mener, at to grupper stammer fra populationer med den samme underliggende variabilitet, kan vi kombinere deres data for at få et bedre estimat af denne fælles variabilitet. Flere data giver et mere præcist estimat.

Tænk over det på denne måde: hvis du har 20 observationer fra Gruppe A og 30 fra Gruppe B, og begge grupper har den samme sande varians, har du nu 50 observationer til at estimere den varians i stedet for at estimere den separat fra mindre stikprøver.

Hvornår skal man poole

Pool kun standardafvigelser, når du har grund til at tro, at de underliggende populationsvarianser er ens. Brug Levenes test eller F-testen til at kontrollere denne antagelse, før du pooler.

Formlen for poolet SA

For to grupper er den poolede standardafvigelse:

Two-Group Pooled SD

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Hvor n₁ og n₂ er stikprøvestørrelser, og s₁ og s₂ er stikprøvestandardafvigelser.

For k grupper (som i ANOVA) generaliserer formlen til:

Multi-Group Pooled SD

sp = √[Σ(nᵢ-1)sᵢ² / Σ(nᵢ-1)]

Bemærk, at formlen bruger (n-1)-led i både tæller og nævner. Denne vægtning sikrer, at større stikprøver bidrager mere til det poolede estimat, hvilket er hensigtsmæssigt, da større stikprøver giver mere pålidelige variansestimater.

Underliggende antagelser

Poolet standardafvigelse forudsætter varianshomogenitet – at alle grupper deler den samme populationsvarians. Denne antagelse er mest kritisk, når:

  • Stikprøvestørrelserne er ulige (særligt problematisk, hvis den større gruppe har mindre varians)
  • Forholdet mellem den største og mindste varians overstiger 2-3
  • Stikprøvestørrelserne er små (store stikprøver er mere robuste over for overtrædelser)

Når varianserne er forskellige

Hvis varianserne er ulige, brug Welchs t-test i stedet for den poolede t-test, eller brug separate variansestimater. Welchs test antager ikke ens varianser og anbefales ofte som standardtilgang.

Gennemregnet eksempel

Scenarie: Sammenligning af testresultater mellem to klasser:

  • Klasse A: n₁ = 25, gennemsnit = 78, s₁ = 12
  • Klasse B: n₂ = 30, gennemsnit = 82, s₂ = 14

Beregning af poolet SA:

sp = √[((25-1)(12)² + (30-1)(14)²) / (25+30-2)] sp = √[(24×144 + 29×196) / 53] sp = √[(3456 + 5684) / 53] sp = √[9140 / 53] = √172,45 = 13,13

Den poolede SA på 13,13 ligger mellem de individuelle SA-værdier (12 og 14), vægtet mod den større stikprøve. Denne poolede værdi ville derefter bruges i t-testformlen eller til beregning af Cohens d.

Statistiske anvendelser

  • Uafhængig to-stikprøve t-test: Den poolede SA bruges til at beregne standardfejlen for forskellen mellem gennemsnit.
  • Cohens d-effektstørrelse: Effektstørrelser standardiseres ved hjælp af den poolede SA: d = (M₁ - M₂) / sp
  • ANOVA: Middelkvadratsummen af fejl (MSE) i ANOVA er i det væsentlige et poolet variansestimat på tværs af alle grupper.
  • Metaanalyse: Ved sammenlægning af studier hjælper poolede estimater med at standardisere effekter på tværs af forskellige sammenhænge.