How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Cohens d und Effektgrößenberechnungen | Standard Deviation Calculator

Jenseits der statistischen Signifikanz: Effektgrößen verstehen

Die Effektgröße misst das Ausmaß eines Unterschieds oder einer Beziehung, unabhängig von der Stichprobengröße. Während p-Werte Ihnen sagen, ob ein Effekt statistisch signifikant ist, sagen Ihnen Effektgrößen, wie praktisch bedeutsam dieser Effekt ist. Diese Unterscheidung ist entscheidend für evidenzbasierte Entscheidungsfindung in Forschung, Medizin, Bildung und Wirtschaft.

Stellen Sie sich eine pharmazeutische Studie vor, in der ein neues Medikament eine statistisch signifikante Verbesserung (p < 0,001) gegenüber einem Placebo zeigt. Ohne Effektgröße wissen Sie nicht, ob die Verbesserung 0,1 % oder 50 % beträgt. Die Effektgröße liefert diesen entscheidenden Kontext und hilft Entscheidungsträgern zu beurteilen, ob der Effekt die Kosten, Nebenwirkungen oder den Umsetzungsaufwand rechtfertigt.

Das gebräuchlichste Effektgrößenmaß zum Vergleich zweier Gruppen ist Cohens d, das den Mittelwertunterschied in Einheiten der Standardabweichung ausdrückt. Diese Standardisierung ermöglicht Vergleiche über verschiedene Studien und Messskalen hinweg.

Warum Effektgrößen wichtig sind

Statistische Signifikanz wird stark von der Stichprobengröße beeinflusst. Bei ausreichend großer Stichprobe werden selbst triviale Unterschiede "signifikant". Umgekehrt erreichen wichtige Effekte in kleinen Stichproben möglicherweise keine Signifikanz. Die Effektgröße löst dieses Problem durch ein stichprobengrößenunabhängiges Maß.

Die Signifikanzfalle

Eine Studie mit n=10.000 könnte p < 0,001 für einen Unterschied von 0,5 Punkten auf einer 100-Punkte-Skala zeigen. Das ist statistisch signifikant, aber praktisch bedeutungslos (d ≈ 0,05). Berichten Sie immer Effektgrößen neben p-Werten.

Wichtige Gründe für die Verwendung von Effektgrößen:

Meta-Analyse: Effektgrößen können studienübergreifend kombiniert werden, um Gesamteffekte zu schätzen
Power-Analyse: Erforderlich zur Berechnung notwendiger Stichprobengrößen für zukünftige Studien
Praktische Entscheidungen: Hilft zu bestimmen, ob Interventionen die Umsetzung wert sind
Replikation: Liefert eine Zielgröße für Replikationsstudien

Cohens d: Das Standard-Effektgrößenmaß

Cohens d drückt den Unterschied zwischen zwei Gruppenmittelwerten in Einheiten der gepoolten Standardabweichung aus:

Cohens d

d = (M₁ - M₂) / sp

Dabei sind M₁ und M₂ die Gruppenmittelwerte und sp die gepoolte Standardabweichung:

Gepoolte Standardabweichung

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Das Vorzeichen von d gibt die Richtung an: positiv bei M₁ > M₂, negativ bei M₁ < M₂. Häufig wird der Absolutwert |d| berichtet, wenn die Richtung aus dem Kontext ersichtlich ist.

Warum die Standardabweichung poolen?

Beim Poolen wird angenommen, dass beide Gruppen gleiche Populationsvarianzen haben. Dies liefert eine stabilere Schätzung als die alleinige Verwendung der SD einer Gruppe und entspricht den Annahmen des unabhängigen Zwei-Stichproben-t-Tests.

Alternative Effektgrößenmaße

Obwohl Cohens d am verbreitetsten ist, existieren Alternativen für spezifische Situationen:

Hedges' g: Verzerrungskorrigierte Effektgröße

Cohens d überschätzt die Populations-Effektgröße bei kleinen Stichproben leicht. Hedges' g wendet einen Korrekturfaktor an:

Hedges' g Korrektur

g = d × (1 - 3/(4(n₁+n₂) - 9))

Für Stichproben über 20 pro Gruppe ist der Unterschied vernachlässigbar. Bei kleinen Stichproben (n < 20) wird Hedges' g bevorzugt.

Glass' Δ: Bei ungleichen Varianzen

Wenn eine Gruppe eine Kontrollgruppe mit bekannter Variabilität ist, verwenden Sie nur die Standardabweichung der Kontrollgruppe als Nenner:

Glass' Delta

Δ = (M₁ - M₂) / s_control

Dies ist nützlich, wenn die Behandlung die Varianz beeinflussen könnte (z. B. eine Intervention, die leistungsschwachen Teilnehmern stärker hilft als leistungsstarken).

Effektgrößen interpretieren: Cohens Richtlinien

Jacob Cohen schlug diese Konventionen zur Interpretation von d-Werten vor:

Effektgröße (d)	Interpretation	Überlappung
0,2	Klein	85 % Überlappung zwischen Gruppen
0,5	Mittel	67 % Überlappung zwischen Gruppen
0,8	Groß	53 % Überlappung zwischen Gruppen
1,2	Sehr groß	40 % Überlappung zwischen Gruppen
2,0	Enorm	19 % Überlappung zwischen Gruppen

Der Kontext zählt

Dies sind grobe Richtlinien, keine absoluten Regeln. In manchen Bereichen kann d = 0,2 hochbedeutsam sein (z. B. Senkung des Herzinfarktrisikos), während in anderen d = 0,8 erwartet wird (z. B. Nachhilfe vs. kein Unterricht).

Rechenbeispiel: Bildungsintervention

Eine Schule testet ein neues Leseprogramm. Kontrollgruppe (n=25): Mittelwert=72, SD=12. Behandlungsgruppe (n=30): Mittelwert=79, SD=14. Berechnen Sie Cohens d:

Gepoolte Varianz berechnen

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45

Gepoolte SD berechnen

sp = √172,45 = 13,13

Cohens d berechnen

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53

Interpretieren

Eine mittlere Effektgröße (d = 0,53). Die Behandlungsgruppe erzielt etwa eine halbe Standardabweichung mehr als die Kontrollgruppe.

Das bedeutet: Wenn Sie eine zufällige Person aus der Behandlungsgruppe und eine aus der Kontrollgruppe nehmen, würde die Person aus der Behandlungsgruppe in etwa 64 % der Fälle besser abschneiden (berechnet aus der Überlappung).

Python-Implementierung

Effektgrößen programmgesteuert mit Konfidenzintervallen berechnen:

python

import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")

Reading goal	What to focus on	Common mistake
Definition	What the metric is and what quantity it summarizes	Treating the formula as self-explanatory
Formula choice	Sample versus population assumptions and notation	Using n when n-1 is required or vice versa
Interpretation	Whether the result indicates concentration, spread, or risk	Calling a large value good or bad without context

Cohens d und Effektgrößenberechnungen