How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

d de Cohen et calculs de taille d’effet | Standard Deviation Calculator

Au-delà de la significativité statistique : comprendre la taille d’effet

La taille d’effet mesure l’ampleur d’une différence ou d’une relation, indépendamment de la taille de l’échantillon. Alors que les p-valeurs indiquent si un effet est statistiquement significatif, les tailles d’effet révèlent à quel point cet effet est concrètement pertinent. Cette distinction est cruciale pour une prise de décision fondée sur les preuves en recherche, médecine, éducation et entreprise.

Considérons un essai pharmaceutique où un nouveau médicament montre une amélioration statistiquement significative (p < 0,001) par rapport au placebo. Sans taille d’effet, impossible de savoir si l’amélioration est de 0,1 % ou de 50 %. La taille d’effet apporte ce contexte essentiel, aidant les décideurs à déterminer si l’effet justifie le coût, les effets secondaires ou l’effort de mise en œuvre.

La mesure de taille d’effet la plus courante pour comparer deux groupes est le d de Cohen, qui exprime la différence entre les moyennes en unités d’écart type. Cette standardisation permet la comparaison entre différentes études et échelles de mesure.

Pourquoi la taille d’effet compte

La significativité statistique est fortement influencée par la taille de l’échantillon. Avec un échantillon assez grand, même des différences triviales deviennent « significatives ». Inversement, des effets importants peuvent ne pas atteindre la significativité dans de petits échantillons. La taille d’effet résout ce problème en fournissant une mesure indépendante de la taille de l’échantillon.

Le piège de la significativité

Une étude avec n=10 000 pourrait montrer p < 0,001 pour une différence de 0,5 point sur une échelle de 100. C’est statistiquement significatif mais concrètement sans intérêt (d ≈ 0,05). Rapportez toujours les tailles d’effet à côté des p-valeurs.

Raisons clés d’utiliser la taille d’effet :

Méta-analyse : Les tailles d’effet peuvent être combinées entre études pour estimer les effets globaux
Analyse de puissance : Nécessaire pour calculer les tailles d’échantillon requises pour les études futures
Décisions pratiques : Aide à déterminer si les interventions valent la peine d’être mises en œuvre
Réplication : Fournit un objectif que les études de réplication doivent atteindre

d de Cohen : la mesure standard de taille d’effet

Le d de Cohen exprime la différence entre les moyennes de deux groupes en unités d’écart type groupé :

d de Cohen

d = (M₁ - M₂) / sp

Où M₁ et M₂ sont les moyennes des groupes, et sp l’écart type groupé calculé comme suit :

Écart type groupé

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

Le signe de d indique la direction : positif quand M₁ > M₂, négatif quand M₁ < M₂. Souvent, la valeur absolue |d| est rapportée lorsque la direction est évidente.

Pourquoi grouper l’écart type ?

Le regroupement suppose que les deux groupes ont des variances de population égales. Cela donne une estimation plus stable que l’utilisation de l’écart type d’un seul groupe et correspond aux hypothèses du test t pour échantillons indépendants.

Mesures alternatives de taille d’effet

Si le d de Cohen est le plus courant, des alternatives existent pour des situations spécifiques :

g de Hedges : taille d’effet corrigée du biais

Le d de Cohen surestime légèrement la taille d’effet de la population dans les petits échantillons. Le g de Hedges applique un facteur de correction :

Correction de Hedges

g = d × (1 - 3/(4(n₁+n₂) - 9))

Pour des échantillons de plus de 20 par groupe, la différence est négligeable. Pour de petits échantillons (n < 20), le g de Hedges est préférable.

Δ de Glass : quand les variances diffèrent

Lorsqu’un groupe est un témoin dont la variabilité est connue, on utilise uniquement l’écart type du groupe témoin comme dénominateur :

Delta de Glass

Δ = (M₁ - M₂) / s_témoin

C’est utile lorsque le traitement peut affecter la variance (par ex. une intervention qui aide davantage les moins performants que les plus performants).

Interpréter les tailles d’effet : conventions de Cohen

Jacob Cohen a proposé ces conventions pour interpréter les valeurs de d :

Taille d’effet (d)	Interprétation	Chevauchement
0,2	Faible	85 % de chevauchement entre les groupes
0,5	Moyen	67 % de chevauchement entre les groupes
0,8	Grand	53 % de chevauchement entre les groupes
1,2	Très grand	40 % de chevauchement entre les groupes
2,0	Énorme	19 % de chevauchement entre les groupes

Le contexte compte

Ce sont des repères approximatifs, pas des règles absolues. Dans certains domaines, d = 0,2 peut être très significatif (par ex. réduction du risque d’infarctus), tandis que dans d’autres, d = 0,8 est attendu (par ex. tutorat vs aucune instruction).

Exemple détaillé : intervention éducative

Une école teste un nouveau programme de lecture. Groupe témoin (n=25) : moyenne=72, écart type=12. Groupe traitement (n=30) : moyenne=79, écart type=14. Calculons le d de Cohen :

Calculer la variance groupée

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172,45

Calculer l’écart type groupé

sp = √172,45 = 13,13

Calculer le d de Cohen

d = (79 - 72) / 13,13 = 7 / 13,13 = 0,53

Interpréter

Taille d’effet moyenne (d = 0,53). Le groupe traitement obtient environ un demi-écart type de plus que le groupe témoin.

Cela signifie que si l’on prend au hasard un élève du groupe traitement et un du groupe témoin, l’élève du groupe traitement obtiendra un meilleur score environ 64 % du temps (calculé à partir du chevauchement).

Implémentation en Python

Calculer les tailles d’effet par programmation avec des intervalles de confiance :

python

import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")

Reading goal	What to focus on	Common mistake
Definition	What the metric is and what quantity it summarizes	Treating the formula as self-explanatory
Formula choice	Sample versus population assumptions and notation	Using n when n-1 is required or vice versa
Interpretation	Whether the result indicates concentration, spread, or risk	Calling a large value good or bad without context

d de Cohen et calculs de taille d’effet