Σ
SDCalc
AvancéAvancé·12 min

Écart type géométrique : guide complet

Guide complet de l’écart type géométrique pour l’analyse des ratios, des taux de croissance et des données log-normales. Formules, étapes de calcul, code Python et applications en finance et en sciences.

Quand utiliser l’écart type géométrique

L’écart type géométrique (GSD) est la mesure de dispersion adaptée aux données de nature multiplicative plutôt qu’additive — comme les taux de croissance, les ratios, les concentrations ou toute mesure suivant une distribution log-normale.

Prenons les rendements boursiers : un gain de 10 % suivi d’une perte de 10 % ne ramène pas à l’équilibre (on obtient 99 % du montant initial). Ces relations multiplicatives nécessitent des statistiques géométriques plutôt qu’arithmétiques.

Principe clé

Si vos données couvrent plusieurs ordres de grandeur, sont toujours positives et semblent asymétriques à droite en échelle linéaire mais symétriques en échelle logarithmique — vous avez des données log-normales nécessitant des statistiques géométriques.

Comprendre les données log-normales

Les données sont log-normales lorsque leur logarithme naturel suit une distribution normale. Exemples courants :

  • Cours des actions et rendements d’investissement dans le temps
  • Distributions de revenus et de patrimoine
  • Tailles de particules dans les aérosols et les produits pharmaceutiques
  • Comptages de colonies bactériennes et charges virales
  • Concentrations de polluants environnementaux
  • Titres d’anticorps et concentrations de médicaments

La caractéristique clé : les processus impliquant des multiplications répétées génèrent des distributions log-normales, tout comme les additions répétées génèrent des distributions normales.

Formule et calcul

Écart type géométrique

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ou plus simplement : prendre le logarithme naturel de toutes les valeurs, calculer l’écart type classique, puis exponentier.

1

Transformer les données

Calculer le logarithme naturel de chaque valeur : yᵢ = ln(xᵢ)
2

Calculer la moyenne

Trouver la moyenne arithmétique des valeurs logarithmiques : ȳ = Σyᵢ/n
3

Calculer l’écart type

Trouver l’écart type des valeurs logarithmiques : s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Rétro-transformer

Exponentier pour obtenir le GSD : GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpréter les valeurs de GSD

Contrairement à l’écart type arithmétique qui est dans les mêmes unités que les données, le GSD est un facteur multiplicatif — un ratio. Un GSD de 2,0 signifie que les données varient typiquement d’un facteur 2.

  • GSD = 1,0:Aucune variation (impossible en pratique)
  • GSD ≈ 1,2:Faible variabilité (±20 % typiquement)
  • GSD ≈ 2,0:Variabilité modérée (les données doublent/sont divisées par deux)
  • GSD ≈ 3,0:Forte variabilité (couvre un ordre de grandeur)

Intervalles de confiance

Pour des données log-normales, l’intervalle à 95 % est approximativement : Moyenne géométrique ÷ GSD² à Moyenne géométrique × GSD². Pour MG=100 et GSD=2, l’intervalle est de 25 à 400.

Applications concrètes

Sciences pharmaceutiques

Distribution granulométrique (D50, GSD) · Variabilité des concentrations de médicaments · Études de biodisponibilité · Caractérisation des aérosols

Finance et économie

Volatilité des rendements d’investissement · Analyse des taux de croissance · Études de distribution des revenus · Modélisation des prix d’actifs

GSD vs écart type classique

Utiliser l’écart type arithmétique sur des données log-normales donne des résultats trompeurs :

Exemple : Données de charge virale

Valeurs : 1 000 ; 5 000 ; 10 000 ; 50 000 ; 100 000 copies/mL Moyenne arithmétique ± écart type : 33 200 ± 41 424 Moyenne géométrique × GSD : 10 000 × 4,5 → Plage : 2 222 à 45 000 L’écart type arithmétique suggérerait que des valeurs négatives sont possibles — ce qui est impossible pour des charges virales !

Vérifiez toujours la distribution

Avant de calculer toute mesure de dispersion, visualisez vos données. Si elles sont asymétriques à droite avec une longue queue, essayez une transformation logarithmique. Si cela les rend symétriques, utilisez les statistiques géométriques.