Σ
SDCalc
AvancéAvancé·12 min

Écart type géométrique : guide complet

Guide complet de l’écart type géométrique pour analyser les ratios, les taux de croissance et les données log-normalement distribuées. Inclut les formules, les étapes de calcul, du code Python et des applications en finance et en sciences.

Quand utiliser l’écart type géométrique

L’écart type géométrique (ETG) est la mesure de dispersion appropriée pour des données multiplicatives plutôt qu’additives — comme les taux de croissance, les ratios, les concentrations ou toute mesure distribuée de manière log-normale.

Considérez les rendements boursiers : un gain de 10 % suivi d’une perte de 10 % ne vous ramène pas au point de départ (vous auriez 99 % de l’original). Ces relations multiplicatives nécessitent des statistiques géométriques plutôt qu’arithmétiques.

Idée clé

Si vos données couvrent plusieurs ordres de grandeur, sont toujours positives et semblent asymétriques à droite quand tracées normalement mais symétriques quand tracées sur une échelle logarithmique — vous avez des données log-normales qui nécessitent des statistiques géométriques.

Comprendre les données log-normales

Les données sont distribuées de manière log-normale quand leur logarithme naturel suit une distribution normale. Des exemples courants incluent :

  • Prix des actions et rendements d’investissement au fil du temps
  • Distributions de revenus et de patrimoine
  • Tailles de particules dans les aérosols et les produits pharmaceutiques
  • Comptages de colonies bactériennes et charges virales
  • Concentrations de polluants environnementaux
  • Titres d’anticorps et concentrations de médicaments

La caractéristique clé : les processus impliquant des multiplications répétées génèrent des distributions log-normales, tout comme les additions répétées génèrent des distributions normales.

Formule et calcul

Écart type géométrique

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ou plus simplement : prenez le logarithme naturel de toutes les valeurs, calculez l’écart type standard, puis exponentielle.

1

Transformer les données

Calculer le logarithme naturel de chaque valeur : yᵢ = ln(xᵢ)
2

Calculer la moyenne

Trouver la moyenne arithmétique des valeurs logarithmiques : ȳ = Σyᵢ/n
3

Calculer l’écart type

Trouver l’écart type des valeurs logarithmiques : s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Retransformer

Exponentier pour obtenir l’ETG : ETG = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interprétation des valeurs d’ETG

Contrairement à l’écart type arithmétique qui est dans les mêmes unités que vos données, l’ETG est un facteur multiplicatif — un ratio. Un ETG de 2,0 signifie que les données varient typiquement d’un facteur 2.

  • ETG = 1,0:Aucune variation (impossible en pratique)
  • ETG ≈ 1,2:Faible variabilité (±20 % typique)
  • ETG ≈ 2,0:Variabilité modérée (les données doublent/diminuent de moitié)
  • ETG ≈ 3,0:Forte variabilité (couvre un ordre de grandeur)

Intervalles de confiance

Pour des données log-normales, l’intervalle à 95 % est approximativement : Moyenne géométrique ÷ ETG² à Moyenne géométrique × ETG². Pour MG=100 et ETG=2, l’intervalle est de 25 à 400.

Applications concrètes

Sciences pharmaceutiques

Distribution granulométrique (D50, ETG) · Variabilité de la concentration du médicament · Études de biodisponibilité · Caractérisation des aérosols

Finance et économie

Volatilité des rendements d’investissement · Analyse des taux de croissance · Études de distribution des revenus · Modélisation des prix d’actifs

ETG vs écart type standard

Utiliser l’écart type arithmétique sur des données log-normales donne des résultats trompeurs :

Exemple : Données de charge virale

Valeurs : 1 000; 5 000; 10 000; 50 000; 100 000 copies/mL Moyenne arithmétique ± ÉT : 33 200 ± 41 424 Moyenne géométrique × ETG : 10 000 × 4,5 → Intervalle : 2 222 à 45 000 L’écart type arithmétique suggérerait que des valeurs négatives sont possibles — impossible pour des charges virales!

Vérifiez toujours la distribution

Avant de calculer toute mesure de dispersion, visualisez vos données. Si elles sont asymétriques à droite avec une longue queue, essayez une transformation logarithmique. Si cela les rend symétriques, utilisez les statistiques géométriques.