Quand utiliser l’écart type géométrique
L’écart type géométrique (ETG) est la mesure de dispersion appropriée pour des données multiplicatives plutôt qu’additives — comme les taux de croissance, les ratios, les concentrations ou toute mesure distribuée de manière log-normale.
Considérez les rendements boursiers : un gain de 10 % suivi d’une perte de 10 % ne vous ramène pas au point de départ (vous auriez 99 % de l’original). Ces relations multiplicatives nécessitent des statistiques géométriques plutôt qu’arithmétiques.
Idée clé
Comprendre les données log-normales
Les données sont distribuées de manière log-normale quand leur logarithme naturel suit une distribution normale. Des exemples courants incluent :
- Prix des actions et rendements d’investissement au fil du temps
- Distributions de revenus et de patrimoine
- Tailles de particules dans les aérosols et les produits pharmaceutiques
- Comptages de colonies bactériennes et charges virales
- Concentrations de polluants environnementaux
- Titres d’anticorps et concentrations de médicaments
La caractéristique clé : les processus impliquant des multiplications répétées génèrent des distributions log-normales, tout comme les additions répétées génèrent des distributions normales.
Formule et calcul
Écart type géométrique
Ou plus simplement : prenez le logarithme naturel de toutes les valeurs, calculez l’écart type standard, puis exponentielle.
Transformer les données
Calculer la moyenne
Calculer l’écart type
Retransformer
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interprétation des valeurs d’ETG
Contrairement à l’écart type arithmétique qui est dans les mêmes unités que vos données, l’ETG est un facteur multiplicatif — un ratio. Un ETG de 2,0 signifie que les données varient typiquement d’un facteur 2.
- ETG = 1,0:Aucune variation (impossible en pratique)
- ETG ≈ 1,2:Faible variabilité (±20 % typique)
- ETG ≈ 2,0:Variabilité modérée (les données doublent/diminuent de moitié)
- ETG ≈ 3,0:Forte variabilité (couvre un ordre de grandeur)
Intervalles de confiance
Applications concrètes
Sciences pharmaceutiques
Finance et économie
ETG vs écart type standard
Utiliser l’écart type arithmétique sur des données log-normales donne des résultats trompeurs :
Exemple : Données de charge virale
Vérifiez toujours la distribution