Σ
SDCalc
AvancéAvancé·12 min

Écart type géométrique : guide complet

Guide complet de l’écart type géométrique pour analyser les ratios, les taux de croissance et les données log-normalement distribuées. Inclut les formules, les étapes de calcul, du code Python et des applications en finance et en sciences.

Quand utiliser l’écart type géométrique

L’écart type géométrique (ETG) est la mesure de dispersion appropriée pour des données multiplicatives plutôt qu’additives — comme les taux de croissance, les ratios, les concentrations ou toute mesure distribuée de manière log-normale.

Considérez les rendements boursiers : un gain de 10 % suivi d’une perte de 10 % ne vous ramène pas au point de départ (vous auriez 99 % de l’original). Ces relations multiplicatives nécessitent des statistiques géométriques plutôt qu’arithmétiques.

Idée clé

Si vos données couvrent plusieurs ordres de grandeur, sont toujours positives et semblent asymétriques à droite quand tracées normalement mais symétriques quand tracées sur une échelle logarithmique — vous avez des données log-normales qui nécessitent des statistiques géométriques.

Comprendre les données log-normales

Les données sont distribuées de manière log-normale quand leur logarithme naturel suit une distribution normale. Des exemples courants incluent :

  • Prix des actions et rendements d’investissement au fil du temps
  • Distributions de revenus et de patrimoine
  • Tailles de particules dans les aérosols et les produits pharmaceutiques
  • Comptages de colonies bactériennes et charges virales
  • Concentrations de polluants environnementaux
  • Titres d’anticorps et concentrations de médicaments

La caractéristique clé : les processus impliquant des multiplications répétées génèrent des distributions log-normales, tout comme les additions répétées génèrent des distributions normales.

Formule et calcul

Écart type géométrique

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ou plus simplement : prenez le logarithme naturel de toutes les valeurs, calculez l’écart type standard, puis exponentielle.

1

Transformer les données

Calculer le logarithme naturel de chaque valeur : yᵢ = ln(xᵢ)
2

Calculer la moyenne

Trouver la moyenne arithmétique des valeurs logarithmiques : ȳ = Σyᵢ/n
3

Calculer l’écart type

Trouver l’écart type des valeurs logarithmiques : s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Retransformer

Exponentier pour obtenir l’ETG : ETG = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interprétation des valeurs d’ETG

Contrairement à l’écart type arithmétique qui est dans les mêmes unités que vos données, l’ETG est un facteur multiplicatif — un ratio. Un ETG de 2,0 signifie que les données varient typiquement d’un facteur 2.

  • ETG = 1,0:Aucune variation (impossible en pratique)
  • ETG ≈ 1,2:Faible variabilité (±20 % typique)
  • ETG ≈ 2,0:Variabilité modérée (les données doublent/diminuent de moitié)
  • ETG ≈ 3,0:Forte variabilité (couvre un ordre de grandeur)

Intervalles de confiance

Pour des données log-normales, l’intervalle à 95 % est approximativement : Moyenne géométrique ÷ ETG² à Moyenne géométrique × ETG². Pour MG=100 et ETG=2, l’intervalle est de 25 à 400.

Applications concrètes

Sciences pharmaceutiques

Distribution granulométrique (D50, ETG) · Variabilité de la concentration du médicament · Études de biodisponibilité · Caractérisation des aérosols

Finance et économie

Volatilité des rendements d’investissement · Analyse des taux de croissance · Études de distribution des revenus · Modélisation des prix d’actifs

ETG vs écart type standard

Utiliser l’écart type arithmétique sur des données log-normales donne des résultats trompeurs :

Exemple : Données de charge virale

Valeurs : 1 000; 5 000; 10 000; 50 000; 100 000 copies/mL Moyenne arithmétique ± ÉT : 33 200 ± 41 424 Moyenne géométrique × ETG : 10 000 × 4,5 → Intervalle : 2 222 à 45 000 L’écart type arithmétique suggérerait que des valeurs négatives sont possibles — impossible pour des charges virales!

Vérifiez toujours la distribution

Avant de calculer toute mesure de dispersion, visualisez vos données. Si elles sont asymétriques à droite avec une longue queue, essayez une transformation logarithmique. Si cela les rend symétriques, utilisez les statistiques géométriques.

Further Reading

How to Read This Article

A statistics tutorial is a practical interpretation guide, not just a formula dump. It refers to the assumptions, notation, and reporting language that analysts need when they explain a result to a teacher, manager, client, or reviewer. The article body covers the specific topic, while the sections below create a common interpretation frame that readers can reuse across related metrics.

Reading goalWhat to focus onCommon mistake
DefinitionWhat the metric is and what quantity it summarizesTreating the formula as self-explanatory
Formula choiceSample versus population assumptions and notationUsing n when n-1 is required or vice versa
InterpretationWhether the result indicates concentration, spread, or riskCalling a large value good or bad without context

Frequently Asked Questions

How should I interpret a high standard deviation?

A high standard deviation means the observations are spread farther from the mean on average. Whether that spread is acceptable depends on the context: wide dispersion might signal risk in finance, instability in manufacturing, or genuine natural variation in scientific data.

Why do some articles mention n while others mention n-1?

The denominator reflects the difference between population and sample formulas. Population variance and population standard deviation use N because the full dataset is known. Sample variance and sample standard deviation often use n-1 because Bessel’s correction reduces bias when estimating population spread from a sample.

What is a statistical interpretation guide?

A statistical interpretation guide is a page that moves beyond arithmetic and explains meaning. It tells you what a metric is, when the formula applies, and how to describe the result in plain English without overstating certainty.

Can I cite this article in a report?

You should cite the underlying authoritative reference for formal work whenever possible. This page is best used as an explanatory bridge that helps you understand the concept before quoting the original standard or handbook.

Why include direct citations on every article page?

Direct citations give readers a route to verify the definition, notation, and assumptions. That improves trust and reduces the chance that a simplified explanation is mistaken for the entire technical standard.

Authoritative References

These sources define the concepts referenced most often across our articles. Bessel's correction is a sample adjustment, variance is a squared measure of spread, and standard deviation is the square root of variance expressed in the same units as the data.