Σ
SDCalc
AvansatAvansat·12 min

Deviația standard geometrică: ghid complet

Ghid complet despre deviația standard geometrică pentru analiza rapoartelor, ratelor de creștere și datelor cu distribuție log-normală. Include formule, pași de calcul, cod Python și aplicații în finanțe și știință.

Când se folosește deviația standard geometrică

Deviația standard geometrică (GSD) este măsura adecvată a dispersiei pentru date cu caracter multiplicativ, nu aditiv — precum ratele de creștere, rapoartele, concentrațiile sau orice măsurători cu distribuție log-normală.

Să luăm exemplul randamentelor bursiere: un câștig de 10% urmat de o pierdere de 10% nu te aduce înapoi la echilibru (ai rămâne cu 99% din valoarea inițială). Aceste relații multiplicative necesită statistici geometrice în locul celor aritmetice.

Ideea fundamentală

Dacă datele tale acoperă mai multe ordine de mărime, sunt întotdeauna pozitive și arată asimetric la dreapta pe o scală normală, dar simetric pe o scală logaritmică — ai de-a face cu date log-normale care necesită statistici geometrice.

Înțelegerea datelor log-normale

Datele au distribuție log-normală atunci când logaritmul lor natural urmează o distribuție normală. Exemple frecvente includ:

  • Prețurile acțiunilor și randamentele investițiilor în timp
  • Distribuțiile veniturilor și averii
  • Dimensiunile particulelor în aerosoli și produse farmaceutice
  • Numărul coloniilor bacteriene și încărcăturile virale
  • Concentrațiile poluanților din mediu
  • Titrurile de anticorpi și concentrațiile medicamentelor

Caracteristica esențială: procesele care implică multiplicare repetată generează distribuții log-normale, la fel cum adunarea repetată generează distribuții normale.

Formula și calculul

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Sau mai simplu: calculezi logaritmul natural al tuturor valorilor, determini deviația standard obișnuită, apoi exponențiezi.

1

Transformarea datelor

Calculează logaritmul natural al fiecărei valori: yᵢ = ln(xᵢ)
2

Calculul mediei

Determină media aritmetică a valorilor logaritmate: ȳ = Σyᵢ/n
3

Calculul DS

Determină deviația standard a valorilor logaritmate: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Transformarea inversă

Exponențiază pentru a obține GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Interpretarea valorilor GSD

Spre deosebire de DS aritmetică, care este exprimată în aceleași unități ca datele, GSD este un factor multiplicativ — un raport. O GSD de 2,0 înseamnă că datele variază de obicei cu un factor de 2.

  • GSD = 1,0:Fără variație (imposibil în practică)
  • GSD ≈ 1,2:Variabilitate redusă (±20% de obicei)
  • GSD ≈ 2,0:Variabilitate moderată (datele se dublează/înjumătățesc)
  • GSD ≈ 3,0:Variabilitate ridicată (acoperă un ordin de mărime)

Intervale de încredere

Pentru date log-normale, intervalul de 95% este aproximativ: Media geometrică ÷ GSD² până la Media geometrică × GSD². Pentru MG=100 și GSD=2, intervalul este de la 25 la 400.

Aplicații practice

Științe farmaceutice

Distribuția dimensiunilor particulelor (D50, GSD) · Variabilitatea concentrației medicamentelor · Studii de biodisponibilitate · Caracterizarea aerosolilor

Finanțe și economie

Volatilitatea randamentelor investițiilor · Analiza ratelor de creștere · Studii ale distribuției veniturilor · Modelarea prețurilor activelor

GSD vs. DS obișnuită

Utilizarea DS aritmetice pe date log-normale oferă rezultate înșelătoare:

Exemplu: date de încărcătură virală

Valori: 1.000; 5.000; 10.000; 50.000; 100.000 copii/mL Media aritmetică ± DS: 33.200 ± 41.424 Media geometrică × GSD: 10.000 × 4,5 → Interval: 2.222 la 45.000 DS aritmetică ar sugera că sunt posibile valori negative — imposibil pentru încărcăturile virale!

Verifică întotdeauna distribuția

Înainte de a calcula orice măsură a dispersiei, vizualizează datele. Dacă sunt asimetrice la dreapta cu o coadă lungă, încearcă o transformare logaritmică. Dacă aceasta le face simetrice, folosește statistici geometrice.