Când se folosește deviația standard geometrică
Deviația standard geometrică (GSD) este măsura adecvată a dispersiei pentru date cu caracter multiplicativ, nu aditiv — precum ratele de creștere, rapoartele, concentrațiile sau orice măsurători cu distribuție log-normală.
Să luăm exemplul randamentelor bursiere: un câștig de 10% urmat de o pierdere de 10% nu te aduce înapoi la echilibru (ai rămâne cu 99% din valoarea inițială). Aceste relații multiplicative necesită statistici geometrice în locul celor aritmetice.
Ideea fundamentală
Înțelegerea datelor log-normale
Datele au distribuție log-normală atunci când logaritmul lor natural urmează o distribuție normală. Exemple frecvente includ:
- Prețurile acțiunilor și randamentele investițiilor în timp
- Distribuțiile veniturilor și averii
- Dimensiunile particulelor în aerosoli și produse farmaceutice
- Numărul coloniilor bacteriene și încărcăturile virale
- Concentrațiile poluanților din mediu
- Titrurile de anticorpi și concentrațiile medicamentelor
Caracteristica esențială: procesele care implică multiplicare repetată generează distribuții log-normale, la fel cum adunarea repetată generează distribuții normale.
Formula și calculul
Geometric Standard Deviation
Sau mai simplu: calculezi logaritmul natural al tuturor valorilor, determini deviația standard obișnuită, apoi exponențiezi.
Transformarea datelor
Calculul mediei
Calculul DS
Transformarea inversă
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Interpretarea valorilor GSD
Spre deosebire de DS aritmetică, care este exprimată în aceleași unități ca datele, GSD este un factor multiplicativ — un raport. O GSD de 2,0 înseamnă că datele variază de obicei cu un factor de 2.
- GSD = 1,0:Fără variație (imposibil în practică)
- GSD ≈ 1,2:Variabilitate redusă (±20% de obicei)
- GSD ≈ 2,0:Variabilitate moderată (datele se dublează/înjumătățesc)
- GSD ≈ 3,0:Variabilitate ridicată (acoperă un ordin de mărime)
Intervale de încredere
Aplicații practice
Științe farmaceutice
Finanțe și economie
GSD vs. DS obișnuită
Utilizarea DS aritmetice pe date log-normale oferă rezultate înșelătoare:
Exemplu: date de încărcătură virală
Verifică întotdeauna distribuția