Kailan Gamitin ang Geometric Standard Deviation
Ang geometric standard deviation (GSD) ang naaangkop na sukatan ng pagkakalat para sa data na multiplicative sa halip na additive—tulad ng growth rates, ratios, concentrations, o anumang log-normally distributed na mga sukat.
Isipin ang mga stock return: ang pagtaas ng 10% na sinundan ng pagbaba ng 10% ay hindi ka ibabalik sa dating halaga (magkakaroon ka ng 99% ng orihinal). Ang mga multiplicative na relasyong ito ay nangangailangan ng geometric statistics sa halip na arithmetic.
Pangunahing Insight
Pag-unawa sa Log-Normal Data
Ang data ay log-normally distributed kapag ang natural logarithm nito ay sumusunod sa normal distribution. Mga karaniwang halimbawa:
- Mga presyo ng stock at investment returns sa paglipas ng panahon
- Mga distribusyon ng kita at kayamanan
- Mga laki ng particle sa aerosols at pharmaceuticals
- Mga bilang ng bacterial colony at viral loads
- Mga konsentrasyon ng environmental pollutant
- Mga antibody titer at drug concentration
Ang pangunahing katangian: ang mga prosesong nagsasangkot ng paulit-ulit na pagpaparami ay gumagawa ng log-normal distributions, tulad ng paulit-ulit na pagdaragdag na gumagawa ng normal distributions.
Formula at Kalkulasyon
Geometric Standard Deviation
O mas simple: kunin ang natural log ng lahat ng halaga, kalkulahin ang regular standard deviation, pagkatapos i-exponentiate.
I-transform ang Data
Kalkulahin ang Mean
Kalkulahin ang SD
I-back-transform
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Pag-interpret ng GSD Values
Hindi tulad ng arithmetic SD na nasa parehong unit ng iyong data, ang GSD ay isang multiplicative factor—isang ratio. Ang GSD na 2.0 ay nangangahulugang karaniwang nag-iiba ang data sa factor na 2.
- GSD = 1.0:Walang variation (imposible sa praktika)
- GSD ≈ 1.2:Mababang variability (±20% ang karaniwan)
- GSD ≈ 2.0:Katamtamang variability (doble/kalahati ang data)
- GSD ≈ 3.0:Mataas na variability (sumasaklaw sa isang order of magnitude)
Mga Confidence Interval
Mga Aplikasyon sa Totoong Mundo
Pharmaceutical Sciences
Pananalapi at Ekonomiya
GSD vs Regular SD
Ang paggamit ng arithmetic SD sa log-normal data ay nagbibigay ng nakakalitong resulta:
Halimbawa: Viral Load Data
Palaging Suriin ang Distribution