Kapan Menggunakan Simpangan Baku Geometrik
Simpangan baku geometrik (GSD) adalah ukuran sebaran yang tepat untuk data yang bersifat multiplikatif alih-alih aditif—seperti tingkat pertumbuhan, rasio, konsentrasi, atau pengukuran berdistribusi log-normal apa pun.
Pertimbangkan imbal hasil saham: keuntungan 10% diikuti kerugian 10% tidak mengembalikan Anda ke titik impas (Anda akan memiliki 99% dari nilai asli). Hubungan multiplikatif ini memerlukan statistik geometrik alih-alih aritmetik.
Wawasan Utama
Memahami Data Log-Normal
Data berdistribusi log-normal ketika logaritma naturalnya mengikuti distribusi normal. Contoh umum meliputi:
- Harga saham dan imbal hasil investasi dari waktu ke waktu
- Distribusi pendapatan dan kekayaan
- Ukuran partikel dalam aerosol dan farmasi
- Jumlah koloni bakteri dan viral load
- Konsentrasi polutan lingkungan
- Titer antibodi dan konsentrasi obat
Karakteristik utama: proses yang melibatkan perkalian berulang menghasilkan distribusi log-normal, sama seperti penjumlahan berulang menghasilkan distribusi normal.
Rumus dan Perhitungan
Simpangan Baku Geometrik
Atau lebih sederhana: ambil logaritma natural dari semua nilai, hitung simpangan baku biasa, lalu eksponensiasikan.
Transformasi Data
Hitung Rata-rata
Hitung SD
Transformasi Balik
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Menginterpretasi Nilai GSD
Berbeda dengan SD aritmetik yang memiliki satuan sama dengan data Anda, GSD adalah faktor multiplikatif—sebuah rasio. GSD 2,0 berarti data biasanya bervariasi dengan faktor 2.
- GSD = 1,0:Tidak ada variasi (mustahil dalam praktik)
- GSD ≈ 1,2:Variabilitas rendah (±20% tipikal)
- GSD ≈ 2,0:Variabilitas moderat (data berlipat dua/setengah)
- GSD ≈ 3,0:Variabilitas tinggi (mencakup satu orde besaran)
Interval Kepercayaan
Aplikasi Dunia Nyata
Ilmu Farmasi
Keuangan & Ekonomi
GSD vs SD Biasa
Menggunakan SD aritmetik pada data log-normal memberikan hasil yang menyesatkan:
Contoh: Data Viral Load
Selalu Periksa Distribusi