Πότε να Χρησιμοποιήσετε Γεωμετρική Τυπική Απόκλιση
Η γεωμετρική τυπική απόκλιση (GSD) είναι το κατάλληλο μέτρο διασποράς για δεδομένα που είναι πολλαπλασιαστικά αντί προσθετικά — όπως ρυθμοί ανάπτυξης, αναλογίες, συγκεντρώσεις ή οποιεσδήποτε λογαριθμοκανονικά κατανεμημένες μετρήσεις.
Σκεφτείτε τις αποδόσεις μετοχών: ένα κέρδος 10% ακολουθούμενο από απώλεια 10% δεν σας επιστρέφει στο αρχικό σημείο (θα έχετε 99% του αρχικού). Αυτές οι πολλαπλασιαστικές σχέσεις απαιτούν γεωμετρικά στατιστικά αντί αριθμητικών.
Βασική Ιδέα
Κατανόηση Λογαριθμοκανονικών Δεδομένων
Τα δεδομένα ακολουθούν λογαριθμοκανονική κατανομή όταν ο φυσικός λογάριθμός τους ακολουθεί κανονική κατανομή. Τυπικά παραδείγματα:
- Τιμές μετοχών και επενδυτικές αποδόσεις στο χρόνο
- Κατανομές εισοδήματος και πλούτου
- Μεγέθη σωματιδίων σε αερολύματα και φαρμακευτικά
- Αριθμοί βακτηριακών αποικιών και ιικά φορτία
- Συγκεντρώσεις περιβαλλοντικών ρύπων
- Τίτλοι αντισωμάτων και συγκεντρώσεις φαρμάκων
Το βασικό χαρακτηριστικό: διαδικασίες που περιλαμβάνουν επαναλαμβανόμενο πολλαπλασιασμό δημιουργούν λογαριθμοκανονικές κατανομές, όπως η επαναλαμβανόμενη πρόσθεση δημιουργεί κανονικές κατανομές.
Τύπος και Υπολογισμός
Geometric Standard Deviation
Ή πιο απλά: πάρτε τον φυσικό λογάριθμο όλων των τιμών, υπολογίστε την κανονική τυπική απόκλιση και εκθετικοποιήστε.
Μετασχηματισμός Δεδομένων
Υπολογισμός Μέσου
Υπολογισμός ΤΑ
Αντίστροφος Μετασχηματισμός
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")Ερμηνεία Τιμών GSD
Σε αντίθεση με την αριθμητική ΤΑ που εκφράζεται στις ίδιες μονάδες με τα δεδομένα, η GSD είναι ένας πολλαπλασιαστικός παράγοντας — μια αναλογία. GSD = 2,0 σημαίνει ότι τα δεδομένα τυπικά μεταβάλλονται κατά παράγοντα 2.
- GSD = 1,0:Καμία μεταβλητότητα (αδύνατο στην πράξη)
- GSD ≈ 1,2:Χαμηλή μεταβλητότητα (±20% τυπικά)
- GSD ≈ 2,0:Μέτρια μεταβλητότητα (τα δεδομένα διπλασιάζονται/υποδιπλασιάζονται)
- GSD ≈ 3,0:Υψηλή μεταβλητότητα (εκτείνονται σε τάξη μεγέθους)
Διαστήματα Εμπιστοσύνης
Εφαρμογές στον Πραγματικό Κόσμο
Φαρμακευτικές Επιστήμες
Χρηματοοικονομικά & Οικονομικά
GSD vs Κανονική ΤΑ
Η χρήση αριθμητικής ΤΑ σε λογαριθμοκανονικά δεδομένα δίνει παραπλανητικά αποτελέσματα:
Παράδειγμα: Δεδομένα Ιικού Φορτίου
Πάντα Ελέγχετε την Κατανομή