Σ
SDCalc
ΠροχωρημένοιΠροχωρημένα·12 min

Γεωμετρική Τυπική Απόκλιση: Πλήρης Οδηγός

Πλήρης οδηγός γεωμετρικής τυπικής απόκλισης για ανάλυση αναλογιών, ρυθμών ανάπτυξης και λογαριθμοκανονικά κατανεμημένων δεδομένων. Περιλαμβάνει τύπους, βήματα υπολογισμού, κώδικα Python και εφαρμογές σε χρηματοοικονομικά και επιστήμες.

Πότε να Χρησιμοποιήσετε Γεωμετρική Τυπική Απόκλιση

Η γεωμετρική τυπική απόκλιση (GSD) είναι το κατάλληλο μέτρο διασποράς για δεδομένα που είναι πολλαπλασιαστικά αντί προσθετικά — όπως ρυθμοί ανάπτυξης, αναλογίες, συγκεντρώσεις ή οποιεσδήποτε λογαριθμοκανονικά κατανεμημένες μετρήσεις.

Σκεφτείτε τις αποδόσεις μετοχών: ένα κέρδος 10% ακολουθούμενο από απώλεια 10% δεν σας επιστρέφει στο αρχικό σημείο (θα έχετε 99% του αρχικού). Αυτές οι πολλαπλασιαστικές σχέσεις απαιτούν γεωμετρικά στατιστικά αντί αριθμητικών.

Βασική Ιδέα

Αν τα δεδομένα σας εκτείνονται σε αρκετές τάξεις μεγέθους, είναι πάντα θετικά και φαίνονται δεξιά ασύμμετρα σε κανονικό γράφημα αλλά συμμετρικά σε λογαριθμική κλίμακα — έχετε λογαριθμοκανονικά δεδομένα που χρειάζονται γεωμετρικά στατιστικά.

Κατανόηση Λογαριθμοκανονικών Δεδομένων

Τα δεδομένα ακολουθούν λογαριθμοκανονική κατανομή όταν ο φυσικός λογάριθμός τους ακολουθεί κανονική κατανομή. Τυπικά παραδείγματα:

  • Τιμές μετοχών και επενδυτικές αποδόσεις στο χρόνο
  • Κατανομές εισοδήματος και πλούτου
  • Μεγέθη σωματιδίων σε αερολύματα και φαρμακευτικά
  • Αριθμοί βακτηριακών αποικιών και ιικά φορτία
  • Συγκεντρώσεις περιβαλλοντικών ρύπων
  • Τίτλοι αντισωμάτων και συγκεντρώσεις φαρμάκων

Το βασικό χαρακτηριστικό: διαδικασίες που περιλαμβάνουν επαναλαμβανόμενο πολλαπλασιασμό δημιουργούν λογαριθμοκανονικές κατανομές, όπως η επαναλαμβανόμενη πρόσθεση δημιουργεί κανονικές κατανομές.

Τύπος και Υπολογισμός

Geometric Standard Deviation

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

Ή πιο απλά: πάρτε τον φυσικό λογάριθμο όλων των τιμών, υπολογίστε την κανονική τυπική απόκλιση και εκθετικοποιήστε.

1

Μετασχηματισμός Δεδομένων

Υπολογίστε τον φυσικό λογάριθμο κάθε τιμής: yᵢ = ln(xᵢ)
2

Υπολογισμός Μέσου

Βρείτε τον αριθμητικό μέσο των λογαριθμικών τιμών: ȳ = Σyᵢ/n
3

Υπολογισμός ΤΑ

Βρείτε την τυπική απόκλιση των λογαριθμικών τιμών: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

Αντίστροφος Μετασχηματισμός

Εκθετικοποιήστε για GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

Ερμηνεία Τιμών GSD

Σε αντίθεση με την αριθμητική ΤΑ που εκφράζεται στις ίδιες μονάδες με τα δεδομένα, η GSD είναι ένας πολλαπλασιαστικός παράγοντας — μια αναλογία. GSD = 2,0 σημαίνει ότι τα δεδομένα τυπικά μεταβάλλονται κατά παράγοντα 2.

  • GSD = 1,0:Καμία μεταβλητότητα (αδύνατο στην πράξη)
  • GSD ≈ 1,2:Χαμηλή μεταβλητότητα (±20% τυπικά)
  • GSD ≈ 2,0:Μέτρια μεταβλητότητα (τα δεδομένα διπλασιάζονται/υποδιπλασιάζονται)
  • GSD ≈ 3,0:Υψηλή μεταβλητότητα (εκτείνονται σε τάξη μεγέθους)

Διαστήματα Εμπιστοσύνης

Για λογαριθμοκανονικά δεδομένα, το 95% εύρος είναι περίπου: Γεωμετρικός Μέσος ÷ GSD² έως Γεωμετρικός Μέσος × GSD². Για GM=100 και GSD=2, το εύρος είναι 25 έως 400.

Εφαρμογές στον Πραγματικό Κόσμο

Φαρμακευτικές Επιστήμες

Κατανομή μεγέθους σωματιδίων (D50, GSD) · Μεταβλητότητα συγκέντρωσης φαρμάκων · Μελέτες βιοδιαθεσιμότητας · Χαρακτηρισμός αερολυμάτων

Χρηματοοικονομικά & Οικονομικά

Μεταβλητότητα αποδόσεων επενδύσεων · Ανάλυση ρυθμών ανάπτυξης · Μελέτες κατανομής εισοδήματος · Μοντελοποίηση τιμών περιουσιακών στοιχείων

GSD vs Κανονική ΤΑ

Η χρήση αριθμητικής ΤΑ σε λογαριθμοκανονικά δεδομένα δίνει παραπλανητικά αποτελέσματα:

Παράδειγμα: Δεδομένα Ιικού Φορτίου

Τιμές: 1.000, 5.000, 10.000, 50.000, 100.000 αντίγραφα/mL Αριθμητικός Μέσος ± ΤΑ: 33.200 ± 41.424 Γεωμετρικός Μέσος × GSD: 10.000 × 4,5 → Εύρος: 2.222 έως 45.000 Η αριθμητική ΤΑ θα υπονοούσε ότι αρνητικές τιμές είναι δυνατές — αδύνατο για ιικά φορτία!

Πάντα Ελέγχετε την Κατανομή

Πριν υπολογίσετε οποιοδήποτε μέτρο διασποράς, οπτικοποιήστε τα δεδομένα σας. Αν είναι δεξιά ασύμμετρα με μακριά ουρά, δοκιμάστε λογαριθμικό μετασχηματισμό. Αν αυτό τα κάνει συμμετρικά, χρησιμοποιήστε γεωμετρικά στατιστικά.