ज्यामितीय मानक विचलन कब उपयोग करें
ज्यामितीय मानक विचलन (GSD) उस डेटा के लिए प्रसार का उपयुक्त माप है जो योगात्मक के बजाय गुणात्मक है—जैसे वृद्धि दर, अनुपात, सांद्रता, या कोई भी लॉग-सामान्य रूप से वितरित माप।
शेयर प्रतिफल पर विचार करें: 10% का लाभ और उसके बाद 10% की हानि आपको समस्थिति में नहीं लौटाती (आपके पास मूल का 99% होगा)। इन गुणात्मक संबंधों के लिए अंकगणितीय के बजाय ज्यामितीय सांख्यिकी की आवश्यकता होती है।
मुख्य अंतर्दृष्टि
लॉग-सामान्य डेटा को समझना
डेटा लॉग-सामान्य रूप से वितरित होता है जब इसका प्राकृतिक लघुगणक सामान्य वितरण का पालन करता है। सामान्य उदाहरणों में शामिल हैं:
- समय के साथ शेयर कीमतें और निवेश प्रतिफल
- आय और संपत्ति वितरण
- एरोसोल और औषधियों में कण आकार
- जीवाणु कॉलोनी गिनती और वायरल भार
- पर्यावरणीय प्रदूषक सांद्रता
- प्रतिरक्षी अनुमापांक और दवा सांद्रता
मुख्य विशेषता: बार-बार गुणन वाली प्रक्रियाएँ लॉग-सामान्य वितरण उत्पन्न करती हैं, ठीक वैसे ही जैसे बार-बार जोड़ सामान्य वितरण उत्पन्न करता है।
सूत्र और गणना
ज्यामितीय मानक विचलन
या अधिक सरल रूप से: सभी मानों का प्राकृतिक लघुगणक लें, सामान्य मानक विचलन की गणना करें, फिर घातांकित करें।
डेटा रूपांतरित करें
माध्य निकालें
SD निकालें
वापस रूपांतरित करें
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")GSD मानों की व्याख्या
अंकगणितीय SD के विपरीत जो आपके डेटा की इकाइयों में होता है, GSD एक गुणात्मक कारक है—एक अनुपात। 2.0 का GSD का अर्थ है कि डेटा आमतौर पर 2 के कारक से भिन्न होता है।
- GSD = 1.0:कोई विचरण नहीं (व्यवहार में असंभव)
- GSD ≈ 1.2:कम परिवर्तनशीलता (±20% सामान्य)
- GSD ≈ 2.0:मध्यम परिवर्तनशीलता (डेटा दोगुना/आधा होता है)
- GSD ≈ 3.0:उच्च परिवर्तनशीलता (एक परिमाण कोटि में फैला)
विश्वास अंतराल
वास्तविक अनुप्रयोग
औषधीय विज्ञान
वित्त और अर्थशास्त्र
GSD vs सामान्य SD
लॉग-सामान्य डेटा पर अंकगणितीय SD का उपयोग भ्रामक परिणाम देता है:
उदाहरण: वायरल लोड डेटा
हमेशा वितरण जाँचें