Σ
SDCalc
उन्नतउन्नत·12 min

ज्यामितीय मानक विचलन: संपूर्ण गाइड

अनुपातों, वृद्धि दरों और लॉग-सामान्य रूप से वितरित डेटा के विश्लेषण के लिए ज्यामितीय मानक विचलन की संपूर्ण गाइड। सूत्र, गणना चरण, Python कोड और वित्त एवं विज्ञान में अनुप्रयोग शामिल हैं।

ज्यामितीय मानक विचलन कब उपयोग करें

ज्यामितीय मानक विचलन (GSD) उस डेटा के लिए प्रसार का उपयुक्त माप है जो योगात्मक के बजाय गुणात्मक है—जैसे वृद्धि दर, अनुपात, सांद्रता, या कोई भी लॉग-सामान्य रूप से वितरित माप।

शेयर प्रतिफल पर विचार करें: 10% का लाभ और उसके बाद 10% की हानि आपको समस्थिति में नहीं लौटाती (आपके पास मूल का 99% होगा)। इन गुणात्मक संबंधों के लिए अंकगणितीय के बजाय ज्यामितीय सांख्यिकी की आवश्यकता होती है।

मुख्य अंतर्दृष्टि

यदि आपका डेटा कई परिमाण कोटियों में फैला हुआ है, हमेशा धनात्मक है, और सामान्य रूप से प्लॉट करने पर दाएँ-विषम दिखता है लेकिन लॉग मापनी पर प्लॉट करने पर सममित—आप लॉग-सामान्य डेटा के साथ काम कर रहे हैं जिसे ज्यामितीय सांख्यिकी की आवश्यकता है।

लॉग-सामान्य डेटा को समझना

डेटा लॉग-सामान्य रूप से वितरित होता है जब इसका प्राकृतिक लघुगणक सामान्य वितरण का पालन करता है। सामान्य उदाहरणों में शामिल हैं:

  • समय के साथ शेयर कीमतें और निवेश प्रतिफल
  • आय और संपत्ति वितरण
  • एरोसोल और औषधियों में कण आकार
  • जीवाणु कॉलोनी गिनती और वायरल भार
  • पर्यावरणीय प्रदूषक सांद्रता
  • प्रतिरक्षी अनुमापांक और दवा सांद्रता

मुख्य विशेषता: बार-बार गुणन वाली प्रक्रियाएँ लॉग-सामान्य वितरण उत्पन्न करती हैं, ठीक वैसे ही जैसे बार-बार जोड़ सामान्य वितरण उत्पन्न करता है।

सूत्र और गणना

ज्यामितीय मानक विचलन

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

या अधिक सरल रूप से: सभी मानों का प्राकृतिक लघुगणक लें, सामान्य मानक विचलन की गणना करें, फिर घातांकित करें।

1

डेटा रूपांतरित करें

प्रत्येक मान का प्राकृतिक लघुगणक निकालें: yᵢ = ln(xᵢ)
2

माध्य निकालें

लॉग मानों का अंकगणितीय माध्य ज्ञात करें: ȳ = Σyᵢ/n
3

SD निकालें

लॉग मानों का मानक विचलन ज्ञात करें: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

वापस रूपांतरित करें

GSD प्राप्त करने के लिए घातांकित करें: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

GSD मानों की व्याख्या

अंकगणितीय SD के विपरीत जो आपके डेटा की इकाइयों में होता है, GSD एक गुणात्मक कारक है—एक अनुपात। 2.0 का GSD का अर्थ है कि डेटा आमतौर पर 2 के कारक से भिन्न होता है।

  • GSD = 1.0:कोई विचरण नहीं (व्यवहार में असंभव)
  • GSD ≈ 1.2:कम परिवर्तनशीलता (±20% सामान्य)
  • GSD ≈ 2.0:मध्यम परिवर्तनशीलता (डेटा दोगुना/आधा होता है)
  • GSD ≈ 3.0:उच्च परिवर्तनशीलता (एक परिमाण कोटि में फैला)

विश्वास अंतराल

लॉग-सामान्य डेटा के लिए, 95% परिसर लगभग है: ज्यामितीय माध्य ÷ GSD² से ज्यामितीय माध्य × GSD²। GM=100 और GSD=2 के लिए, परिसर 25 से 400 है।

वास्तविक अनुप्रयोग

औषधीय विज्ञान

कण आकार वितरण (D50, GSD) · दवा सांद्रता परिवर्तनशीलता · जैव उपलब्धता अध्ययन · एरोसोल लक्षण वर्णन

वित्त और अर्थशास्त्र

निवेश प्रतिफल अस्थिरता · वृद्धि दर विश्लेषण · आय वितरण अध्ययन · परिसंपत्ति मूल्य मॉडलिंग

GSD vs सामान्य SD

लॉग-सामान्य डेटा पर अंकगणितीय SD का उपयोग भ्रामक परिणाम देता है:

उदाहरण: वायरल लोड डेटा

मान: 1,000; 5,000; 10,000; 50,000; 100,000 प्रतियाँ/mL अंकगणितीय माध्य ± SD: 33,200 ± 41,424 ज्यामितीय माध्य × GSD: 10,000 × 4.5 → परिसर: 2,222 से 45,000 अंकगणितीय SD सुझाव देता है कि ऋणात्मक मान संभव हैं—वायरल लोड के लिए असंभव!

हमेशा वितरण जाँचें

कोई भी प्रसार माप गणना करने से पहले, अपने डेटा का दृश्यावलोकन करें। यदि यह लंबी पूँछ के साथ दाएँ-विषम है, तो लॉग रूपांतरण आज़माएँ। यदि वह इसे सममित बनाता है, तो ज्यामितीय सांख्यिकी का उपयोग करें।