Σ
SDCalc
मध्यवर्तीFundamentals·9 min

स्टैंडर्ड डेविएशन बनाम वैरिएंस: मुख्य अंतर की पूरी जानकारी

स्टैंडर्ड डेविएशन और वैरिएंस के बीच के महत्वपूर्ण अंतरों को समझें। जानिए कब किसका उपयोग करें, उनके सूत्र क्या हैं, और डेटा विश्लेषण में ये कैसे काम आते हैं।

By Standard Deviation Calculator Team · Data Science Team·Published

वैरिएंस क्या है?

वैरिएंस (पॉपुलेशन के लिए σ² और सैंपल के लिए s² से दर्शाया जाता है) एक सांख्यिकीय माप है जो डेटा सेट में मौजूद संख्याओं के बीच फैलाव को दर्शाता है। यह माध्य (μ) से विचलनों के वर्गों के औसत को दर्शाता है। विचलनों को वर्ग करने से यह सुनिश्चित होता है कि ऋणात्मक और धनात्मक विचलन एक-दूसरे को कैंसिल न करें, जिससे हमें फैलाव का सही माप मिलता है। हालांकि, चूंकि विचलनों को वर्ग किया जाता है, वैरिएंस की इकाई मूल डेटा की इकाई का वर्ग होती है, जिससे इसकी सीधी व्याख्या करना थोड़ा अमूर्त (abstract) हो जाता है।

पॉपुलेशन वैरिएंस

σ² = Σ(xᵢ - μ)² / N

माप की इकाइयाँ

यदि आपका डेटा सेंटीमीटर में लंबाई को दर्शाता है, तो वैरिएंस सेंटीमीटर के वर्ग (cm²) में व्यक्त किया जाएगा। यह वर्ग इकाई ही एक मुख्य कारण है कि व्यावहारिक और वास्तविक दुनिया के संदर्भ में वैरिएंस की व्याख्या करना कठिन हो सकता है।

स्टैंडर्ड डेविएशन क्या है?

स्टैंडर्ड डेविएशन (पॉपुलेशन के लिए σ और सैंपल के लिए s से दर्शाया जाता है) वैरिएंस का वर्गमूल है। यह मापता है कि व्यक्तिगत डेटा बिंदु औसत से कितनी मात्रा में विचलित होते हैं। चूंकि इसे वैरिएंस का वर्गमूल निकालकर प्राप्त किया जाता है, स्टैंडर्ड डेविएशन मूल डेटा की इकाइयों में ही व्यक्त किया जाता है, जिससे यह वास्तविक दुनिया के अनुप्रयोगों के लिए बहुत अधिक सहज और समझने योग्य बन जाता है। यह सांख्यिकीय फैलाव का सबसे व्यापक रूप से उपयोग किया जाने वाला माप है।

पॉपुलेशन स्टैंडर्ड डेविएशन

σ = √(Σ(xᵢ - μ)² / N)

स्टैंडर्ड डेविएशन बनाम वैरिएंस: मुख्य अंतर

हालांकि दोनों मेट्रिक्स माध्य के आसपास डेटा बिंदुओं के फैलाव को मापते हैं, लेकिन उनके गणितीय संबंध और व्यावहारिक उपयोगिता में काफी अंतर है। मूल अंतर उनकी इकाइयों और व्याख्या करने की क्षमता में निहित है। स्टैंडर्ड डेविएशन वैरिएंस का वर्गमूल है, जो फैलाव के माप को वापस डेटा की मूल इकाइयों में ले आता है। वैरिएंस, एक वर्गित मान होने के कारण, आउटलायर्स (बहिष्कृत मान) को असमान रूप से भार देता है, जिससे यह चरम मानों के प्रति अत्यधिक संवेदनशील हो जाता है।

विशेषतावैरिएंस (σ² / s²)स्टैंडर्ड डेविएशन (σ / s)
गणितीय आधारवर्ग किए गए विचलनों का औसतवैरिएंस का वर्गमूल
इकाइयाँवर्ग इकाइयाँ (जैसे, cm², ₹²)मूल इकाइयाँ (जैसे, cm, ₹)
व्याख्या करने की क्षमताअमूर्त; डेटा से जोड़ना कठिनसहज; डेटा से सीधा मेल खाता है
आउटलायर्स के प्रति संवेदनशीलताउच्च (वर्ग करने के कारण)मध्यम (वर्गमूल प्रभाव को कम करता है)
मुख्य उपयोगसांख्यिकीय अनुमान, ANOVA, पोर्टफोलियो थ्योरीवर्णनात्मक सांख्यिकी, रिपोर्टिंग, अनुभवजन्य नियम

पॉपुलेशन और सैंपल के सूत्र

इन मेट्रिक्स की गणना करते समय, आपको पॉपुलेशन और सैंपल के बीच अंतर करना चाहिए। पॉपुलेशन में एक निर्दिष्ट समूह के सभी सदस्य शामिल होते हैं, जबकि सैंपल उस पॉपुलेशन का एक उपसमूह होता है। सैंपल सूत्र में (n - 1) के हर का उपयोग करना—जिसे बेसेल का सुधार (Bessel's correction) कहा जाता है—सैंपल से पॉपुलेशन वैरिएंस का अनुमान लगाते समय अंतर्निहित पूर्वाग्रह (bias) को ठीक करता है, यह सुनिश्चित करते हुए कि अनुमानक (estimator) अनभिनत (unbiased) है।

सैंपल वैरिएंस

s² = Σ(xᵢ - x̄)² / (n - 1)

n बनाम n-1 के जाल से बचें

सैंपल वैरिएंस के लिए '(n - 1)' की जगह 'n' का उपयोग करने से वास्तविक पॉपुलेशन वैरिएंस का व्यवस्थित रूप से कम अनुमान लगेगा। पॉपुलेशन पैरामीटर का अनुमान लगाने के लिए सैंपल डेटा के साथ काम करते समय हमेशा स्वतंत्रता की कोटियों (degrees of freedom, df = n - 1) का उपयोग करें।

वैरिएंस और स्टैंडर्ड डेविएशन का उपयोग कब करें

वैरिएंस और स्टैंडर्ड डेविएशन के बीच चयन पूरी तरह से आपके विश्लेषणात्मक लक्ष्य पर निर्भर करता है। यदि आप अपने डेटा के फैलाव को एक गैर-तकनीकी दर्शकों को बता रहे हैं, तो स्टैंडर्ड डेविएशन स्पष्ट रूप से बेहतर विकल्प है क्योंकि यह डेटा की प्राकृतिक इकाइयों के साथ मेल खाता है। हालांकि, यदि आप मध्यवर्ती सांख्यिकीय गणनाएँ कर रहे हैं—जैसे ANOVA में F-सांख्यिकी की गणना करना, मॉडर्न पोर्टफोलियो थ्योरी में जोखिम का आकलन करना, या परिकल्पना परीक्षण करना—तो वैरिएंस गणितीय रूप से अधिक सुविधाजनक है।

वैरिएंस का उपयोग कब करें...

- ANOVA या F-टेस्ट करते समय - पोर्टफोलियो जोखिम (कोवैरिएंस मैट्रिक्स) की गणना करते समय - सैद्धांतिक सांख्यिकीय प्रमाण करते समय - मशीन लर्निंग लॉस फंक्शन (जैसे, MSE) विकसित करते समय

स्टैंडर्ड डेविएशन का उपयोग कब करें...

- प्रकाशनों में डेटा फैलाव की रिपोर्ट करते समय - अनुभवजन्य नियम (68-95-99.7) लागू करते समय - गुणवत्ता आश्वासन के लिए कंट्रोल चार्ट बनाते समय - गैर-तकनीकी हितधारकों को परिवर्तनशीलता बताते समय

पायथन में SD और वैरिएंस की गणना

पायथन का `statistics` मॉड्यूल वैरिएंस और स्टैंडर्ड डेविएशन दोनों के लिए अंतर्निहित फ़ंक्शन प्रदान करता है। इन फ़ंक्शन का उपयोग करते समय, यह चुनना बहुत महत्वपूर्ण है कि आपका डेटा पॉपुलेशन को दर्शाता है या सैंपल को, और उसके आधार पर सही विधि का चयन करें।

python
import statistics

# सैंपल डेटासेट
data = [14, 18, 12, 15, 11]

# सैंपल वैरिएंस और SD की गणना करें
sample_var = statistics.variance(data)
sample_sd = statistics.stdev(data)

# पॉपुलेशन वैरिएंस और SD की गणना करें
pop_var = statistics.pvariance(data)
pop_sd = statistics.pstdev(data)

print(f"Sample Variance: {sample_var:.2f}")
print(f"Sample SD: {sample_sd:.2f}")
print(f"Population Variance: {pop_var:.2f}")
print(f"Population SD: {pop_sd:.2f}")

अक्सर पूछे जाने वाले प्रश्न

  • क्या वैरिएंस ऋणात्मक हो सकता है? नहीं, क्योंकि वर्ग किए गए विचलनों (xᵢ - μ)² का योग हमेशा शून्य या धनात्मक मान होता है, वैरिएंस कभी भी ऋणात्मक नहीं हो सकता।
  • रिपोर्टिंग के लिए वैरिएंस की तुलना में स्टैंडर्ड डेविएशन को प्राथमिकता क्यों दी जाती है? स्टैंडर्ड डेविएशन को प्राथमिकता इसलिए दी जाती है क्योंकि यह माध्य के समान ही इकाइयों को साझा करता है, जिससे इसे कच्चे डेटा के साथ संदर्भ में रखकर व्याख्या करना बहुत आसान हो जाता है।
  • क्या वैरिएंस मीन स्क्वायर्ड एरर (MSE) के समान है? वे समान हैं, लेकिन MSE आमतौर पर अनुमानित मानों और वास्तविक मान के बीच औसत वर्ग अंतर को मापता है, जबकि वैरिएंस माध्य के आसपास फैलाव को मापता है। यदि अनुमानक माध्य है, तो MSE वैरिएंस के बराबर होता है।

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. स्टैंडर्ड डेविएशन - विकिपीडिया
  2. NIST/SEMATECH सांख्यिकीय विधियों की ई-हैंडबुक