वैरिएंस क्या है?
वैरिएंस (पॉपुलेशन के लिए σ² और सैंपल के लिए s² से दर्शाया जाता है) एक सांख्यिकीय माप है जो डेटा सेट में मौजूद संख्याओं के बीच फैलाव को दर्शाता है। यह माध्य (μ) से विचलनों के वर्गों के औसत को दर्शाता है। विचलनों को वर्ग करने से यह सुनिश्चित होता है कि ऋणात्मक और धनात्मक विचलन एक-दूसरे को कैंसिल न करें, जिससे हमें फैलाव का सही माप मिलता है। हालांकि, चूंकि विचलनों को वर्ग किया जाता है, वैरिएंस की इकाई मूल डेटा की इकाई का वर्ग होती है, जिससे इसकी सीधी व्याख्या करना थोड़ा अमूर्त (abstract) हो जाता है।
पॉपुलेशन वैरिएंस
माप की इकाइयाँ
स्टैंडर्ड डेविएशन क्या है?
स्टैंडर्ड डेविएशन (पॉपुलेशन के लिए σ और सैंपल के लिए s से दर्शाया जाता है) वैरिएंस का वर्गमूल है। यह मापता है कि व्यक्तिगत डेटा बिंदु औसत से कितनी मात्रा में विचलित होते हैं। चूंकि इसे वैरिएंस का वर्गमूल निकालकर प्राप्त किया जाता है, स्टैंडर्ड डेविएशन मूल डेटा की इकाइयों में ही व्यक्त किया जाता है, जिससे यह वास्तविक दुनिया के अनुप्रयोगों के लिए बहुत अधिक सहज और समझने योग्य बन जाता है। यह सांख्यिकीय फैलाव का सबसे व्यापक रूप से उपयोग किया जाने वाला माप है।
पॉपुलेशन स्टैंडर्ड डेविएशन
स्टैंडर्ड डेविएशन बनाम वैरिएंस: मुख्य अंतर
हालांकि दोनों मेट्रिक्स माध्य के आसपास डेटा बिंदुओं के फैलाव को मापते हैं, लेकिन उनके गणितीय संबंध और व्यावहारिक उपयोगिता में काफी अंतर है। मूल अंतर उनकी इकाइयों और व्याख्या करने की क्षमता में निहित है। स्टैंडर्ड डेविएशन वैरिएंस का वर्गमूल है, जो फैलाव के माप को वापस डेटा की मूल इकाइयों में ले आता है। वैरिएंस, एक वर्गित मान होने के कारण, आउटलायर्स (बहिष्कृत मान) को असमान रूप से भार देता है, जिससे यह चरम मानों के प्रति अत्यधिक संवेदनशील हो जाता है।
| विशेषता | वैरिएंस (σ² / s²) | स्टैंडर्ड डेविएशन (σ / s) |
|---|---|---|
| गणितीय आधार | वर्ग किए गए विचलनों का औसत | वैरिएंस का वर्गमूल |
| इकाइयाँ | वर्ग इकाइयाँ (जैसे, cm², ₹²) | मूल इकाइयाँ (जैसे, cm, ₹) |
| व्याख्या करने की क्षमता | अमूर्त; डेटा से जोड़ना कठिन | सहज; डेटा से सीधा मेल खाता है |
| आउटलायर्स के प्रति संवेदनशीलता | उच्च (वर्ग करने के कारण) | मध्यम (वर्गमूल प्रभाव को कम करता है) |
| मुख्य उपयोग | सांख्यिकीय अनुमान, ANOVA, पोर्टफोलियो थ्योरी | वर्णनात्मक सांख्यिकी, रिपोर्टिंग, अनुभवजन्य नियम |
पॉपुलेशन और सैंपल के सूत्र
इन मेट्रिक्स की गणना करते समय, आपको पॉपुलेशन और सैंपल के बीच अंतर करना चाहिए। पॉपुलेशन में एक निर्दिष्ट समूह के सभी सदस्य शामिल होते हैं, जबकि सैंपल उस पॉपुलेशन का एक उपसमूह होता है। सैंपल सूत्र में (n - 1) के हर का उपयोग करना—जिसे बेसेल का सुधार (Bessel's correction) कहा जाता है—सैंपल से पॉपुलेशन वैरिएंस का अनुमान लगाते समय अंतर्निहित पूर्वाग्रह (bias) को ठीक करता है, यह सुनिश्चित करते हुए कि अनुमानक (estimator) अनभिनत (unbiased) है।
सैंपल वैरिएंस
n बनाम n-1 के जाल से बचें
वैरिएंस और स्टैंडर्ड डेविएशन का उपयोग कब करें
वैरिएंस और स्टैंडर्ड डेविएशन के बीच चयन पूरी तरह से आपके विश्लेषणात्मक लक्ष्य पर निर्भर करता है। यदि आप अपने डेटा के फैलाव को एक गैर-तकनीकी दर्शकों को बता रहे हैं, तो स्टैंडर्ड डेविएशन स्पष्ट रूप से बेहतर विकल्प है क्योंकि यह डेटा की प्राकृतिक इकाइयों के साथ मेल खाता है। हालांकि, यदि आप मध्यवर्ती सांख्यिकीय गणनाएँ कर रहे हैं—जैसे ANOVA में F-सांख्यिकी की गणना करना, मॉडर्न पोर्टफोलियो थ्योरी में जोखिम का आकलन करना, या परिकल्पना परीक्षण करना—तो वैरिएंस गणितीय रूप से अधिक सुविधाजनक है।
वैरिएंस का उपयोग कब करें...
स्टैंडर्ड डेविएशन का उपयोग कब करें...
पायथन में SD और वैरिएंस की गणना
पायथन का `statistics` मॉड्यूल वैरिएंस और स्टैंडर्ड डेविएशन दोनों के लिए अंतर्निहित फ़ंक्शन प्रदान करता है। इन फ़ंक्शन का उपयोग करते समय, यह चुनना बहुत महत्वपूर्ण है कि आपका डेटा पॉपुलेशन को दर्शाता है या सैंपल को, और उसके आधार पर सही विधि का चयन करें।
import statistics
# सैंपल डेटासेट
data = [14, 18, 12, 15, 11]
# सैंपल वैरिएंस और SD की गणना करें
sample_var = statistics.variance(data)
sample_sd = statistics.stdev(data)
# पॉपुलेशन वैरिएंस और SD की गणना करें
pop_var = statistics.pvariance(data)
pop_sd = statistics.pstdev(data)
print(f"Sample Variance: {sample_var:.2f}")
print(f"Sample SD: {sample_sd:.2f}")
print(f"Population Variance: {pop_var:.2f}")
print(f"Population SD: {pop_sd:.2f}")अक्सर पूछे जाने वाले प्रश्न
- क्या वैरिएंस ऋणात्मक हो सकता है? नहीं, क्योंकि वर्ग किए गए विचलनों (xᵢ - μ)² का योग हमेशा शून्य या धनात्मक मान होता है, वैरिएंस कभी भी ऋणात्मक नहीं हो सकता।
- रिपोर्टिंग के लिए वैरिएंस की तुलना में स्टैंडर्ड डेविएशन को प्राथमिकता क्यों दी जाती है? स्टैंडर्ड डेविएशन को प्राथमिकता इसलिए दी जाती है क्योंकि यह माध्य के समान ही इकाइयों को साझा करता है, जिससे इसे कच्चे डेटा के साथ संदर्भ में रखकर व्याख्या करना बहुत आसान हो जाता है।
- क्या वैरिएंस मीन स्क्वायर्ड एरर (MSE) के समान है? वे समान हैं, लेकिन MSE आमतौर पर अनुमानित मानों और वास्तविक मान के बीच औसत वर्ग अंतर को मापता है, जबकि वैरिएंस माध्य के आसपास फैलाव को मापता है। यदि अनुमानक माध्य है, तो MSE वैरिएंस के बराबर होता है।
Further Reading
Sources
References and further authoritative reading used in preparing this article.