Σ
SDCalc
मध्यवर्तीअनुप्रयोग·9 min

मानक विचलन से बहिर्वक्र मानों की पहचान

मानक विचलन का उपयोग करके अपने डेटा में बहिर्वक्र मानों की पहचान करना सीखें। 3-सिग्मा नियम, IQR विधि और बहिर्वक्र मानों को कब हटाना चाहिए, समझें।

बहिर्वक्र मान क्या हैं?

बहिर्वक्र मान ऐसे डेटा बिंदु हैं जो अन्य प्रेक्षणों से काफी भिन्न होते हैं। ये मापन त्रुटियों, डेटा प्रविष्टि गलतियों के कारण हो सकते हैं, या वे वास्तव में असामान्य मामलों का प्रतिनिधित्व कर सकते हैं जिनकी जाँच करना उचित है।

(10, 50) पर नारंगी बिंदु एक बहिर्वक्र मान है

3-सिग्मा नियम

सामान्य रूप से वितरित डेटा के लिए, माध्य से 3 मानक विचलनों से परे के बिंदु बहिर्वक्र मान माने जाते हैं। ये संयोग से 0.3% से कम समय घटित होते हैं।

बहिर्वक्र यदि

x < μ - 3σ OR x > μ + 3σ

उदाहरण

यदि परीक्षा अंकों में μ = 75 और σ = 10 हो: - निचली सीमा: 75 - 30 = 45 - ऊपरी सीमा: 75 + 30 = 105 - 45 से नीचे या 105 से ऊपर कोई भी अंक बहिर्वक्र मान है

Z-अंक विधि

प्रत्येक डेटा बिंदु के लिए z-अंक की गणना करें। यदि |z| > 3 (या कभी-कभी 2.5) हो, तो यह बहिर्वक्र मान है।

Z-अंक

z = (x - μ) / σ

सीमा विकल्प

- |z| > 3: रूढ़िवादी (कम बहिर्वक्र मान पकड़ता है) - |z| > 2.5: मध्यम - |z| > 2: उदार (अधिक बहिर्वक्र मान पकड़ता है)

IQR विधि (वैकल्पिक)

अंतर-चतुर्थक परिसर (IQR) विधि बहिर्वक्र मानों के प्रति अधिक मज़बूत है क्योंकि यह माध्य या मानक विचलन का उपयोग नहीं करती।

1

चरण 1

Q1 (25वाँ शतमक) और Q3 (75वाँ शतमक) ज्ञात करें
2

चरण 2

IQR = Q3 - Q1 की गणना करें
3

चरण 3

निचली बाड़ = Q1 - 1.5 × IQR
4

चरण 4

ऊपरी बाड़ = Q3 + 1.5 × IQR
5

चरण 5

बाड़ों के बाहर के बिंदु बहिर्वक्र मान हैं

बहिर्वक्र मानों को संभालना

स्वचालित रूप से न हटाएँ!

बहिर्वक्र मान हमेशा त्रुटियाँ नहीं होते। उन्हें हटाने से पहले, जाँच करें: - क्या यह डेटा प्रविष्टि या मापन त्रुटि है? - क्या यह वास्तविक चरम मान है? - क्या यह एक महत्वपूर्ण सीमांत मामले का प्रतिनिधित्व करता है?

कब हटाएँ

- पुष्ट डेटा प्रविष्टि त्रुटियाँ - मापन उपकरण की खराबी - मानों की संभव सीमा से बाहर

कब रखें

- वास्तविक परिवर्तनशीलता का प्रतिनिधित्व करता है - आपके विश्लेषण के लिए महत्वपूर्ण - हटाने से परिणाम पक्षपाती होंगे