सांख्यिकीय सार्थकता से परे: प्रभाव आकार को समझना
प्रभाव आकार प्रतिदर्श आकार से स्वतंत्र, किसी अंतर या संबंध के परिमाण को मापता है। जबकि p-मान बताते हैं कि कोई प्रभाव सांख्यिकीय रूप से सार्थक है या नहीं, प्रभाव आकार बताता है कि वह प्रभाव व्यावहारिक रूप से कितना अर्थपूर्ण है। यह भेद अनुसंधान, चिकित्सा, शिक्षा और व्यवसाय में साक्ष्य-आधारित निर्णय लेने के लिए महत्वपूर्ण है।
एक औषधीय परीक्षण पर विचार करें जहाँ एक नई दवा प्लेसिबो पर सांख्यिकीय रूप से सार्थक सुधार (p < 0.001) दिखाती है। प्रभाव आकार के बिना, आप नहीं जानते कि सुधार 0.1% है या 50%। प्रभाव आकार यह महत्वपूर्ण संदर्भ प्रदान करता है, जो हितधारकों को यह निर्धारित करने में मदद करता है कि प्रभाव लागत, दुष्प्रभावों, या कार्यान्वयन प्रयास के लायक है या नहीं।
दो समूहों की तुलना के लिए सबसे आम प्रभाव आकार माप Cohen's d है, जो माध्यों के बीच अंतर को मानक विचलन इकाइयों में व्यक्त करता है। यह मानकीकरण विभिन्न अध्ययनों और मापन मापनियों में तुलना की अनुमति देता है।
प्रभाव आकार क्यों मायने रखता है
सांख्यिकीय सार्थकता प्रतिदर्श आकार से काफी प्रभावित होती है। पर्याप्त बड़े प्रतिदर्श के साथ, तुच्छ अंतर भी “सार्थक” हो जाते हैं। इसके विपरीत, छोटे प्रतिदर्शों में महत्वपूर्ण प्रभाव सार्थकता तक नहीं पहुँच सकते। प्रभाव आकार प्रतिदर्श-आकार-स्वतंत्र माप प्रदान करके इस समस्या को हल करता है।
सार्थकता का जाल
प्रभाव आकार उपयोग करने के प्रमुख कारण:
- मेटा-विश्लेषण: प्रभाव आकारों को समग्र प्रभाव अनुमान के लिए अध्ययनों में मिलाया जा सकता है
- शक्ति विश्लेषण: भविष्य के अध्ययनों के लिए आवश्यक प्रतिदर्श आकारों की गणना के लिए आवश्यक
- व्यावहारिक निर्णय: हस्तक्षेपों को लागू करने योग्य है या नहीं, निर्धारित करने में मदद करता है
- प्रतिकृति: प्रतिकृति अध्ययनों के मिलान के लिए एक लक्ष्य प्रदान करता है
Cohen's d: मानक प्रभाव आकार माप
Cohen's d दो समूह माध्यों के बीच अंतर को सम्मिलित मानक विचलन की इकाइयों में व्यक्त करता है:
Cohen's d
जहाँ M₁ और M₂ समूह माध्य हैं, और sp सम्मिलित मानक विचलन है जो इस प्रकार गणना किया जाता है:
सम्मिलित मानक विचलन
d का चिह्न दिशा इंगित करता है: M₁ > M₂ होने पर धनात्मक, M₁ < M₂ होने पर ऋणात्मक। जब दिशा संदर्भ से स्पष्ट हो तो अक्सर निरपेक्ष मान |d| रिपोर्ट किया जाता है।
मानक विचलन को सम्मिलित क्यों करें?
वैकल्पिक प्रभाव आकार माप
जबकि Cohen's d सबसे आम है, विशिष्ट स्थितियों के लिए विकल्प मौजूद हैं:
Hedges' g: पूर्वाग्रह-संशोधित प्रभाव आकार
Cohen's d छोटे प्रतिदर्शों में समष्टि प्रभाव आकार को थोड़ा अधिक अनुमानित करता है। Hedges' g एक संशोधन कारक लागू करता है:
Hedges' g संशोधन
प्रति समूह 20 से अधिक प्रतिदर्शों के लिए, अंतर नगण्य है। छोटे प्रतिदर्शों (n < 20) के लिए, Hedges' g को प्राथमिकता दी जाती है।
Glass's Δ: जब प्रसरण भिन्न हों
जब एक समूह ज्ञात परिवर्तनशीलता वाला नियंत्रण हो, तो हर के रूप में केवल नियंत्रण समूह के मानक विचलन का उपयोग करें:
Glass's Delta
यह तब उपयोगी है जब उपचार प्रसरण को प्रभावित कर सकता है (जैसे एक हस्तक्षेप जो कम प्रदर्शन करने वालों की उच्च प्रदर्शन करने वालों से अधिक मदद करता है)।
प्रभाव आकार की व्याख्या: Cohen के दिशानिर्देश
जैकब कोहेन ने d मानों की व्याख्या के लिए ये प्रथाएँ प्रस्तावित कीं:
| प्रभाव आकार (d) | व्याख्या | अतिव्यापन |
|---|---|---|
| 0.2 | छोटा | समूहों के बीच 85% अतिव्यापन |
| 0.5 | मध्यम | समूहों के बीच 67% अतिव्यापन |
| 0.8 | बड़ा | समूहों के बीच 53% अतिव्यापन |
| 1.2 | बहुत बड़ा | समूहों के बीच 40% अतिव्यापन |
| 2.0 | विशाल | समूहों के बीच 19% अतिव्यापन |
संदर्भ मायने रखता है
हल किया गया उदाहरण: शैक्षिक हस्तक्षेप
एक स्कूल एक नए पठन कार्यक्रम का परीक्षण करता है। नियंत्रण समूह (n=25): माध्य=72, SD=12। उपचार समूह (n=30): माध्य=79, SD=14। Cohen's d की गणना करें:
सम्मिलित प्रसरण की गणना करें
सम्मिलित SD की गणना करें
Cohen's d की गणना करें
व्याख्या करें
इसका अर्थ है कि यदि आप उपचार समूह से एक यादृच्छिक छात्र और नियंत्रण समूह से एक यादृच्छिक छात्र लें, तो उपचार छात्र लगभग 64% बार अधिक अंक प्राप्त करेगा (अतिव्यापन से गणना)।
Python कार्यान्वयन
विश्वास अंतरालों के साथ प्रभाव आकारों की प्रोग्रामेटिक गणना करें:
import numpy as np
from scipy import stats
def cohens_d(group1, group2):
"""Calculate Cohen's d for two independent groups."""
n1, n2 = len(group1), len(group2)
var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)
# Pooled standard deviation
pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))
# Cohen's d
d = (np.mean(group1) - np.mean(group2)) / pooled_std
return d
def hedges_g(group1, group2):
"""Calculate Hedges' g (bias-corrected effect size)."""
n1, n2 = len(group1), len(group2)
d = cohens_d(group1, group2)
# Correction factor for small sample bias
correction = 1 - 3 / (4*(n1+n2) - 9)
return d * correction
# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]
d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")