เหนือกว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน
ในขณะที่ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานอธิบายจุดศูนย์กลางและการกระจายตัว ความเบ้ และ ความโด่ง อธิบายรูปทรงของการแจกแจง ได้แก่ ความไม่สมมาตรและความหนักของหาง
ในสถิติ เราอธิบายการแจกแจงโดยใช้ “โมเมนต์” ซึ่งเป็นบทสรุปทางคณิตศาสตร์ที่จับแง่มุมต่างๆ ของรูปทรง:
- โมเมนต์ที่ 1:ค่าเฉลี่ย (แนวโน้มเข้าสู่ส่วนกลาง)
- โมเมนต์ที่ 2:ความแปรปรวน/ส่วนเบี่ยงเบนมาตรฐาน (การกระจายตัว)
- โมเมนต์ที่ 3:ความเบ้ (ความไม่สมมาตร)
- โมเมนต์ที่ 4:ความโด่ง (ความหนักของหาง)
สองการแจกแจงสามารถมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเหมือนกัน แต่ดูต่างกันอย่างสิ้นเชิง ความเบ้และความโด่งจับความแตกต่างเหล่านี้ ให้ภาพที่สมบูรณ์ยิ่งขึ้นของการแจกแจงข้อมูลของคุณ
ความเบ้: การวัดความไม่สมมาตร
ความเบ้วัดว่าการแจกแจงไม่สมมาตรแค่ไหน ความเบ้บวกหมายถึงหางขวายาว (เช่น การแจกแจงรายได้) ในขณะที่ความเบ้ลบหมายถึงหางซ้ายยาว
ความเบ้ของตัวอย่าง
- ความเบ้ = 0:การแจกแจงสมมาตร (ปกติ, สม่ำเสมอ)
- ความเบ้ > 0:เบ้ขวา ค่าเฉลี่ยเกินมัธยฐาน (รายได้, ราคาบ้าน)
- ความเบ้ < 0:เบ้ซ้าย มัธยฐานเกินค่าเฉลี่ย (อายุเกษียณ, คะแนนสอบที่มีเพดาน)
ข้อมูลเบ้ขวาที่พบบ่อย
แนวทางการตีความ:
- |ความเบ้| < 0.5: สมมาตรโดยประมาณ
- 0.5 ≤ |ความเบ้| < 1: เบ้ปานกลาง
- |ความเบ้| ≥ 1: เบ้มาก
ความโด่ง: ความหนักของหาง
ความโด่งวัดว่าหางหนักหรือเบาเพียงใดเมื่อเปรียบเทียบกับการแจกแจงปกติ ความโด่งสูงหมายถึงค่าสุดโต่งมากขึ้น (หางอ้วน) ความโด่งต่ำหมายถึงน้อยลง
ความเข้าใจผิดที่พบบ่อยคือความโด่งวัด “ความแหลม” แม้จะเกี่ยวข้องกัน แต่ความโด่งเป็นเรื่องของหางเป็นพื้นฐาน การแจกแจงที่มีความโด่งสูงมีมวลความน่าจะเป็นในหางและที่ยอดมากขึ้น แต่น้อยลงใน “ไหล่”
ความโด่งส่วนเกิน
- เมโสเคอร์ติก (k ≈ 0):หางเหมือนปกติ (เส้นฐานสำหรับเปรียบเทียบ)
- เลปโตเคอร์ติก (k > 0):หางอ้วน ค่าสุดโต่งมากกว่าปกติ (ผลตอบแทนหุ้น, แผ่นดินไหว)
- แพลตีเคอร์ติก (k < 0):หางบาง ค่าสุดโต่งน้อยกว่าปกติ (การแจกแจงสม่ำเสมอ, ข้อมูลที่มีขอบเขต)
หางอ้วนในการเงิน
การประยุกต์ใช้เชิงปฏิบัติ
การบริหารความเสี่ยง: ความโด่งสูงหมายถึงผลลัพธ์สุดโต่งที่เกิดขึ้นบ่อยกว่า VaR และตัววัดความเสี่ยงอื่นๆ ที่สมมติความเป็นปกติอาจประมาณความเสี่ยงที่แท้จริงต่ำเกินไปอย่างมากเมื่อความโด่งสูง
การควบคุมคุณภาพ: ข้อมูลการผลิตที่มีความโด่งสูงบ่งชี้ว่ามีค่าเบี่ยงเบนสุดโต่งจากเป้าหมายเป็นครั้งคราว แม้ว่าประสิทธิภาพโดยเฉลี่ยจะยอมรับได้ รูปแบบนี้อาจบ่งชี้ความไม่เสถียรของกระบวนการที่ต้องตรวจสอบ
การแปลงข้อมูล: ข้อมูลที่เบ้มากอาจได้ประโยชน์จากการแปลง (ลอการิทึม, รากที่สอง) ก่อนวิเคราะห์ เป้าหมายมักจะบรรลุความเป็นปกติโดยประมาณสำหรับการทดสอบทางสถิติที่สมมติสิ่งนี้
การทดสอบทางสถิติ: การทดสอบหลายตัวสมมติความเป็นปกติ ความเบ้หรือความโด่งที่มีนัยสำคัญอาจบ่งชี้ว่าข้อสมมตินี้ถูกละเมิด แนะนำให้ใช้ทางเลือกแบบไม่อิงพารามิเตอร์หรือวิธีทนทาน
แนวทางการตีความ
การทดสอบความเป็นปกติ: การทดสอบ Jarque-Bera รวมความเบ้และความโด่งเพื่อทดสอบความเป็นปกติ มันปฏิเสธความเป็นปกติเมื่อตัวชี้วัดใดตัวหนึ่งเบี่ยงเบนอย่างมีนัยสำคัญจากศูนย์
ข้อพิจารณาเรื่องขนาดตัวอย่าง: ตัวอย่างเล็กให้ค่าประมาณความเบ้และความโด่งที่ไม่น่าเชื่อถือ เมื่อ n < 50 สถิติเหล่านี้มีความแปรผันจากการสุ่มตัวอย่างสูง เมื่อ n < 20 แทบไม่มีความหมาย
ความทนทาน: ทั้งความเบ้และความโด่งมีความไวต่อค่าผิดปกติ ค่าสุดโต่งเพียงค่าเดียวสามารถส่งผลกระทบอย่างมากต่อสถิติเหล่านี้ ดังนั้นควรแสดงข้อมูลเป็นภาพควบคู่กับบทสรุปเชิงตัวเลขเสมอ