Σ
SDCalc
ขั้นสูงทฤษฎี·15 min

ความเบ้และความโด่ง: เหนือกว่าส่วนเบี่ยงเบนมาตรฐาน

เรียนรู้เกี่ยวกับความเบ้และความโด่ง โมเมนต์ที่สามและที่สี่ที่อธิบายรูปทรงของการแจกแจงเหนือกว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน

เหนือกว่าค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน

ในขณะที่ค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานอธิบายจุดศูนย์กลางและการกระจายตัว ความเบ้ และ ความโด่ง อธิบายรูปทรงของการแจกแจง ได้แก่ ความไม่สมมาตรและความหนักของหาง

ในสถิติ เราอธิบายการแจกแจงโดยใช้ “โมเมนต์” ซึ่งเป็นบทสรุปทางคณิตศาสตร์ที่จับแง่มุมต่างๆ ของรูปทรง:

  • โมเมนต์ที่ 1:ค่าเฉลี่ย (แนวโน้มเข้าสู่ส่วนกลาง)
  • โมเมนต์ที่ 2:ความแปรปรวน/ส่วนเบี่ยงเบนมาตรฐาน (การกระจายตัว)
  • โมเมนต์ที่ 3:ความเบ้ (ความไม่สมมาตร)
  • โมเมนต์ที่ 4:ความโด่ง (ความหนักของหาง)

สองการแจกแจงสามารถมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานเหมือนกัน แต่ดูต่างกันอย่างสิ้นเชิง ความเบ้และความโด่งจับความแตกต่างเหล่านี้ ให้ภาพที่สมบูรณ์ยิ่งขึ้นของการแจกแจงข้อมูลของคุณ

ความเบ้: การวัดความไม่สมมาตร

ความเบ้วัดว่าการแจกแจงไม่สมมาตรแค่ไหน ความเบ้บวกหมายถึงหางขวายาว (เช่น การแจกแจงรายได้) ในขณะที่ความเบ้ลบหมายถึงหางซ้ายยาว

ความเบ้ของตัวอย่าง

g₁ = [n/((n-1)(n-2))] × Σ[(xᵢ - x̄)/s]³
  • ความเบ้ = 0:การแจกแจงสมมาตร (ปกติ, สม่ำเสมอ)
  • ความเบ้ > 0:เบ้ขวา ค่าเฉลี่ยเกินมัธยฐาน (รายได้, ราคาบ้าน)
  • ความเบ้ < 0:เบ้ซ้าย มัธยฐานเกินค่าเฉลี่ย (อายุเกษียณ, คะแนนสอบที่มีเพดาน)

ข้อมูลเบ้ขวาที่พบบ่อย

ปรากฏการณ์ในชีวิตจริงหลายอย่างเบ้ขวา: รายได้ ความมั่งคั่ง ขนาดบริษัท ประชากรเมือง การเรียกร้องประกัน และเวลารอ ในกรณีเหล่านี้ ค่าเฉลี่ยถูกดึงให้สูงขึ้นโดยค่าสุดโต่ง ทำให้มัธยฐานเป็นตัววัด “ค่าปกติ” ที่ดีกว่า

แนวทางการตีความ:

  • |ความเบ้| < 0.5: สมมาตรโดยประมาณ
  • 0.5 ≤ |ความเบ้| < 1: เบ้ปานกลาง
  • |ความเบ้| ≥ 1: เบ้มาก

ความโด่ง: ความหนักของหาง

ความโด่งวัดว่าหางหนักหรือเบาเพียงใดเมื่อเปรียบเทียบกับการแจกแจงปกติ ความโด่งสูงหมายถึงค่าสุดโต่งมากขึ้น (หางอ้วน) ความโด่งต่ำหมายถึงน้อยลง

ความเข้าใจผิดที่พบบ่อยคือความโด่งวัด “ความแหลม” แม้จะเกี่ยวข้องกัน แต่ความโด่งเป็นเรื่องของหางเป็นพื้นฐาน การแจกแจงที่มีความโด่งสูงมีมวลความน่าจะเป็นในหางและที่ยอดมากขึ้น แต่น้อยลงใน “ไหล่”

ความโด่งส่วนเกิน

g₂ = [n(n+1)/((n-1)(n-2)(n-3))] × Σ[(xᵢ - x̄)/s]⁴ - 3(n-1)²/((n-2)(n-3))
  • เมโสเคอร์ติก (k ≈ 0):หางเหมือนปกติ (เส้นฐานสำหรับเปรียบเทียบ)
  • เลปโตเคอร์ติก (k > 0):หางอ้วน ค่าสุดโต่งมากกว่าปกติ (ผลตอบแทนหุ้น, แผ่นดินไหว)
  • แพลตีเคอร์ติก (k < 0):หางบาง ค่าสุดโต่งน้อยกว่าปกติ (การแจกแจงสม่ำเสมอ, ข้อมูลที่มีขอบเขต)

หางอ้วนในการเงิน

ผลตอบแทนทางการเงินมีความโด่งสูง (“หางอ้วน”) อย่างมีชื่อเสียง เหตุการณ์ที่ควรเกิดครั้งเดียวในศตวรรษตามสมมติฐานการแจกแจงปกติเกิดขึ้นบ่อยกว่ามาก การละเลยความโด่งนำไปสู่การประเมินความเสี่ยงต่ำเกินไป ซึ่งเป็นบทเรียนจากวิกฤตการเงินหลายครั้ง

การประยุกต์ใช้เชิงปฏิบัติ

การบริหารความเสี่ยง: ความโด่งสูงหมายถึงผลลัพธ์สุดโต่งที่เกิดขึ้นบ่อยกว่า VaR และตัววัดความเสี่ยงอื่นๆ ที่สมมติความเป็นปกติอาจประมาณความเสี่ยงที่แท้จริงต่ำเกินไปอย่างมากเมื่อความโด่งสูง

การควบคุมคุณภาพ: ข้อมูลการผลิตที่มีความโด่งสูงบ่งชี้ว่ามีค่าเบี่ยงเบนสุดโต่งจากเป้าหมายเป็นครั้งคราว แม้ว่าประสิทธิภาพโดยเฉลี่ยจะยอมรับได้ รูปแบบนี้อาจบ่งชี้ความไม่เสถียรของกระบวนการที่ต้องตรวจสอบ

การแปลงข้อมูล: ข้อมูลที่เบ้มากอาจได้ประโยชน์จากการแปลง (ลอการิทึม, รากที่สอง) ก่อนวิเคราะห์ เป้าหมายมักจะบรรลุความเป็นปกติโดยประมาณสำหรับการทดสอบทางสถิติที่สมมติสิ่งนี้

การทดสอบทางสถิติ: การทดสอบหลายตัวสมมติความเป็นปกติ ความเบ้หรือความโด่งที่มีนัยสำคัญอาจบ่งชี้ว่าข้อสมมตินี้ถูกละเมิด แนะนำให้ใช้ทางเลือกแบบไม่อิงพารามิเตอร์หรือวิธีทนทาน

แนวทางการตีความ

การทดสอบความเป็นปกติ: การทดสอบ Jarque-Bera รวมความเบ้และความโด่งเพื่อทดสอบความเป็นปกติ มันปฏิเสธความเป็นปกติเมื่อตัวชี้วัดใดตัวหนึ่งเบี่ยงเบนอย่างมีนัยสำคัญจากศูนย์

ข้อพิจารณาเรื่องขนาดตัวอย่าง: ตัวอย่างเล็กให้ค่าประมาณความเบ้และความโด่งที่ไม่น่าเชื่อถือ เมื่อ n < 50 สถิติเหล่านี้มีความแปรผันจากการสุ่มตัวอย่างสูง เมื่อ n < 20 แทบไม่มีความหมาย

ความทนทาน: ทั้งความเบ้และความโด่งมีความไวต่อค่าผิดปกติ ค่าสุดโต่งเพียงค่าเดียวสามารถส่งผลกระทบอย่างมากต่อสถิติเหล่านี้ ดังนั้นควรแสดงข้อมูลเป็นภาพควบคู่กับบทสรุปเชิงตัวเลขเสมอ