การแจกแจงปกติคืออะไร?
การแจกแจงปกติ หรือเรียกอีกอย่างว่าการแจกแจงแบบเกาส์เซียนหรือ “เส้นโค้งระฆัง” เป็นการแจกแจงความน่าจะเป็นที่สำคัญที่สุดในสถิติ มันอธิบายว่าค่าข้อมูลกระจายตัวรอบค่ากลางอย่างไร
The Classic Bell Curve
การแจกแจงปกติถูกกำหนดอย่างสมบูรณ์ด้วยพารามิเตอร์เพียงสองตัว: ค่าเฉลี่ย (μ) ซึ่งกำหนดจุดศูนย์กลาง และ ส่วนเบี่ยงเบนมาตรฐาน (σ) ซึ่งกำหนดการกระจายตัว
คุณสมบัติสำคัญ
ความสมมาตร
ค่าเฉลี่ย = มัธยฐาน = ฐานนิยม
เส้นกำกับ
พื้นที่รวม = 1
ส่วนเบี่ยงเบนมาตรฐานส่งผลต่อรูปทรงอย่างไร
ส่วนเบี่ยงเบนมาตรฐานควบคุม “การกระจายตัว” ของการแจกแจงปกติ σ ที่น้อยกว่าจะสร้างเส้นโค้งที่สูงและแคบ σ ที่มากกว่าจะสร้างเส้นโค้งที่เตี้ยและกว้าง
Visual Comparison
Low SD (σ = 0.5)
Data clustered tightly around the mean
High SD (σ = 2)
Data spread widely from the mean
คะแนน Z และการมาตรฐาน
คะแนน Z บอกคุณว่าค่าหนึ่งอยู่ห่างจากค่าเฉลี่ยกี่ส่วนเบี่ยงเบนมาตรฐาน ซึ่งช่วยให้คุณเปรียบเทียบค่าจากการแจกแจงปกติที่แตกต่างกันได้
สูตรคะแนน Z
| คะแนน Z | ความหมาย | เปอร์เซ็นไทล์ |
|---|---|---|
| -2 | ต่ำกว่าค่าเฉลี่ย 2 SD | ~2.3% |
| -1 | ต่ำกว่าค่าเฉลี่ย 1 SD | ~15.9% |
| 0 | อยู่ที่ค่าเฉลี่ย | 50% |
| +1 | สูงกว่าค่าเฉลี่ย 1 SD | ~84.1% |
| +2 | สูงกว่าค่าเฉลี่ย 2 SD | ~97.7% |
ตัวอย่างในชีวิตจริง
ปรากฏการณ์ทางธรรมชาติหลายอย่างมีการแจกแจงปกติ:
- ส่วนสูงของมนุษย์:คนส่วนใหญ่มีส่วนสูงใกล้เคียงค่าเฉลี่ย โดยมีคนสูงมากหรือเตี้ยมากน้อยกว่า
- คะแนน IQ:ออกแบบมาให้มีการแจกแจงปกติ โดยมีค่าเฉลี่ย 100 และ SD 15
- ความคลาดเคลื่อนในการวัด:ความคลาดเคลื่อนแบบสุ่มในการวัดทางวิทยาศาสตร์
- ความดันโลหิต:ค่าความดันโลหิตของประชากร
เมื่อข้อมูลไม่เป็นปกติ
ไม่ใช่ข้อมูลทั้งหมดจะมีการแจกแจงปกติ ควรระวังกับ:
การแจกแจงที่ไม่เป็นปกติ