ค่าเบี่ยงเบนมาตรฐานคืออะไร?
ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) คือตัววัดทางสถิติที่บอกปริมาณของความแปรปรวนหรือการกระจายของชุดข้อมูล ค่าเบี่ยงเบนมาตรฐานที่ต่ำแสดงว่าจุดข้อมูลมักอยู่ใกล้กับค่าเฉลี่ย (ค่าคาดหวัง) ของชุดข้อมูลนั้น ในขณะที่ค่าที่สูงแสดงว่าข้อมูลกระจายตัวออกไปในวงกว้าง ตัวแทนของค่านี้คืออักษรกรีก σ (ซิกมา) สำหรับประชากร และ s สำหรับกลุ่มตัวอย่าง ซึ่งถือเป็นแนวคิดพื้นฐานที่สำคัญที่สุดอย่างหนึ่งในสถิติเชิงพรรณนา
นิยามสั้นๆ
ค่าเบี่ยงเบนมาตรฐานของประชากร vs. กลุ่มตัวอย่าง
ก่อนจะคำนวณค่าเบี่ยงเบนมาตรฐาน คุณต้องรู้ก่อนว่าข้อมูลของคุณเป็นตัวแทนของประชากรทั้งหมด หรือเป็นเพียงกลุ่มตัวอย่างของประชากร ประชากรคือสมาชิกทั้งหมดในกลุ่มที่กำหนด ส่วนกลุ่มตัวอย่างคือเซ็ตย่อยที่เป็นตัวแทนของกลุ่มนั้น การคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจะต้องมีการปรับแก้ทางคณิตศาสตร์ นั่นคือการใช้ n - 1 (ดีกรีอิสระ หรือ df) แทนที่จะเป็น N เพื่อให้แน่ใจว่าผลลัพธ์ที่ได้เป็นตัวประมาณค่าแปรปรวนของประชากรที่ไม่มีอคติ (unbiased estimator)
ค่าเบี่ยงเบนมาตรฐานของประชากร
ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
อธิบายสูตรคำนวณค่าเบี่ยงเบนมาตรฐาน
สูตรคำนวณค่าเบี่ยงเบนมาตรฐานเริ่มจากการหาค่าแปรปรวนก่อน แล้วจึงถอดรากที่สอง ขั้นตอนการถอดรากนี้สำคัญมาก เพราะมันจะแปลงหน่วยวัดความกระจายกลับไปเป็นหน่วยเดิมของข้อมูล ตัวแปรสำคัญๆ ประกอบด้วย xᵢ (แต่ละค่าในข้อมูล), μ หรือ x̄ (ค่าเฉลี่ยของประชากรหรือกลุ่มตัวอย่าง) และ N หรือ n (จำนวนข้อมูลทั้งหมด)
ค่าเบี่ยงเบนมาตรฐานของประชากร
ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง
ตัวอย่างการคำนวณทีละขั้นตอน
มาลองคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจากชุดคะแนนสอบเล็กๆ กันครับ: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5] การทำตามสูตรทีละขั้นตอนจะช่วยให้เห็นว่าค่าแปรปรวนสะสมกันอย่างไรก่อนที่เราจะถอดรากที่สองในตอนท้าย
หาค่าเฉลี่ย (x̄)
ลบด้วยค่าเฉลี่ยแล้วยกกำลังสอง
หาผลรวมของผลต่างยกกำลังสอง
หารด้วย n - 1 (ดีกรีอิสระ)
ถอดรากที่สอง
การคำนวณค่าเบี่ยงเบนมาตรฐานด้วย Python
การคำนวณค่าเบี่ยงเบนมาตรฐานด้วยมือมักจะเกิดความผิดพลาดได้ง่าย โดยเฉพาะกับชุดข้อมูลขนาดใหญ่ ในทางปฏิบัติ นักสถิติและนักวิทยาศาสตร์ข้อมูลมักใช้ภาษาโปรแกรมอย่าง Python ในการคำนวณทันทีด้วยไลบรารีมาตรฐาน
import statistics
data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]
# คำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง (ค่าเริ่มต้น)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")
# คำนวณค่าเบี่ยงเบนมาตรฐานของประชากร
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")กฎเชิงประจักษ์ (Empirical Rule) กับค่าเบี่ยงเบนมาตรฐาน
เมื่อข้อมูลมีการแจกแจงแบบปกติ (Normal Distribution หรือโค้งระฆังคว่ำ) ค่าเบี่ยงเบนมาตรฐานจะกลายเป็นตัวทำนายที่แม่นยำมาก กฎเชิงประจักษ์ หรือที่รู้จักกันในชื่อกฎ 68-95-99.7 ระบุว่าข้อมูลเกือบทั้งหมดจะอยู่ภายในสามส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ทำให้นักวิเคราะห์สามารถระบุค่าผิดปกติ (Outliers) และเข้าใจความน่าจะเป็นที่จะเกิดการสังเกตการณ์หนึ่งๆ ได้อย่างรวดเร็ว
| ระยะห่างจากค่าเฉลี่ย | ร้อยละของข้อมูล | การนำไปใช้งาน |
|---|---|---|
| ±1σ | 68.27% | ระบุค่าทั่วไปที่พบได้ในชีวิตประจำวัน |
| ±2σ | 95.45% | กำหนดช่วงความเชื่อมั่น (Confidence Intervals) |
| ±3σ | 99.73% | ตรวจจับค่าผิดปกติรุนแรง (Extreme Outliers) |
ค่าเบี่ยงเบนมาตรฐาน vs. ค่าแปรปรวน
ค่าแปรปรวนและค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความกระจายที่เกี่ยวข้องกันอย่างใกล้ชิด ค่าแปรปรวน (σ² หรือ s²) คือค่าเฉลี่ยของผลต่างยกกำลังสองจากค่าเฉลี่ย ในขณะที่ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของค่าแปรปรวน เนื่องจากค่าแปรปรวนมีหน่วยเป็นกำลังสอง (เช่น บาทกำลังสอง, ตารางเซนติเมตร) จึงตีความยากในบริบทของข้อมูลดั้งเดิม ค่าเบี่ยงเบนมาตรฐานแก้ปัญหานี้โดยแปลงหน่วยวัดกลับไปเป็นหน่วยเดิม
การรายงานข้อมูลของคุณ
ข้อผิดพลาดที่ควรหลีกเลี่ยง
แม้ค่าเบี่ยงเบนมาตรฐานจะเป็นเครื่องมือที่ทรงพลัง แต่ก็มักถูกใช้ผิดวิธีบ่อยครั้ง การใช้สูตรผิดหรือเข้าใจผิดว่าค่าที่ได้แทนความหมายอะไร อาจนำไปสู่การวิเคราะห์ข้อมูลที่บกพร่องและข้อสรุปที่ไม่ถูกต้องได้
- ใช้สูตรประชากรกับกลุ่มตัวอย่าง: การลืมใช้ n - 1 กับกลุ่มตัวอย่างจะทำให้ค่าความกระจายที่คำนวณได้ต่ำกว่าความเป็นจริง ซึ่งเป็นการประเมินค่าแปรปรวนของประชากรที่แท้จริงต่ำเกินไป
- นำ SD ไปใช้กับการแจกแจงที่ไม่ปกติ: กฎเชิงประจักษ์ใช้ได้กับการแจกแจงแบบปกติเท่านั้น สำหรับข้อมูลที่เบ้มากๆ SD อาจไม่สะท้อนความกระจายได้อย่างแม่นยำ
- สับสนระหว่าง SD กับ Standard Error: Standard Error วัดความแม่นยำของการประมาณค่าเฉลี่ยกลุ่มตัวอย่าง ในขณะที่ค่าเบี่ยงเบนมาตรฐานวัดความกระจายของข้อมูลต้นทางโดยตรง
ระวังค่าผิดปกติ (Outliers)
Further Reading
Sources
References and further authoritative reading used in preparing this article.