Σ
SDCalc
เริ่มต้นFundamentals·9 min

ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) คืออะไร? นิยาม สูตรคำนวณ และตัวอย่าง

ทำความเข้าใจค่าเบี่ยงเบนมาตรฐานว่าคืออะไร วิธีคำนวณสำหรับประชากรและกลุ่มตัวอย่าง พร้อมเหตุผลว่าทำไมมันถึงสำคัญในการวิเคราะห์ข้อมูล เรียนรู้สูตรคำนวณได้เลย

By Standard Deviation Calculator Team · Data Science Team·Published

ค่าเบี่ยงเบนมาตรฐานคืออะไร?

ค่าเบี่ยงเบนมาตรฐาน (Standard Deviation) คือตัววัดทางสถิติที่บอกปริมาณของความแปรปรวนหรือการกระจายของชุดข้อมูล ค่าเบี่ยงเบนมาตรฐานที่ต่ำแสดงว่าจุดข้อมูลมักอยู่ใกล้กับค่าเฉลี่ย (ค่าคาดหวัง) ของชุดข้อมูลนั้น ในขณะที่ค่าที่สูงแสดงว่าข้อมูลกระจายตัวออกไปในวงกว้าง ตัวแทนของค่านี้คืออักษรกรีก σ (ซิกมา) สำหรับประชากร และ s สำหรับกลุ่มตัวอย่าง ซึ่งถือเป็นแนวคิดพื้นฐานที่สำคัญที่สุดอย่างหนึ่งในสถิติเชิงพรรณนา

นิยามสั้นๆ

ค่าเบี่ยงเบนมาตรฐานวัดระยะทั่วไปของแต่ละจุดข้อมูลจากค่าเฉลี่ย มันบอกคุณว่าโดยเฉลี่ยแล้ว ข้อมูลของคุณเบี่ยงเบนออกจากศูนย์กลางมากแค่ไหน

ค่าเบี่ยงเบนมาตรฐานของประชากร vs. กลุ่มตัวอย่าง

ก่อนจะคำนวณค่าเบี่ยงเบนมาตรฐาน คุณต้องรู้ก่อนว่าข้อมูลของคุณเป็นตัวแทนของประชากรทั้งหมด หรือเป็นเพียงกลุ่มตัวอย่างของประชากร ประชากรคือสมาชิกทั้งหมดในกลุ่มที่กำหนด ส่วนกลุ่มตัวอย่างคือเซ็ตย่อยที่เป็นตัวแทนของกลุ่มนั้น การคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจะต้องมีการปรับแก้ทางคณิตศาสตร์ นั่นคือการใช้ n - 1 (ดีกรีอิสระ หรือ df) แทนที่จะเป็น N เพื่อให้แน่ใจว่าผลลัพธ์ที่ได้เป็นตัวประมาณค่าแปรปรวนของประชากรที่ไม่มีอคติ (unbiased estimator)

ค่าเบี่ยงเบนมาตรฐานของประชากร

ใช้เมื่อคุณมีข้อมูลของกลุ่มทั้งหมด เขียนแทนด้วย σ ตัวหารในสูตรค่าแปรปรวนจะเป็น N (ขนาดของประชากรทั้งหมด)

ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง

ใช้เมื่อคุณมีข้อมูลเพียงส่วนหนึ่งของกลุ่ม เขียนแทนด้วย s ตัวหารในสูตรค่าแปรปรวนจะเป็น n - 1 (ขนาดกลุ่มตัวอย่างลบด้วยหนึ่ง) เพื่อแก้ไขความเอนเอียง

อธิบายสูตรคำนวณค่าเบี่ยงเบนมาตรฐาน

สูตรคำนวณค่าเบี่ยงเบนมาตรฐานเริ่มจากการหาค่าแปรปรวนก่อน แล้วจึงถอดรากที่สอง ขั้นตอนการถอดรากนี้สำคัญมาก เพราะมันจะแปลงหน่วยวัดความกระจายกลับไปเป็นหน่วยเดิมของข้อมูล ตัวแปรสำคัญๆ ประกอบด้วย xᵢ (แต่ละค่าในข้อมูล), μ หรือ (ค่าเฉลี่ยของประชากรหรือกลุ่มตัวอย่าง) และ N หรือ n (จำนวนข้อมูลทั้งหมด)

ค่าเบี่ยงเบนมาตรฐานของประชากร

σ = √[ Σ(xᵢ - μ)² / N ]

ค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

ตัวอย่างการคำนวณทีละขั้นตอน

มาลองคำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างจากชุดคะแนนสอบเล็กๆ กันครับ: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5] การทำตามสูตรทีละขั้นตอนจะช่วยให้เห็นว่าค่าแปรปรวนสะสมกันอย่างไรก่อนที่เราจะถอดรากที่สองในตอนท้าย

1

หาค่าเฉลี่ย (x̄)

บวกค่าทั้งหมดแล้วหารด้วยจำนวน: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

ลบด้วยค่าเฉลี่ยแล้วยกกำลังสอง

หาผลต่างยกกำลังสองของแต่ละค่า: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, ฯลฯ
3

หาผลรวมของผลต่างยกกำลังสอง

บวกผลลัพธ์ยกกำลังสองทั้งหมดเข้าด้วยกัน: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

หารด้วย n - 1 (ดีกรีอิสระ)

เอาผลรวมหารด้วยขนาดกลุ่มตัวอย่างลบด้วยหนึ่ง: 57.6 / (10 - 1) = 57.6 / 9 = 6.4 นี่คือค่าแปรปรวนของกลุ่มตัวอย่าง (σ²)
5

ถอดรากที่สอง

หารากที่สองของค่าแปรปรวน: √6.4 ≈ 2.53 ดังนั้นค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่างคือ 2.53

การคำนวณค่าเบี่ยงเบนมาตรฐานด้วย Python

การคำนวณค่าเบี่ยงเบนมาตรฐานด้วยมือมักจะเกิดความผิดพลาดได้ง่าย โดยเฉพาะกับชุดข้อมูลขนาดใหญ่ ในทางปฏิบัติ นักสถิติและนักวิทยาศาสตร์ข้อมูลมักใช้ภาษาโปรแกรมอย่าง Python ในการคำนวณทันทีด้วยไลบรารีมาตรฐาน

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# คำนวณค่าเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง (ค่าเริ่มต้น)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# คำนวณค่าเบี่ยงเบนมาตรฐานของประชากร
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

กฎเชิงประจักษ์ (Empirical Rule) กับค่าเบี่ยงเบนมาตรฐาน

เมื่อข้อมูลมีการแจกแจงแบบปกติ (Normal Distribution หรือโค้งระฆังคว่ำ) ค่าเบี่ยงเบนมาตรฐานจะกลายเป็นตัวทำนายที่แม่นยำมาก กฎเชิงประจักษ์ หรือที่รู้จักกันในชื่อกฎ 68-95-99.7 ระบุว่าข้อมูลเกือบทั้งหมดจะอยู่ภายในสามส่วนเบี่ยงเบนมาตรฐานจากค่าเฉลี่ย ทำให้นักวิเคราะห์สามารถระบุค่าผิดปกติ (Outliers) และเข้าใจความน่าจะเป็นที่จะเกิดการสังเกตการณ์หนึ่งๆ ได้อย่างรวดเร็ว

ระยะห่างจากค่าเฉลี่ยร้อยละของข้อมูลการนำไปใช้งาน
±1σ68.27%ระบุค่าทั่วไปที่พบได้ในชีวิตประจำวัน
±2σ95.45%กำหนดช่วงความเชื่อมั่น (Confidence Intervals)
±3σ99.73%ตรวจจับค่าผิดปกติรุนแรง (Extreme Outliers)

ค่าเบี่ยงเบนมาตรฐาน vs. ค่าแปรปรวน

ค่าแปรปรวนและค่าเบี่ยงเบนมาตรฐานเป็นตัววัดความกระจายที่เกี่ยวข้องกันอย่างใกล้ชิด ค่าแปรปรวน (σ² หรือ s²) คือค่าเฉลี่ยของผลต่างยกกำลังสองจากค่าเฉลี่ย ในขณะที่ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของค่าแปรปรวน เนื่องจากค่าแปรปรวนมีหน่วยเป็นกำลังสอง (เช่น บาทกำลังสอง, ตารางเซนติเมตร) จึงตีความยากในบริบทของข้อมูลดั้งเดิม ค่าเบี่ยงเบนมาตรฐานแก้ปัญหานี้โดยแปลงหน่วยวัดกลับไปเป็นหน่วยเดิม

การรายงานข้อมูลของคุณ

ควรรายงานค่าเบี่ยงเบนมาตรฐานควบคู่กับค่าเฉลี่ยเสมอเมื่ออธิบายข้อมูล เนื่องจาก SD มีหน่วยเดียวกับค่าเฉลี่ย (เช่น บาท, เซนติเมตร, กิโลกรัม) จึงทำให้ผู้อ่านเข้าใจความกระจายของข้อมูลได้อย่างทันทีที่สัมผัสได้

ข้อผิดพลาดที่ควรหลีกเลี่ยง

แม้ค่าเบี่ยงเบนมาตรฐานจะเป็นเครื่องมือที่ทรงพลัง แต่ก็มักถูกใช้ผิดวิธีบ่อยครั้ง การใช้สูตรผิดหรือเข้าใจผิดว่าค่าที่ได้แทนความหมายอะไร อาจนำไปสู่การวิเคราะห์ข้อมูลที่บกพร่องและข้อสรุปที่ไม่ถูกต้องได้

  • ใช้สูตรประชากรกับกลุ่มตัวอย่าง: การลืมใช้ n - 1 กับกลุ่มตัวอย่างจะทำให้ค่าความกระจายที่คำนวณได้ต่ำกว่าความเป็นจริง ซึ่งเป็นการประเมินค่าแปรปรวนของประชากรที่แท้จริงต่ำเกินไป
  • นำ SD ไปใช้กับการแจกแจงที่ไม่ปกติ: กฎเชิงประจักษ์ใช้ได้กับการแจกแจงแบบปกติเท่านั้น สำหรับข้อมูลที่เบ้มากๆ SD อาจไม่สะท้อนความกระจายได้อย่างแม่นยำ
  • สับสนระหว่าง SD กับ Standard Error: Standard Error วัดความแม่นยำของการประมาณค่าเฉลี่ยกลุ่มตัวอย่าง ในขณะที่ค่าเบี่ยงเบนมาตรฐานวัดความกระจายของข้อมูลต้นทางโดยตรง

ระวังค่าผิดปกติ (Outliers)

ค่าเบี่ยงเบนมาตรฐานไวต่อค่าผิดปกติรุนแรงมาก เนื่องจากสูตรมีการยกกำลังสองผลต่างจากค่าเฉลี่ย ค่าผิดปกติเพียงค่าเดียวที่สูงหรือต่ำผิดปกติมากๆ สามารถทำให้ค่าเบี่ยงเบนมาตรฐานพองขึ้นจนผิดสัดส่วน ทำให้ข้อมูลดูมีความแปรปรวนมากกว่าที่เป็นจริง

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. วิกิพีเดีย: ค่าเบี่ยงเบนมาตรฐาน
  2. คู่มือสถิติ e-Handbook ของ NIST/SEMATECH
  3. ข่าน อะคาเดมี: สถิติและความน่าจะเป็น