Σ
SDCalc
ขั้นสูงขั้นสูง·12 min

คู่มือฉบับสมบูรณ์ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต

คู่มือฉบับสมบูรณ์สำหรับส่วนเบี่ยงเบนมาตรฐานเรขาคณิตในการวิเคราะห์อัตราส่วน อัตราการเติบโต และข้อมูลที่มีการแจกแจงลอการิทึมปกติ รวมถึงสูตร ขั้นตอนการคำนวณ โค้ด Python และการประยุกต์ใช้ในด้านการเงินและวิทยาศาสตร์

เมื่อไหร่ควรใช้ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต

ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต (GSD) เป็นตัววัดการกระจายตัวที่เหมาะสมสำหรับข้อมูลที่เป็นแบบทวีคูณมากกว่าแบบบวก เช่น อัตราการเติบโต อัตราส่วน ความเข้มข้น หรือการวัดใดก็ตามที่มีการแจกแจงลอการิทึมปกติ

พิจารณาผลตอบแทนหุ้น: กำไร 10% ตามด้วยขาดทุน 10% ไม่ได้ทำให้คุณกลับมาเท่าทุน (คุณจะมี 99% ของเงินต้น) ความสัมพันธ์แบบทวีคูณเหล่านี้ต้องการสถิติเรขาคณิตแทนสถิติเลขคณิต

ข้อมูลเชิงลึกสำคัญ

ถ้าข้อมูลของคุณครอบคลุมหลายลำดับขนาด เป็นบวกเสมอ และดูเบ้ขวาเมื่อพล็อตแบบปกติแต่สมมาตรเมื่อพล็อตในมาตราส่วนลอการิทึม คุณกำลังจัดการกับข้อมูลลอการิทึมปกติที่ต้องการสถิติเรขาคณิต

ทำความเข้าใจข้อมูลลอการิทึมปกติ

ข้อมูลมี การแจกแจงลอการิทึมปกติ เมื่อลอการิทึมธรรมชาติของมันมีการแจกแจงปกติ ตัวอย่างที่พบบ่อยได้แก่:

  • ราคาหุ้นและผลตอบแทนการลงทุนตลอดเวลา
  • การแจกแจงรายได้และความมั่งคั่ง
  • ขนาดอนุภาคในละอองลอยและเภสัชภัณฑ์
  • จำนวนโคโลนีแบคทีเรียและปริมาณไวรัส
  • ความเข้มข้นของมลพิษทางสิ่งแวดล้อม
  • ไทเตอร์แอนติบอดีและความเข้มข้นของยา

ลักษณะสำคัญ: กระบวนการที่เกี่ยวข้องกับการคูณซ้ำสร้างการแจกแจงลอการิทึมปกติ เช่นเดียวกับการบวกซ้ำสร้างการแจกแจงปกติ

สูตรและการคำนวณ

ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต

GSD = exp(√[Σ(ln xᵢ - ln x̄ₘ)² / (n-1)])

หรือพูดง่ายๆ: หาลอการิทึมธรรมชาติของทุกค่า คำนวณส่วนเบี่ยงเบนมาตรฐานปกติ แล้วยกเป็นเลขชี้กำลัง

1

แปลงข้อมูล

คำนวณลอการิทึมธรรมชาติของแต่ละค่า: yᵢ = ln(xᵢ)
2

คำนวณค่าเฉลี่ย

หาค่าเฉลี่ยเลขคณิตของค่าลอการิทึม: ȳ = Σyᵢ/n
3

คำนวณ SD

หาส่วนเบี่ยงเบนมาตรฐานของค่าลอการิทึม: s = √[Σ(yᵢ-ȳ)²/(n-1)]
4

แปลงกลับ

ยกเป็นเลขชี้กำลังเพื่อให้ได้ GSD: GSD = eˢ
Python
import numpy as np
from scipy import stats

def geometric_sd(data):
    """Calculate geometric standard deviation"""
    log_data = np.log(data)
    sd_log = np.std(log_data, ddof=1)
    return np.exp(sd_log)

def geometric_mean(data):
    """Calculate geometric mean"""
    return stats.gmean(data)

# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")

การตีความค่า GSD

ต่างจาก SD เลขคณิตที่มีหน่วยเดียวกับข้อมูล GSD เป็น ตัวคูณ คือ อัตราส่วน GSD เท่ากับ 2.0 หมายความว่าข้อมูลแปรผันตามปัจจัย 2

  • GSD = 1.0:ไม่มีความแปรผัน (เป็นไปไม่ได้ในทางปฏิบัติ)
  • GSD ≈ 1.2:ความแปรผันต่ำ (±20% เป็นเรื่องปกติ)
  • GSD ≈ 2.0:ความแปรผันปานกลาง (ข้อมูลเพิ่มขึ้น/ลดลงเป็นสองเท่า)
  • GSD ≈ 3.0:ความแปรผันสูง (ครอบคลุมหนึ่งลำดับขนาด)

ช่วงความเชื่อมั่น

สำหรับข้อมูลลอการิทึมปกติ ช่วง 95% โดยประมาณคือ: ค่าเฉลี่ยเรขาคณิต ÷ GSD² ถึง ค่าเฉลี่ยเรขาคณิต × GSD² สำหรับ GM=100 และ GSD=2 ช่วงคือ 25 ถึง 400

การประยุกต์ใช้ในชีวิตจริง

วิทยาศาสตร์เภสัชกรรม

การแจกแจงขนาดอนุภาค (D50, GSD) · ความแปรผันของความเข้มข้นยา · การศึกษาชีวปริมาณออกฤทธิ์ · การวิเคราะห์ลักษณะละอองลอย

การเงินและเศรษฐศาสตร์

ความผันผวนของผลตอบแทนการลงทุน · การวิเคราะห์อัตราการเติบโต · การศึกษาการแจกแจงรายได้ · การสร้างแบบจำลองราคาสินทรัพย์

GSD vs SD ปกติ

การใช้ SD เลขคณิตกับข้อมูลลอการิทึมปกติให้ผลลัพธ์ที่ทำให้เข้าใจผิด:

ตัวอย่าง: ข้อมูลปริมาณไวรัส

ค่า: 1,000; 5,000; 10,000; 50,000; 100,000 สำเนา/มล. ค่าเฉลี่ยเลขคณิต ± SD: 33,200 ± 41,424 ค่าเฉลี่ยเรขาคณิต × GSD: 10,000 × 4.5 → ช่วง: 2,222 ถึง 45,000 SD เลขคณิตจะแนะนำว่าค่าลบเป็นไปได้ ซึ่งเป็นไปไม่ได้สำหรับปริมาณไวรัส!

ตรวจสอบการแจกแจงเสมอ

ก่อนคำนวณตัววัดการกระจายตัวใดๆ ให้แสดงข้อมูลเป็นภาพ ถ้ามันเบ้ขวาและมีหางยาว ลองแปลงลอการิทึม ถ้าทำให้สมมาตร ให้ใช้สถิติเรขาคณิต