เมื่อไหร่ควรใช้ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต
ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต (GSD) เป็นตัววัดการกระจายตัวที่เหมาะสมสำหรับข้อมูลที่เป็นแบบทวีคูณมากกว่าแบบบวก เช่น อัตราการเติบโต อัตราส่วน ความเข้มข้น หรือการวัดใดก็ตามที่มีการแจกแจงลอการิทึมปกติ
พิจารณาผลตอบแทนหุ้น: กำไร 10% ตามด้วยขาดทุน 10% ไม่ได้ทำให้คุณกลับมาเท่าทุน (คุณจะมี 99% ของเงินต้น) ความสัมพันธ์แบบทวีคูณเหล่านี้ต้องการสถิติเรขาคณิตแทนสถิติเลขคณิต
ข้อมูลเชิงลึกสำคัญ
ทำความเข้าใจข้อมูลลอการิทึมปกติ
ข้อมูลมี การแจกแจงลอการิทึมปกติ เมื่อลอการิทึมธรรมชาติของมันมีการแจกแจงปกติ ตัวอย่างที่พบบ่อยได้แก่:
- ราคาหุ้นและผลตอบแทนการลงทุนตลอดเวลา
- การแจกแจงรายได้และความมั่งคั่ง
- ขนาดอนุภาคในละอองลอยและเภสัชภัณฑ์
- จำนวนโคโลนีแบคทีเรียและปริมาณไวรัส
- ความเข้มข้นของมลพิษทางสิ่งแวดล้อม
- ไทเตอร์แอนติบอดีและความเข้มข้นของยา
ลักษณะสำคัญ: กระบวนการที่เกี่ยวข้องกับการคูณซ้ำสร้างการแจกแจงลอการิทึมปกติ เช่นเดียวกับการบวกซ้ำสร้างการแจกแจงปกติ
สูตรและการคำนวณ
ส่วนเบี่ยงเบนมาตรฐานเรขาคณิต
หรือพูดง่ายๆ: หาลอการิทึมธรรมชาติของทุกค่า คำนวณส่วนเบี่ยงเบนมาตรฐานปกติ แล้วยกเป็นเลขชี้กำลัง
แปลงข้อมูล
คำนวณค่าเฉลี่ย
คำนวณ SD
แปลงกลับ
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")การตีความค่า GSD
ต่างจาก SD เลขคณิตที่มีหน่วยเดียวกับข้อมูล GSD เป็น ตัวคูณ คือ อัตราส่วน GSD เท่ากับ 2.0 หมายความว่าข้อมูลแปรผันตามปัจจัย 2
- GSD = 1.0:ไม่มีความแปรผัน (เป็นไปไม่ได้ในทางปฏิบัติ)
- GSD ≈ 1.2:ความแปรผันต่ำ (±20% เป็นเรื่องปกติ)
- GSD ≈ 2.0:ความแปรผันปานกลาง (ข้อมูลเพิ่มขึ้น/ลดลงเป็นสองเท่า)
- GSD ≈ 3.0:ความแปรผันสูง (ครอบคลุมหนึ่งลำดับขนาด)
ช่วงความเชื่อมั่น
การประยุกต์ใช้ในชีวิตจริง
วิทยาศาสตร์เภสัชกรรม
การเงินและเศรษฐศาสตร์
GSD vs SD ปกติ
การใช้ SD เลขคณิตกับข้อมูลลอการิทึมปกติให้ผลลัพธ์ที่ทำให้เข้าใจผิด:
ตัวอย่าง: ข้อมูลปริมาณไวรัส
ตรวจสอบการแจกแจงเสมอ