متى تستخدم الانحراف المعياري الهندسي
الانحراف المعياري الهندسي (GSD) هو مقياس الانتشار المناسب للبيانات ذات الطبيعة الضربية بدلاً من الجمعية — مثل معدلات النمو والنسب والتركيزات أو أي قياسات ذات توزيع لوغاريتمي طبيعي.
تأمل عوائد الأسهم: ربح 10% يتبعه خسارة 10% لا يعيدك إلى نقطة التعادل (ستكون لديك 99% من الأصل). هذه العلاقات الضربية تتطلب إحصاءات هندسية بدلاً من الحسابية.
رؤية أساسية
فهم البيانات اللوغاريتمية الطبيعية
البيانات تكون ذات توزيع لوغاريتمي طبيعي عندما يتبع لوغاريتمها الطبيعي التوزيع الطبيعي. الأمثلة الشائعة تشمل:
- أسعار الأسهم وعوائد الاستثمار عبر الزمن
- توزيعات الدخل والثروة
- أحجام الجسيمات في الهباء الجوي والأدوية
- أعداد المستعمرات البكتيرية والحمل الفيروسي
- تركيزات الملوثات البيئية
- عيارات الأجسام المضادة وتركيزات الأدوية
السمة الرئيسية: العمليات التي تتضمن ضربًا متكررًا تولّد توزيعات لوغاريتمية طبيعية، تمامًا كما يولّد الجمع المتكرر توزيعات طبيعية.
الصيغة والحساب
الانحراف المعياري الهندسي
أو ببساطة أكثر: خذ اللوغاريتم الطبيعي لجميع القيم، احسب الانحراف المعياري العادي، ثم ارفع e للأس.
تحويل البيانات
حساب المتوسط
حساب الانحراف المعياري
التحويل العكسي
import numpy as np
from scipy import stats
def geometric_sd(data):
"""Calculate geometric standard deviation"""
log_data = np.log(data)
sd_log = np.std(log_data, ddof=1)
return np.exp(sd_log)
def geometric_mean(data):
"""Calculate geometric mean"""
return stats.gmean(data)
# Example: Antibody titers (highly variable, log-normal)
titers = [64, 128, 256, 128, 512, 64, 256]
gm = geometric_mean(titers)
gsd = geometric_sd(titers)
print(f"Geometric Mean: {gm:.1f}")
print(f"Geometric SD: {gsd:.2f}")تفسير قيم GSD
على عكس الانحراف المعياري الحسابي الذي يكون بنفس وحدات بياناتك، فإن GSD هو عامل ضربي — نسبة. GSD بقيمة 2.0 يعني أن البيانات تتباين عادةً بمعامل 2.
- GSD = 1.0:لا تباين (مستحيل عمليًا)
- GSD ≈ 1.2:تباين منخفض (±20% نموذجي)
- GSD ≈ 2.0:تباين معتدل (البيانات تتضاعف/تنصّف)
- GSD ≈ 3.0:تباين عالٍ (يمتد عبر مرتبة من العظم)
فترات الثقة
التطبيقات الواقعية
العلوم الصيدلانية
المالية والاقتصاد
GSD مقابل الانحراف المعياري العادي
استخدام الانحراف المعياري الحسابي على بيانات لوغاريتمية طبيعية يعطي نتائج مضللة:
مثال: بيانات الحمل الفيروسي
تحقق دائمًا من التوزيع