Σ
SDCalc
ระดับกลางการประยุกต์ใช้·12 min

Cohen's d และการคำนวณขนาดอิทธิพล

เชี่ยวชาญการคำนวณขนาดอิทธิพล รวมถึง Cohen's d, Hedges' g และ Glass's delta เรียนรู้การวัดนัยสำคัญเชิงปฏิบัติเหนือกว่าค่า p โดยใช้ส่วนเบี่ยงเบนมาตรฐาน

เหนือกว่านัยสำคัญทางสถิติ: ทำความเข้าใจขนาดอิทธิพล

ขนาดอิทธิพล วัดขนาดของความแตกต่างหรือความสัมพันธ์ โดยไม่ขึ้นกับขนาดตัวอย่าง ในขณะที่ค่า p บอกว่าอิทธิพลมีนัยสำคัญทางสถิติหรือไม่ ขนาดอิทธิพลบอกว่ามันมีความหมายในทางปฏิบัติมากเพียงใด ความแตกต่างนี้สำคัญมากสำหรับการตัดสินใจบนหลักฐานในการวิจัย การแพทย์ การศึกษา และธุรกิจ

พิจารณาการทดลองยาที่ยาใหม่แสดงการปรับปรุงที่มีนัยสำคัญทางสถิติ (p < 0.001) เหนือยาหลอก หากไม่มีขนาดอิทธิพล คุณไม่รู้ว่าการปรับปรุงนั้นเป็น 0.1% หรือ 50% ขนาดอิทธิพลให้บริบทสำคัญนี้ ช่วยผู้มีส่วนได้เสียตัดสินว่าอิทธิพลคุ้มค่ากับค่าใช้จ่าย ผลข้างเคียง หรือความพยายามในการนำไปใช้หรือไม่

ตัววัดขนาดอิทธิพลที่ใช้กันมากที่สุดสำหรับการเปรียบเทียบสองกลุ่มคือ Cohen's d ซึ่งแสดงความแตกต่างระหว่างค่าเฉลี่ยในหน่วยส่วนเบี่ยงเบนมาตรฐาน การมาตรฐานนี้ช่วยให้เปรียบเทียบข้ามงานวิจัยและมาตราส่วนการวัดที่แตกต่างกันได้

ทำไมขนาดอิทธิพลจึงสำคัญ

นัยสำคัญทางสถิติได้รับอิทธิพลอย่างมากจากขนาดตัวอย่าง ด้วยตัวอย่างใหญ่พอ แม้ความแตกต่างเล็กน้อยก็กลายเป็น “มีนัยสำคัญ” ในทางกลับกัน อิทธิพลที่สำคัญอาจไม่ถึงนัยสำคัญในตัวอย่างเล็ก ขนาดอิทธิพลแก้ปัญหานี้โดยให้ตัววัดที่ไม่ขึ้นกับขนาดตัวอย่าง

กับดักนัยสำคัญ

การศึกษาที่มี n=10,000 อาจแสดง p < 0.001 สำหรับความแตกต่าง 0.5 คะแนนในมาตราส่วน 100 คะแนน สิ่งนี้มีนัยสำคัญทางสถิติแต่ไม่มีความหมายในทางปฏิบัติ (d ≈ 0.05) ควรรายงานขนาดอิทธิพลควบคู่กับค่า p เสมอ

เหตุผลสำคัญในการใช้ขนาดอิทธิพล:

  • การวิเคราะห์อภิมาน: ขนาดอิทธิพลสามารถรวมข้ามงานวิจัยเพื่อประมาณอิทธิพลโดยรวม
  • การวิเคราะห์กำลัง: จำเป็นสำหรับคำนวณขนาดตัวอย่างที่ต้องการสำหรับงานวิจัยในอนาคต
  • การตัดสินใจเชิงปฏิบัติ: ช่วยตัดสินว่าการแทรกแซงคุ้มค่ากับการนำไปใช้หรือไม่
  • การทำซ้ำ: ให้เป้าหมายสำหรับงานวิจัยทำซ้ำที่จะจับคู่

Cohen's d: ตัววัดขนาดอิทธิพลมาตรฐาน

Cohen's d แสดงความแตกต่างระหว่างค่าเฉลี่ยสองกลุ่มในหน่วยส่วนเบี่ยงเบนมาตรฐานรวม:

Cohen's d

d = (M₁ - M₂) / sp

โดยที่ M₁ และ M₂ คือค่าเฉลี่ยกลุ่ม และ sp คือส่วนเบี่ยงเบนมาตรฐานรวม:

ส่วนเบี่ยงเบนมาตรฐานรวม

sp = √[((n₁-1)s₁² + (n₂-1)s₂²) / (n₁+n₂-2)]

เครื่องหมายของ d บ่งชี้ทิศทาง: บวกเมื่อ M₁ > M₂ ลบเมื่อ M₁ < M₂ มักรายงานค่าสัมบูรณ์ |d| เมื่อทิศทางชัดเจนจากบริบท

ทำไมต้องรวมส่วนเบี่ยงเบนมาตรฐาน?

การรวมสมมติว่าทั้งสองกลุ่มมีความแปรปรวนของประชากรเท่ากัน สิ่งนี้ให้ค่าประมาณที่เสถียรกว่าการใช้ SD ของกลุ่มใดกลุ่มหนึ่งเพียงอย่างเดียว และสอดคล้องกับข้อสมมติของการทดสอบ t ตัวอย่างอิสระ

ตัววัดขนาดอิทธิพลทางเลือก

แม้ Cohen's d จะใช้กันมากที่สุด แต่มีทางเลือกสำหรับสถานการณ์เฉพาะ:

Hedges' g: ขนาดอิทธิพลที่แก้ไขความเอนเอียง

Cohen's d ประมาณค่าขนาดอิทธิพลของประชากรสูงเกินไปเล็กน้อยในตัวอย่างเล็ก Hedges' g ใช้ตัวคูณแก้ไข:

การแก้ไข Hedges' g

g = d × (1 - 3/(4(n₁+n₂) - 9))

สำหรับตัวอย่างที่มีมากกว่า 20 ต่อกลุ่ม ความแตกต่างน้อยมาก สำหรับตัวอย่างเล็ก (n < 20) แนะนำให้ใช้ Hedges' g

Glass's Δ: เมื่อความแปรปรวนต่างกัน

เมื่อกลุ่มหนึ่งเป็นกลุ่มควบคุมที่มีความแปรผันที่ทราบ ใช้เฉพาะส่วนเบี่ยงเบนมาตรฐานของกลุ่มควบคุมเป็นตัวส่วน:

Glass's Delta

Δ = (M₁ - M₂) / s_control

สิ่งนี้มีประโยชน์เมื่อการรักษาอาจส่งผลต่อความแปรปรวน (เช่น การแทรกแซงที่ช่วยผู้ที่มีผลงานต่ำมากกว่าผู้ที่มีผลงานสูง)

การตีความขนาดอิทธิพล: แนวทางของ Cohen

Jacob Cohen เสนอแนวปฏิบัตินี้สำหรับการตีความค่า d:

ขนาดอิทธิพล (d)การตีความการทับซ้อน
0.2เล็กทับซ้อน 85% ระหว่างกลุ่ม
0.5ปานกลางทับซ้อน 67% ระหว่างกลุ่ม
0.8ใหญ่ทับซ้อน 53% ระหว่างกลุ่ม
1.2ใหญ่มากทับซ้อน 40% ระหว่างกลุ่ม
2.0มหาศาลทับซ้อน 19% ระหว่างกลุ่ม

บริบทมีความสำคัญ

เหล่านี้เป็นแนวทางคร่าวๆ ไม่ใช่กฎเกณฑ์ตายตัว ในบางสาขา d = 0.2 อาจมีความหมายมาก (เช่น ลดความเสี่ยงหัวใจวาย) ในขณะที่สาขาอื่น d = 0.8 อาจเป็นสิ่งที่คาดหวัง (เช่น การสอนพิเศษ vs ไม่มีการสอน)

ตัวอย่างพร้อมวิธีทำ: การแทรกแซงทางการศึกษา

โรงเรียนทดสอบโปรแกรมการอ่านใหม่ กลุ่มควบคุม (n=25): ค่าเฉลี่ย=72, SD=12 กลุ่มทดลอง (n=30): ค่าเฉลี่ย=79, SD=14 คำนวณ Cohen's d:

1

คำนวณความแปรปรวนรวม

sp² = [(25-1)(12)² + (30-1)(14)²] / (25+30-2) = [24×144 + 29×196] / 53 = [3456 + 5684] / 53 = 172.45
2

คำนวณ SD รวม

sp = √172.45 = 13.13
3

คำนวณ Cohen's d

d = (79 - 72) / 13.13 = 7 / 13.13 = 0.53
4

ตีความ

ขนาดอิทธิพลปานกลาง (d = 0.53) กลุ่มทดลองได้คะแนนสูงกว่ากลุ่มควบคุมประมาณครึ่งส่วนเบี่ยงเบนมาตรฐาน

นี่หมายความว่าถ้าคุณสุ่มนักเรียนหนึ่งคนจากกลุ่มทดลองและหนึ่งคนจากกลุ่มควบคุม นักเรียนกลุ่มทดลองจะได้คะแนนสูงกว่าประมาณ 64% ของเวลา (คำนวณจากการทับซ้อน)

การนำไปใช้ด้วย Python

คำนวณขนาดอิทธิพลโดยโปรแกรมพร้อมช่วงความเชื่อมั่น:

python
import numpy as np
from scipy import stats

def cohens_d(group1, group2):
    """Calculate Cohen's d for two independent groups."""
    n1, n2 = len(group1), len(group2)
    var1, var2 = np.var(group1, ddof=1), np.var(group2, ddof=1)

    # Pooled standard deviation
    pooled_std = np.sqrt(((n1-1)*var1 + (n2-1)*var2) / (n1+n2-2))

    # Cohen's d
    d = (np.mean(group1) - np.mean(group2)) / pooled_std
    return d

def hedges_g(group1, group2):
    """Calculate Hedges' g (bias-corrected effect size)."""
    n1, n2 = len(group1), len(group2)
    d = cohens_d(group1, group2)

    # Correction factor for small sample bias
    correction = 1 - 3 / (4*(n1+n2) - 9)
    return d * correction

# Example usage
control = [68, 72, 75, 70, 69, 74, 71, 73, 76, 72]
treatment = [75, 79, 82, 78, 80, 77, 81, 76, 83, 79]

d = cohens_d(treatment, control)
g = hedges_g(treatment, control)
print(f"Cohen's d: {d:.3f}")
print(f"Hedges' g: {g:.3f}")