Glosarium Statistik
Istilah dan definisi statistik utama
Simpangan Baku (σ / s)
Ukuran besarnya variasi atau dispersi dalam sekumpulan nilai. Ini adalah akar kuadrat dari varians dan dinyatakan dalam satuan yang sama dengan data.
Varians (σ² / s²)
Rata-rata dari kuadrat perbedaan dari rata-rata. Varians mengukur derajat penyebaran dalam kumpulan data dan merupakan kuadrat dari simpangan baku.
Rata-rata (μ / x̄)
Rata-rata aritmetika dari sekumpulan nilai, dihitung dengan menjumlahkan semua nilai dan membagi dengan jumlahnya. Ini mewakili tendensi sentral data.
Median
Nilai tengah dalam kumpulan data yang diurutkan. Jika terdapat jumlah nilai genap, median adalah rata-rata dari dua nilai tengah. Ini resisten terhadap pencilan.
Modus
Nilai yang paling sering muncul dalam kumpulan data. Kumpulan data dapat memiliki satu modus (unimodal), beberapa modus (multimodal), atau tidak memiliki modus sama sekali.
Rentang
Selisih antara nilai terbesar dan terkecil dalam kumpulan data. Meskipun mudah dihitung, ini hanya mempertimbangkan dua nilai ekstrem dan sensitif terhadap pencilan.
Populasi
Himpunan lengkap dari semua individu atau pengamatan yang diminati dalam suatu penelitian. Parameter populasi biasanya dilambangkan dengan huruf Yunani (μ, σ).
Sampel
Subset dari populasi yang dipilih untuk analisis. Statistik sampel biasanya dilambangkan dengan huruf Latin (x̄, s) dan digunakan untuk mengestimasi parameter populasi.
Koreksi Bessel
Penggunaan n−1 alih-alih n pada penyebut saat menghitung varians sampel. Koreksi ini memberikan estimasi tak bias dari varians populasi dari suatu sampel.
Distribusi Normal
Distribusi probabilitas simetris berbentuk lonceng di mana rata-rata, median, dan modus semuanya sama. Banyak fenomena alam mengikuti distribusi yang mendekati normal.
Aturan Empiris (68-95-99,7)
Untuk data yang terdistribusi normal, sekitar 68% nilai berada dalam ±1σ, 95% dalam ±2σ, dan 99,7% dalam ±3σ dari rata-rata.
Skor Z
Jumlah simpangan baku suatu titik data dari rata-rata, dihitung sebagai Z = (X − μ) / σ. Skor Z memungkinkan perbandingan nilai dari distribusi yang berbeda.
Galat Baku (SE)
Simpangan baku dari distribusi sampling suatu statistik, paling sering rata-rata. SE = σ/√n, menurun seiring bertambahnya ukuran sampel.
Interval Kepercayaan
Rentang nilai yang kemungkinan berisi parameter populasi yang sebenarnya dengan tingkat kepercayaan tertentu (misalnya, 95%). Interval yang lebih lebar menunjukkan presisi yang lebih rendah.
Pencilan
Titik data yang berbeda secara signifikan dari pengamatan lainnya. Metode deteksi umum mencakup nilai yang melampaui ±2 atau ±3 simpangan baku dari rata-rata.
Koefisien Variasi (CV)
Rasio simpangan baku terhadap rata-rata, dinyatakan sebagai persentase (CV = σ/μ × 100%). Ini memungkinkan perbandingan variabilitas antara kumpulan data dengan skala berbeda.
Kemencengan
Ukuran asimetri dari distribusi probabilitas. Kemencengan positif berarti ekornya memanjang ke kanan; kemencengan negatif berarti memanjang ke kiri.
Kurtosis
Ukuran ketebalan ekor distribusi probabilitas. Kurtosis tinggi menunjukkan ekor berat dan puncak tajam; kurtosis rendah menunjukkan ekor ringan dan puncak datar.
Derajat Kebebasan (df)
Jumlah nilai independen yang dapat bervariasi dalam perhitungan statistik. Untuk simpangan baku sampel, df = n − 1, mencerminkan koreksi Bessel.
Teorema Limit Pusat
Menyatakan bahwa distribusi sampling dari rata-rata sampel mendekati distribusi normal seiring bertambahnya ukuran sampel, terlepas dari distribusi populasi.
Uji Hipotesis
Metode statistik untuk pengambilan keputusan berdasarkan data. Ini melibatkan perbandingan statistik uji dengan nilai kritis atau nilai p untuk menentukan apakah hipotesis nol harus ditolak.
Nilai P
Probabilitas mengamati hasil yang sama ekstremnya dengan statistik uji, dengan asumsi hipotesis nol benar. Nilai p yang lebih kecil memberikan bukti yang lebih kuat terhadap hipotesis nol.
Koefisien Korelasi (r)
Nilai antara −1 dan 1 yang mengukur kekuatan dan arah hubungan linear antara dua variabel. Nilai yang mendekati ±1 menunjukkan hubungan linear yang kuat.
Rentang Interkuartil (IQR)
Selisih antara persentil ke-75 (Q3) dan persentil ke-25 (Q1). IQR mengukur penyebaran 50% tengah data dan resisten terhadap pencilan.
Persentil
Nilai di bawahnya persentase tertentu dari pengamatan berada. Misalnya, persentil ke-90 adalah nilai di bawahnya 90% titik data ditemukan.