Σ
SDCalc

Glosarium Statistik

Istilah dan definisi statistik utama

Simpangan Baku (σ / s)

Ukuran besarnya variasi atau dispersi dalam sekumpulan nilai. Ini adalah akar kuadrat dari varians dan dinyatakan dalam satuan yang sama dengan data.

Varians (σ² / s²)

Rata-rata dari kuadrat perbedaan dari rata-rata. Varians mengukur derajat penyebaran dalam kumpulan data dan merupakan kuadrat dari simpangan baku.

Rata-rata (μ / x̄)

Rata-rata aritmetika dari sekumpulan nilai, dihitung dengan menjumlahkan semua nilai dan membagi dengan jumlahnya. Ini mewakili tendensi sentral data.

Median

Nilai tengah dalam kumpulan data yang diurutkan. Jika terdapat jumlah nilai genap, median adalah rata-rata dari dua nilai tengah. Ini resisten terhadap pencilan.

Modus

Nilai yang paling sering muncul dalam kumpulan data. Kumpulan data dapat memiliki satu modus (unimodal), beberapa modus (multimodal), atau tidak memiliki modus sama sekali.

Rentang

Selisih antara nilai terbesar dan terkecil dalam kumpulan data. Meskipun mudah dihitung, ini hanya mempertimbangkan dua nilai ekstrem dan sensitif terhadap pencilan.

Populasi

Himpunan lengkap dari semua individu atau pengamatan yang diminati dalam suatu penelitian. Parameter populasi biasanya dilambangkan dengan huruf Yunani (μ, σ).

Sampel

Subset dari populasi yang dipilih untuk analisis. Statistik sampel biasanya dilambangkan dengan huruf Latin (x̄, s) dan digunakan untuk mengestimasi parameter populasi.

Koreksi Bessel

Penggunaan n−1 alih-alih n pada penyebut saat menghitung varians sampel. Koreksi ini memberikan estimasi tak bias dari varians populasi dari suatu sampel.

Distribusi Normal

Distribusi probabilitas simetris berbentuk lonceng di mana rata-rata, median, dan modus semuanya sama. Banyak fenomena alam mengikuti distribusi yang mendekati normal.

Aturan Empiris (68-95-99,7)

Untuk data yang terdistribusi normal, sekitar 68% nilai berada dalam ±1σ, 95% dalam ±2σ, dan 99,7% dalam ±3σ dari rata-rata.

Skor Z

Jumlah simpangan baku suatu titik data dari rata-rata, dihitung sebagai Z = (X − μ) / σ. Skor Z memungkinkan perbandingan nilai dari distribusi yang berbeda.

Galat Baku (SE)

Simpangan baku dari distribusi sampling suatu statistik, paling sering rata-rata. SE = σ/√n, menurun seiring bertambahnya ukuran sampel.

Interval Kepercayaan

Rentang nilai yang kemungkinan berisi parameter populasi yang sebenarnya dengan tingkat kepercayaan tertentu (misalnya, 95%). Interval yang lebih lebar menunjukkan presisi yang lebih rendah.

Pencilan

Titik data yang berbeda secara signifikan dari pengamatan lainnya. Metode deteksi umum mencakup nilai yang melampaui ±2 atau ±3 simpangan baku dari rata-rata.

Koefisien Variasi (CV)

Rasio simpangan baku terhadap rata-rata, dinyatakan sebagai persentase (CV = σ/μ × 100%). Ini memungkinkan perbandingan variabilitas antara kumpulan data dengan skala berbeda.

Kemencengan

Ukuran asimetri dari distribusi probabilitas. Kemencengan positif berarti ekornya memanjang ke kanan; kemencengan negatif berarti memanjang ke kiri.

Kurtosis

Ukuran ketebalan ekor distribusi probabilitas. Kurtosis tinggi menunjukkan ekor berat dan puncak tajam; kurtosis rendah menunjukkan ekor ringan dan puncak datar.

Derajat Kebebasan (df)

Jumlah nilai independen yang dapat bervariasi dalam perhitungan statistik. Untuk simpangan baku sampel, df = n − 1, mencerminkan koreksi Bessel.

Teorema Limit Pusat

Menyatakan bahwa distribusi sampling dari rata-rata sampel mendekati distribusi normal seiring bertambahnya ukuran sampel, terlepas dari distribusi populasi.

Uji Hipotesis

Metode statistik untuk pengambilan keputusan berdasarkan data. Ini melibatkan perbandingan statistik uji dengan nilai kritis atau nilai p untuk menentukan apakah hipotesis nol harus ditolak.

Nilai P

Probabilitas mengamati hasil yang sama ekstremnya dengan statistik uji, dengan asumsi hipotesis nol benar. Nilai p yang lebih kecil memberikan bukti yang lebih kuat terhadap hipotesis nol.

Koefisien Korelasi (r)

Nilai antara −1 dan 1 yang mengukur kekuatan dan arah hubungan linear antara dua variabel. Nilai yang mendekati ±1 menunjukkan hubungan linear yang kuat.

Rentang Interkuartil (IQR)

Selisih antara persentil ke-75 (Q3) dan persentil ke-25 (Q1). IQR mengukur penyebaran 50% tengah data dan resisten terhadap pencilan.

Persentil

Nilai di bawahnya persentase tertentu dari pengamatan berada. Misalnya, persentil ke-90 adalah nilai di bawahnya 90% titik data ditemukan.