Glosari Statistik
Istilah dan definisi statistik utama
Sisihan Piawai (σ / s)
Ukuran jumlah variasi atau serakan dalam satu set nilai. Ia adalah punca kuasa dua varians dan dinyatakan dalam unit yang sama dengan data.
Varians (σ² / s²)
Purata perbezaan kuasa dua dari min. Varians mengukur tahap serakan dalam set data dan merupakan kuasa dua sisihan piawai.
Min (μ / x̄)
Purata aritmetik bagi satu set nilai, dikira dengan menjumlahkan semua nilai dan membahagi dengan bilangannya. Ia mewakili kecenderungan memusat data.
Median
Nilai tengah dalam set data yang telah disusun. Jika terdapat bilangan genap nilai, median ialah purata dua nilai tengah. Ia tahan terhadap outlier.
Mod
Nilai yang paling kerap muncul dalam set data. Set data boleh mempunyai satu mod (unimod), berbilang mod (multimod), atau tiada mod langsung.
Julat
Perbezaan antara nilai terbesar dan terkecil dalam set data. Walaupun mudah dikira, ia hanya mempertimbangkan dua nilai ekstrem dan sensitif terhadap outlier.
Populasi
Set lengkap semua individu atau pemerhatian yang menjadi minat dalam sesuatu kajian. Parameter populasi biasanya dilambangkan dengan huruf Yunani (μ, σ).
Sampel
Subset populasi yang dipilih untuk analisis. Statistik sampel biasanya dilambangkan dengan huruf Latin (x̄, s) dan digunakan untuk menganggar parameter populasi.
Pembetulan Bessel
Penggunaan n−1 dan bukannya n dalam penyebut apabila mengira varians sampel. Pembetulan ini memberikan anggaran tak pincang bagi varians populasi daripada sampel.
Taburan Normal
Taburan kebarangkalian simetri berbentuk loceng di mana min, median dan mod semuanya sama. Banyak fenomena semula jadi mengikuti taburan normal secara anggaran.
Peraturan Empirikal (68-95-99.7)
Untuk data bertaburan normal, kira-kira 68% nilai berada dalam ±1σ, 95% dalam ±2σ, dan 99.7% dalam ±3σ daripada min.
Skor-Z
Bilangan sisihan piawai sesuatu titik data daripada min, dikira sebagai Z = (X − μ) / σ. Skor-Z membolehkan perbandingan nilai daripada taburan berbeza.
Ralat Piawai (SE)
Sisihan piawai bagi taburan pensampelan sesuatu statistik, paling lazim min. SE = σ/√n, berkurangan apabila saiz sampel bertambah.
Selang Keyakinan
Julat nilai yang berkemungkinan mengandungi parameter populasi sebenar dengan tahap keyakinan tertentu (cth., 95%). Selang yang lebih lebar menunjukkan ketepatan yang kurang.
Outlier
Titik data yang berbeza secara ketara daripada pemerhatian lain. Kaedah pengesanan lazim termasuk nilai melebihi ±2 atau ±3 sisihan piawai daripada min.
Pekali Variasi (CV)
Nisbah sisihan piawai kepada min, dinyatakan sebagai peratusan (CV = σ/μ × 100%). Ia membolehkan perbandingan kebolehubahan antara set data dengan skala berbeza.
Kepencongan
Ukuran asimetri bagi sesuatu taburan kebarangkalian. Kepencongan positif bermakna ekor memanjang ke kanan; kepencongan negatif bermakna ia memanjang ke kiri.
Kurtosis
Ukuran ketebalan ekor sesuatu taburan kebarangkalian. Kurtosis tinggi menunjukkan ekor berat dan puncak tajam; kurtosis rendah menunjukkan ekor ringan dan puncak rata.
Darjah Kebebasan (df)
Bilangan nilai bebas yang boleh berubah dalam pengiraan statistik. Untuk sisihan piawai sampel, df = n − 1, mencerminkan pembetulan Bessel.
Teorem Had Memusat
Menyatakan bahawa taburan pensampelan min sampel menghampiri taburan normal apabila saiz sampel bertambah, tanpa mengira taburan populasi.
Pengujian Hipotesis
Kaedah statistik untuk membuat keputusan berdasarkan data. Ia melibatkan perbandingan statistik ujian dengan nilai kritikal atau nilai-p untuk menentukan sama ada hipotesis nol perlu ditolak.
Nilai-P
Kebarangkalian memerhati keputusan yang sama ekstrem dengan statistik ujian, dengan mengandaikan hipotesis nol adalah benar. Nilai-p yang lebih kecil memberikan bukti yang lebih kuat terhadap hipotesis nol.
Pekali Korelasi (r)
Nilai antara −1 dan 1 yang mengukur kekuatan dan arah hubungan linear antara dua pemboleh ubah. Nilai hampir ±1 menunjukkan hubungan linear yang kuat.
Julat Antara Kuartil (IQR)
Perbezaan antara persentil ke-75 (Q3) dan persentil ke-25 (Q1). IQR mengukur serakan 50% tengah data dan tahan terhadap outlier.
Persentil
Nilai di mana peratusan tertentu pemerhatian berada di bawahnya. Contohnya, persentil ke-90 ialah nilai di mana 90% titik data berada di bawahnya.