Sisihan Piawai (σ / s)
Ukuran jumlah variasi atau serakan dalam satu set nilai. Ia adalah punca kuasa dua varians dan dinyatakan dalam unit yang sama dengan data.
Istilah dan definisi statistik utama
Ukuran jumlah variasi atau serakan dalam satu set nilai. Ia adalah punca kuasa dua varians dan dinyatakan dalam unit yang sama dengan data.
Purata perbezaan kuasa dua dari min. Varians mengukur tahap serakan dalam set data dan merupakan kuasa dua sisihan piawai.
Purata aritmetik bagi satu set nilai, dikira dengan menjumlahkan semua nilai dan membahagi dengan bilangannya. Ia mewakili kecenderungan memusat data.
Nilai tengah dalam set data yang telah disusun. Jika terdapat bilangan genap nilai, median ialah purata dua nilai tengah. Ia tahan terhadap outlier.
Nilai yang paling kerap muncul dalam set data. Set data boleh mempunyai satu mod (unimod), berbilang mod (multimod), atau tiada mod langsung.
Perbezaan antara nilai terbesar dan terkecil dalam set data. Walaupun mudah dikira, ia hanya mempertimbangkan dua nilai ekstrem dan sensitif terhadap outlier.
Set lengkap semua individu atau pemerhatian yang menjadi minat dalam sesuatu kajian. Parameter populasi biasanya dilambangkan dengan huruf Yunani (μ, σ).
Subset populasi yang dipilih untuk analisis. Statistik sampel biasanya dilambangkan dengan huruf Latin (x̄, s) dan digunakan untuk menganggar parameter populasi.
Penggunaan n−1 dan bukannya n dalam penyebut apabila mengira varians sampel. Pembetulan ini memberikan anggaran tak pincang bagi varians populasi daripada sampel.
Taburan kebarangkalian simetri berbentuk loceng di mana min, median dan mod semuanya sama. Banyak fenomena semula jadi mengikuti taburan normal secara anggaran.
Untuk data bertaburan normal, kira-kira 68% nilai berada dalam ±1σ, 95% dalam ±2σ, dan 99.7% dalam ±3σ daripada min.
Bilangan sisihan piawai sesuatu titik data daripada min, dikira sebagai Z = (X − μ) / σ. Skor-Z membolehkan perbandingan nilai daripada taburan berbeza.
Sisihan piawai bagi taburan pensampelan sesuatu statistik, paling lazim min. SE = σ/√n, berkurangan apabila saiz sampel bertambah.
Julat nilai yang berkemungkinan mengandungi parameter populasi sebenar dengan tahap keyakinan tertentu (cth., 95%). Selang yang lebih lebar menunjukkan ketepatan yang kurang.
Titik data yang berbeza secara ketara daripada pemerhatian lain. Kaedah pengesanan lazim termasuk nilai melebihi ±2 atau ±3 sisihan piawai daripada min.
Nisbah sisihan piawai kepada min, dinyatakan sebagai peratusan (CV = σ/μ × 100%). Ia membolehkan perbandingan kebolehubahan antara set data dengan skala berbeza.
Ukuran asimetri bagi sesuatu taburan kebarangkalian. Kepencongan positif bermakna ekor memanjang ke kanan; kepencongan negatif bermakna ia memanjang ke kiri.
Ukuran ketebalan ekor sesuatu taburan kebarangkalian. Kurtosis tinggi menunjukkan ekor berat dan puncak tajam; kurtosis rendah menunjukkan ekor ringan dan puncak rata.
Bilangan nilai bebas yang boleh berubah dalam pengiraan statistik. Untuk sisihan piawai sampel, df = n − 1, mencerminkan pembetulan Bessel.
Menyatakan bahawa taburan pensampelan min sampel menghampiri taburan normal apabila saiz sampel bertambah, tanpa mengira taburan populasi.
Kaedah statistik untuk membuat keputusan berdasarkan data. Ia melibatkan perbandingan statistik ujian dengan nilai kritikal atau nilai-p untuk menentukan sama ada hipotesis nol perlu ditolak.
Kebarangkalian memerhati keputusan yang sama ekstrem dengan statistik ujian, dengan mengandaikan hipotesis nol adalah benar. Nilai-p yang lebih kecil memberikan bukti yang lebih kuat terhadap hipotesis nol.
Nilai antara −1 dan 1 yang mengukur kekuatan dan arah hubungan linear antara dua pemboleh ubah. Nilai hampir ±1 menunjukkan hubungan linear yang kuat.
Perbezaan antara persentil ke-75 (Q3) dan persentil ke-25 (Q1). IQR mengukur serakan 50% tengah data dan tahan terhadap outlier.
Nilai di mana peratusan tertentu pemerhatian berada di bawahnya. Contohnya, persentil ke-90 ialah nilai di mana 90% titik data berada di bawahnya.