Apakah Sisihan Piawai?
Sisihan piawai ialah ukuran statistik yang mengukur jumlah variasi atau serakan dalam satu set nilai data. Sisihan piawai yang rendah menunjukkan bahawa titik data cenderung berada berhampiran min (nilai jangkaan) set tersebut, manakala sisihan piawai yang tinggi menunjukkan titik data tersebar dalam julat nilai yang lebih luas. Diwakili oleh huruf Yunani σ (sigma) untuk populasi dan s untuk sampel, ia merupakan salah satu konsep paling asas dalam statistik deskriptif.
Definisi Teras
Sisihan Piawai Populasi vs. Sampel
Sebelum mengira sisihan piawai, anda mesti menentukan sama ada data anda mewakili seluruh populasi atau sampel daripada populasi. Populasi merangkumi semua ahli dalam kumpulan tertentu, manakala sampel ialah subset perwakilan kumpulan tersebut. Pengiraan sisihan piawai untuk sampel memerlukan pelarasan matematik—iaitu menggunakan n - 1 (darjah kebebasan, atau df) berbanding N—untuk memastikan hasilnya adalah penganggar tidak bias bagi varians populasi.
Sisihan Piawai Populasi
Sisihan Piawai Sampel
Penerangan Formula Sisihan Piawai
Formula sisihan piawai bergantung pada pengiraan varians terlebih dahulu, kemudian mengambil punca kuasa dua. Langkah punca kuasa dua ini penting kerana ia mengembalikan ukuran serakan ke dalam unit asal data. Komponen utamanya ialah xᵢ (setiap nilai individu), μ atau x̄ (min populasi atau sampel), dan N atau n (jumlah nilai).
SP Populasi
SP Sampel
Contoh Pengiraan Langkah demi Langkah
Mari kita kira sisihan piawai sampel untuk set data kecil markah ujian: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Mengikut formula langkah demi langkah akan menunjukkan bagaimana varians terkumpul sebelum kita mengambil punca kuasa dua terakhir.
Kira Min (x̄)
Tolak Min dan Kuasa Dua Hasilnya
Jumlahkan Perbezaan Kuasa Dua
Bahagi dengan n - 1 (Darjah Kebebasan)
Ambil Punca Kuasa Dua
Mengira Sisihan Piawai dalam Python
Mengira sisihan piawai secara manual mudah tersilap, terutamanya dengan set data yang besar. Dalam amalan, ahli statistik dan saintis data menggunakan bahasa pengaturcaraan seperti Python untuk mengiranya serta-merta menggunakan pustaka terbina dalam.
import statistics
data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]
# Kira sisihan piawai sampel (lalai)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")
# Kira sisihan piawai populasi
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")Peraturan Empirik dan Sisihan Piawai
Apabila data mengikut taburan normal (lengkok loceng), sisihan piawai menjadi sangat prediktif. Peraturan Empirik, juga dikenali sebagai peraturan 68-95-99.7, menyatakan bahawa hampir semua data akan berada dalam tiga sisihan piawai daripada min. Ini membolehkan penganalisis mengenal pasti pencilan dengan cepat dan memahami kebarangkalian berlakunya pemerhatian tertentu.
| Selang dari Min | Peratusan Data | Aplikasi |
|---|---|---|
| ±1σ | 68.27% | Mengenal pasti nilai biasa harian |
| ±2σ | 95.45% | Menetapkan selang keyakinan |
| ±3σ | 99.73% | Mengesan pencilan melampau |
Sisihan Piawai vs. Varians
Varians dan sisihan piawai adalah ukuran serakan yang berkait rapat. Varians (σ² atau s²) ialah purata perbezaan kuasa dua daripada Min, manakala sisihan piawai ialah punca kuasa dua bagi varians. Oleh kerana varians dinyatakan dalam unit kuasa dua (cth., ringgit persegi, sentimeter persegi), ia sukar ditafsir dalam konteks data asal. Sisihan piawai menyelesaikan masalah ini dengan menukar ukuran kembali ke unit asal.
Melaporkan Data Anda
Kesilapan Bias yang Perlu Dielakkan
Walaupun sisihan piawai adalah alat yang berkuasa, ia sering disalah guna. Penggunaan formula yang salah atau salah faham tentang apa yang diwakili oleh nilai tersebut boleh membawa kepada analisis data yang cacat dan kesimpulan yang salah.
- Menggunakan formula populasi untuk sampel: Lupa menggunakan n - 1 untuk sampel akan menurunkan serakan yang dikira secara buatan, menyebabkan anggaran varians populasi sebenar terlalu rendah.
- Menggunakan SP untuk taburan bukan normal: Peraturan Empirik hanya terpakai untuk taburan normal. Bagi data yang sangat pencong, SP mungkin tidak mencerminkan serakan dengan tepat.
- Mengelirukan SP dengan Ralat Piawai: Ralat piawai mengukur ketepatan anggaran min sampel, manakala sisihan piawai mengukur serakan data asal itu sendiri.
Awas Pencilan
Further Reading
Sources
References and further authoritative reading used in preparing this article.