Σ
SDCalc
PermulaanFundamentals·9 min

Apakah Sisihan Piawai? Definisi, Formula & Contoh

Ketahui apakah sisihan piawai, cara menghitungnya untuk sampel dan populasi, serta kenapa ia penting dalam analisis data. Kuasai formulanya sekarang.

By Standard Deviation Calculator Team · Data Science Team·Published

Apakah Sisihan Piawai?

Sisihan piawai ialah ukuran statistik yang mengukur jumlah variasi atau serakan dalam satu set nilai data. Sisihan piawai yang rendah menunjukkan bahawa titik data cenderung berada berhampiran min (nilai jangkaan) set tersebut, manakala sisihan piawai yang tinggi menunjukkan titik data tersebar dalam julat nilai yang lebih luas. Diwakili oleh huruf Yunani σ (sigma) untuk populasi dan s untuk sampel, ia merupakan salah satu konsep paling asas dalam statistik deskriptif.

Definisi Teras

Sisihan piawai mengukur jarak tipikal setiap titik data dari min. Ia memberitahu anda, secara purata, berapa banyak data anda menyimpang dari pusat.

Sisihan Piawai Populasi vs. Sampel

Sebelum mengira sisihan piawai, anda mesti menentukan sama ada data anda mewakili seluruh populasi atau sampel daripada populasi. Populasi merangkumi semua ahli dalam kumpulan tertentu, manakala sampel ialah subset perwakilan kumpulan tersebut. Pengiraan sisihan piawai untuk sampel memerlukan pelarasan matematik—iaitu menggunakan n - 1 (darjah kebebasan, atau df) berbanding N—untuk memastikan hasilnya adalah penganggar tidak bias bagi varians populasi.

Sisihan Piawai Populasi

Digunakan apabila anda mempunyai data untuk keseluruhan kumpulan. Dilambangkan dengan σ. Penyebut dalam formula varians ialah N (saiz jumlah populasi).

Sisihan Piawai Sampel

Digunakan apabila anda mempunyai subset kumpulan tersebut. Dilambangkan dengan s. Penyebut dalam formula varians ialah n - 1 (saiz sampel tolak satu) untuk membetulkan bias.

Penerangan Formula Sisihan Piawai

Formula sisihan piawai bergantung pada pengiraan varians terlebih dahulu, kemudian mengambil punca kuasa dua. Langkah punca kuasa dua ini penting kerana ia mengembalikan ukuran serakan ke dalam unit asal data. Komponen utamanya ialah xᵢ (setiap nilai individu), μ atau (min populasi atau sampel), dan N atau n (jumlah nilai).

SP Populasi

σ = √[ Σ(xᵢ - μ)² / N ]

SP Sampel

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Contoh Pengiraan Langkah demi Langkah

Mari kita kira sisihan piawai sampel untuk set data kecil markah ujian: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Mengikut formula langkah demi langkah akan menunjukkan bagaimana varians terkumpul sebelum kita mengambil punca kuasa dua terakhir.

1

Kira Min (x̄)

Jumlahkan semua nilai dan bahagi dengan bilangan: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

Tolak Min dan Kuasa Dua Hasilnya

Untuk setiap nilai, cari perbezaan kuasa dua: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, dan sebagainya.
3

Jumlahkan Perbezaan Kuasa Dua

Campurkan semua hasil kuasa dua: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

Bahagi dengan n - 1 (Darjah Kebebasan)

Bahagi jumlah dengan saiz sampel tolak satu: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Ini adalah varians sampel (σ²).
5

Ambil Punca Kuasa Dua

Cari punca kuasa dua bagi varians: √6.4 ≈ 2.53. Sisihan piawai sampel ialah 2.53.

Mengira Sisihan Piawai dalam Python

Mengira sisihan piawai secara manual mudah tersilap, terutamanya dengan set data yang besar. Dalam amalan, ahli statistik dan saintis data menggunakan bahasa pengaturcaraan seperti Python untuk mengiranya serta-merta menggunakan pustaka terbina dalam.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Kira sisihan piawai sampel (lalai)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Kira sisihan piawai populasi
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

Peraturan Empirik dan Sisihan Piawai

Apabila data mengikut taburan normal (lengkok loceng), sisihan piawai menjadi sangat prediktif. Peraturan Empirik, juga dikenali sebagai peraturan 68-95-99.7, menyatakan bahawa hampir semua data akan berada dalam tiga sisihan piawai daripada min. Ini membolehkan penganalisis mengenal pasti pencilan dengan cepat dan memahami kebarangkalian berlakunya pemerhatian tertentu.

Selang dari MinPeratusan DataAplikasi
±1σ68.27%Mengenal pasti nilai biasa harian
±2σ95.45%Menetapkan selang keyakinan
±3σ99.73%Mengesan pencilan melampau

Sisihan Piawai vs. Varians

Varians dan sisihan piawai adalah ukuran serakan yang berkait rapat. Varians (σ² atau s²) ialah purata perbezaan kuasa dua daripada Min, manakala sisihan piawai ialah punca kuasa dua bagi varians. Oleh kerana varians dinyatakan dalam unit kuasa dua (cth., ringgit persegi, sentimeter persegi), ia sukar ditafsir dalam konteks data asal. Sisihan piawai menyelesaikan masalah ini dengan menukar ukuran kembali ke unit asal.

Melaporkan Data Anda

Sentiasa laporkan sisihan piawai bersama min apabila menerangkan data anda. Oleh kerana SP berada dalam unit yang sama dengan min (cth., ringgit, sentimeter, kilogram), ia menyediakan ukuran serakan yang intuitif yang boleh difahami terus oleh khalayak anda.

Kesilapan Bias yang Perlu Dielakkan

Walaupun sisihan piawai adalah alat yang berkuasa, ia sering disalah guna. Penggunaan formula yang salah atau salah faham tentang apa yang diwakili oleh nilai tersebut boleh membawa kepada analisis data yang cacat dan kesimpulan yang salah.

  • Menggunakan formula populasi untuk sampel: Lupa menggunakan n - 1 untuk sampel akan menurunkan serakan yang dikira secara buatan, menyebabkan anggaran varians populasi sebenar terlalu rendah.
  • Menggunakan SP untuk taburan bukan normal: Peraturan Empirik hanya terpakai untuk taburan normal. Bagi data yang sangat pencong, SP mungkin tidak mencerminkan serakan dengan tepat.
  • Mengelirukan SP dengan Ralat Piawai: Ralat piawai mengukur ketepatan anggaran min sampel, manakala sisihan piawai mengukur serakan data asal itu sendiri.

Awas Pencilan

Sisihan piawai sangat sensitif terhadap pencilan melampau. Oleh kerana formula ini mengkuasa-duakan perbezaan daripada min, satu pencilan besar sahaja boleh meningkatkan sisihan piawai secara tidak seimbang, menjadikan data kelihatan lebih berubah-ubah daripada sebenarnya.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Wikipedia: Sisihan Piawai
  2. Buku Panduan Elektronik Kaedah Statistik NIST/SEMATECH
  3. Khan Academy: Statistik dan Kebarangkalian