Σ
SDCalc
PertengahanFundamentals·9 min

Sisihan Piawai vs Varians: Perbezaan Utama Diterangkan

Fahami perbezaan kritikal antara sisihan piawai dan varians. Ketahui bila perlu menggunakannya, formula terlibat, dan cara ia mempengaruhi analisis data anda.

By Standard Deviation Calculator Team · Data Science Team·Published

Apa itu Varians?

Varians (ditandakan sebagai σ² untuk populasi dan s² untuk sampel) ialah ukuran statistik bagi serakan antara nombor dalam satu set data. Ia mewakili purata perbezaan kuasa dua daripada Min (μ). Dengan mengkuasa-duakan sisihan, varians memastikan sisihan negatif dan positif tidak saling membatalkan, lalu memberikan ukuran serakan yang sebenar. Namun, disebabkan sisihan dikuasa-duakan, unit varians yang terhasil adalah kuasa dua daripada unit data asal, menjadikannya agak abstrak untuk ditafsir secara langsung.

Varians Populasi

σ² = Σ(xᵢ - μ)² / N

Unit Pengukuran

Jika data anda mewakili ketinggian dalam sentimeter, varians akan dinyatakan dalam sentimeter kuasa dua (cm²). Unit kuasa dua ini adalah salah satu sebab utama varians sukar ditafsir dalam konteks dunia sebenar.

Apa itu Sisihan Piawai?

Sisihan piawai (ditandakan sebagai σ untuk populasi dan s untuk sampel) ialah punca kuasa dua bagi varians. Ia mengukur jumlah purata sisihan titik data individu daripada min. Kerana ia diperoleh dengan mengambil punca kuasa dua varians, sisihan piawai dinyatakan dalam unit yang sama dengan data asal, menjadikannya lebih intuitif dan mudah ditafsir untuk aplikasi dunia sebenar. Ia adalah ukuran serakan statistik yang paling meluas digunakan.

Sisihan Piawai Populasi

σ = √(Σ(xᵢ - μ)² / N)

Sisihan Piawai vs Varians: Perbezaan Teras

Walaupun kedua-dua metrik ini mengukur serakan titik data sekitar min, hubungan matematik dan kegunaan praktikalnya berbeza secara ketara. Perbezaan asasnya terletak pada unit dan kebolehtafsirannya. Sisihan piawai ialah punca kuasa dua varians, yang mengembalikan ukuran serakan kepada unit asal data. Varians pula, sebagai nilai kuasa dua, memberi pemberat yang tidak seimbang kepada pencilan, menjadikannya sangat sensitif terhadap nilai ekstrem.

CiriVarians (σ² / s²)Sisihan Piawai (σ / s)
Asas MatematikPurata sisihan kuasa duaPunca kuasa dua varians
UnitUnit kuasa dua (cth., cm², RM²)Unit asal (cth., cm, RM)
KebolehtafsiranAbstrak; sukar dikaitkan dengan dataIntuitif; berkait terus dengan data
Sensitiviti terhadap PencilanTinggi (kerana penguasa-duaan)Sederhana (punca kuasa dua mengurangkan kesan)
Kegunaan UtamaInferens statistik, ANOVA, Teori portfolioStatistik deskriptif, Pelaporan, Peraturan empirikal

Formula Populasi vs Sampel

Semasa mengira metrik ini, anda mesti membezakan antara populasi dan sampel. Populasi merangkumi semua ahli dalam kumpulan yang ditetapkan, manakala sampel adalah subset daripada populasi tersebut. Penggunaan formula sampel dengan penyebut (n - 1)—dikenali sebagai pembetulan Bessel—membetulkan bias yang wujud semasa menganggar varians populasi daripada sampel, memastikan penganggar tersebut tidak berat sebelah.

Varians Sampel

s² = Σ(xᵢ - x̄)² / (n - 1)

Elakkan Kesilapan n vs n-1

Menggunakan 'n' dan bukannya '(n - 1)' untuk varians sampel akan menganggar varians populasi sebenar secara sistematik. Sentiasa gunakan darjah kebebasan (df = n - 1) apabila bekerja dengan data sampel untuk membuat inferens parameter populasi.

Bila Guna Varians vs Sisihan Piawai

Pemilihan antara varians dan sisihan piawai bergantung sepenuhnya pada matlamat analisis anda. Jika anda ingin menyampaikan serakan data kepada audiens bukan teknikal, sisihan piawai adalah pilihan yang lebih tepat kerana ia selari dengan unit semula jadi data. Walau bagaimanapun, jika anda melakukan pengiraan statistik perantaraan—seperti mengira statistik-F dalam ANOVA, menilai risiko dalam teori portfolio moden, atau menjalankan ujian hipotesis—varians lebih mudah dari segi matematik.

Guna Varians Apabila...

- Melakukan ANOVA atau ujian-F - Mengira risiko portfolio (matriks kovarians) - Menjalankan pembuktian statistik teori - Membangunkan fungsi kerugian pembelajaran mesin (cth., MSE)

Guna Sisihan Piawai Apabila...

- Melaporkan serakan data dalam penerbitan - Menggunakan Peraturan Empirikal (68-95-99.7) - Membina carta kawalan untuk jaminan kualiti - Menyampaikan kebolehubahan kepada pihak bukan teknikal

Pengiraan SD dan Varians dalam Python

Modul `statistics` dalam Python menyediakan fungsi terbina dalam untuk kedua-dua varians dan sisihan piawai. Apabila menggunakan fungsi ini, adalah penting untuk memilih kaedah yang betul berdasarkan sama ada data anda mewakili populasi atau sampel.

python
import statistics

# Sample dataset
data = [14, 18, 12, 15, 11]

# Calculate Sample Variance and SD
sample_var = statistics.variance(data)
sample_sd = statistics.stdev(data)

# Calculate Population Variance and SD
pop_var = statistics.pvariance(data)
pop_sd = statistics.pstdev(data)

print(f"Sample Variance: {sample_var:.2f}")
print(f"Sample SD: {sample_sd:.2f}")
print(f"Population Variance: {pop_var:.2f}")
print(f"Population SD: {pop_sd:.2f}")

Soalan Lazim

  • Bolehkah varians menjadi negatif? Tidak, kerana jumlah sisihan kuasa dua (xᵢ - μ)² sentiasa sifar atau positif, varians tidak akan pernah menjadi negatif.
  • Mengapa sisihan piawai lebih digemari berbanding varians untuk pelaporan? Sisihan piawai lebih digemari kerana ia berkongsi unit yang sama dengan min, menjadikannya lebih mudah untuk dikontekstualisasikan dan ditafsir bersama data mentah.
  • Adakah varians sama dengan ralat min kuasa dua (MSE)? Kedua-duanya serupa, tetapi MSE biasanya mengukur perbezaan kuasa dua purata antara nilai anggaran dan nilai sebenar, manakala varians mengukur serakan sekitar min. Jika penganggar itu adalah min, maka MSE sama dengan varians.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Sisihan piawai - Wikipedia
  2. Buku Panduan e-NIST/SEMATECH untuk Kaedah Statistik