Standart Sapma Nedir?
Standart sapma, bir veri setindeki değerlerin değişimini veya dağılımını ölçen istatistiksel bir göstergedir. Düşük bir standart sapma, veri noktalarının setin ortalamasına (beklenen değere) yakın olduğunu; yüksek bir standart sapma ise veri noktalarının çok daha geniş bir değer aralığına yayıldığını gösterir. Yığınlar (popülasyon) için Yunan harfi σ (sigma), örneklemler için ise s ile temsil edilen standart sapma, betimsel istatistiğin en temel kavramlarından biridir.
Temel Tanım
Yığın (Popülasyon) ve Örneklem Standart Sapması
Standart sapmayı hesaplamadan önce, verilerinizin bir yığını (popülasyonu) mı yoksa bir yığının örneklemi mi temsil ettiğini belirlemelisiniz. Yığın belirli bir grubun tüm üyelerini içerirken, örneklem o grubu temsil eden bir alt kümesidir. Örneklem için standart sapma hesaplanırken, sonucun yığın varyansının yansız bir tahmini olmasını sağlamak için matematiksel bir düzeltme yapılması—N yerine n - 1 (serbestlik derecesi veya df) kullanılması—gerekir.
Yığın (Popülasyon) Standart Sapması
Örneklem Standart Sapması
Standart Sapma Formülünün Açıklaması
Standart sapma formülleri, öncelikle varyansın hesaplanmasına ve ardından karekökünün alınmasına dayanır. Bu karekök adımı çok önemlidir çünkü yayılma ölçüsünü verinin orijinal birimlerine geri döndürür. Temel bileşenler xᵢ (her bir değer), μ veya x̄ (yığın veya örneklem ortalaması) ve N veya n'dir (toplam değer sayısı).
Yığın Standart Sapması
Örneklem Standart Sapması
Adım Adım Hesaplama Örneği
Şimdi küçük bir sınav puanları veri seti için örneklem standart sapmasını hesaplayalım: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Formülü adım adım takip etmek, son karekökü almadan önce varyansın nasıl biriktiğini gösterir.
Ortalamayı Hesaplayın (x̄)
Ortalamayı Çıkarın ve Sonucun Karesini Alın
Karesel Farkları Toplayın
n - 1'e Bölün (Serbestlik Derecesi)
Karekökünü Alın
Python ile Standart Sapma Hesaplama
Standart sapmayı manuel olarak hesaplamak, özellikle büyük veri setlerinde hata yapmaya çok müsaittir. Uygulamada istatistikçiler ve veri bilimciler, yerleşik kütüphaneler kullanarak bu hesaplamayı anında yapmak için Python gibi programlama dillerinden faydalanır.
import statistics
data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]
# Örneklem standart sapmasını hesapla (varsayılan)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")
# Yığın (popülasyon) standart sapmasını hesapla
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")Ampirik Kural ve Standart Sapma
Veriler normal dağılım (çan eğrisi) gösterdiğinde, standart sapma inanılmaz derecede tahmin edici bir hale gelir. 68-95-99.7 kuralı olarak da bilinen Ampirik Kural, verilerin neredeyse tamamının ortalamadan üç standart sapma içinde kalacağını belirtir. Bu sayede analistler aykırı değerleri hızlıca tespit edebilir ve belirli bir gözlemin gerçekleşme olasılığını anlayabilir.
| Ortalamadan Mesafe | Verinin Yüzdesi | Kullanım Alanı |
|---|---|---|
| ±1σ | 68.27% | Tipik, günlük değerleri belirleme |
| ±2σ | 95.45% | Güven aralıkları oluşturma |
| ±3σ | 99.73% | Aşırı aykırı değerleri tespit etme |
Standart Sapma ve Varyans Farkı
Varyans ve standart sapma, birbiriyle yakından ilişkili yayılma ölçüleridir. Varyans (σ² veya s²), ortalamadan olan karesel farkların ortalamasıyken, standart sapma bu varyansın kareköküdür. Varyans karesel birimlerle (örneğin TL², cm²) ifade edildiğinden, orijinal veri bağlamında yorumlanması zor olabilir. Standart sapma, ölçüyü orijinal birimlere geri dönüştürerek bu sorunu çözer.
Verinizi Raporlarken
Dikkat Edilmesi Gereken Yaygın Hatalar
Standart sapma güçlü bir araç olsa da, sıklıkla yanlış kullanılmaktadır. Formüllerin yanlış uygulanması veya değerin neyi temsil ettiğinin yanlış anlaşılması, hatalı veri analizine ve yanlış sonuçlara yol açabilir.
- Örneklem için yığın formülünü kullanmak: Örneklemlerde n - 1 kullanmayı unutmak, hesaplanan yayılmayı yapay olarak düşürür ve gerçek yığın varyansını olduğundan az tahmin etmenize neden olur.
- SD'yi normal olmayan dağılımlara uygulamak: Ampirik Kural yalnızca normal dağılımlar için geçerlidir. Çarpık veriler için SD, yayılmayı doğru yansıtmayabilir.
- SD ile Standart Hatayı Karıştırmak: Standart hata, bir örneklem ortalaması tahmininin hassasiyetini ölçerken, standart sapma temel verinin kendi yayılmasını ölçer.
Aykırı Değerlere Dikkat Edin
Further Reading
Sources
References and further authoritative reading used in preparing this article.