Σ
SDCalc
BaşlangıçFundamentals·9 min

Standart Sapma Nedir? Detaylı Tanımı, Formülü ve Örneklerle Açıklama

Standart sapmanın ne olduğunu, örneklem ve yığın için nasıl hesaplanacağını ve veri analizi için neden kritik olduğunu öğrenin. Formülleri hemen keşfedin.

By Standard Deviation Calculator Team · Data Science Team·Published

Standart Sapma Nedir?

Standart sapma, bir veri setindeki değerlerin değişimini veya dağılımını ölçen istatistiksel bir göstergedir. Düşük bir standart sapma, veri noktalarının setin ortalamasına (beklenen değere) yakın olduğunu; yüksek bir standart sapma ise veri noktalarının çok daha geniş bir değer aralığına yayıldığını gösterir. Yığınlar (popülasyon) için Yunan harfi σ (sigma), örneklemler için ise s ile temsil edilen standart sapma, betimsel istatistiğin en temel kavramlarından biridir.

Temel Tanım

Standart sapma, her bir veri noktasının ortalamaya olan tipik uzaklığını ölçer. Verilerinizin ortalama olarak merkezden ne kadar saptığını size söyler.

Yığın (Popülasyon) ve Örneklem Standart Sapması

Standart sapmayı hesaplamadan önce, verilerinizin bir yığını (popülasyonu) mı yoksa bir yığının örneklemi mi temsil ettiğini belirlemelisiniz. Yığın belirli bir grubun tüm üyelerini içerirken, örneklem o grubu temsil eden bir alt kümesidir. Örneklem için standart sapma hesaplanırken, sonucun yığın varyansının yansız bir tahmini olmasını sağlamak için matematiksel bir düzeltme yapılması—N yerine n - 1 (serbestlik derecesi veya df) kullanılması—gerekir.

Yığın (Popülasyon) Standart Sapması

Tüm gruba ait verileriniz olduğunda kullanılır. σ ile gösterilir. Varyans formülündeki payda N'dir (toplam yığın büyüklüğü).

Örneklem Standart Sapması

Grubun yalnızca bir alt kümesine ait verileriniz olduğunda kullanılır. s ile gösterilir. Yanlılığı düzeltmek için varyans formülündeki payda n - 1'dir (örneklem büyüklüğü eksi bir).

Standart Sapma Formülünün Açıklaması

Standart sapma formülleri, öncelikle varyansın hesaplanmasına ve ardından karekökünün alınmasına dayanır. Bu karekök adımı çok önemlidir çünkü yayılma ölçüsünü verinin orijinal birimlerine geri döndürür. Temel bileşenler xᵢ (her bir değer), μ veya (yığın veya örneklem ortalaması) ve N veya n'dir (toplam değer sayısı).

Yığın Standart Sapması

σ = √[ Σ(xᵢ - μ)² / N ]

Örneklem Standart Sapması

s = √[ Σ(xᵢ - x̄)² / (n - 1) ]

Adım Adım Hesaplama Örneği

Şimdi küçük bir sınav puanları veri seti için örneklem standart sapmasını hesaplayalım: [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]. Formülü adım adım takip etmek, son karekökü almadan önce varyansın nasıl biriktiğini gösterir.

1

Ortalamayı Hesaplayın (x̄)

Tüm değerleri toplayın ve sayıya bölün: (4+8+6+5+3+2+8+9+2+5) / 10 = 52 / 10 = 5.2
2

Ortalamayı Çıkarın ve Sonucun Karesini Alın

Her bir değer için karesel farkı bulun: (4-5.2)² = 1.44, (8-5.2)² = 7.84, (6-5.2)² = 0.64, vb.
3

Karesel Farkları Toplayın

Tüm karesel sonuçları birbirine ekleyin: 1.44 + 7.84 + 0.64 + 0.04 + 4.84 + 10.24 + 7.84 + 14.44 + 10.24 + 0.04 = 57.6
4

n - 1'e Bölün (Serbestlik Derecesi)

Toplamı örneklem büyüklüğü eksi bire bölün: 57.6 / (10 - 1) = 57.6 / 9 = 6.4. Bu, örneklem varyansıdır (σ²).
5

Karekökünü Alın

Varyansın karekökünü bulun: √6.4 ≈ 2.53. Örneklem standart sapması 2.53'tür.

Python ile Standart Sapma Hesaplama

Standart sapmayı manuel olarak hesaplamak, özellikle büyük veri setlerinde hata yapmaya çok müsaittir. Uygulamada istatistikçiler ve veri bilimciler, yerleşik kütüphaneler kullanarak bu hesaplamayı anında yapmak için Python gibi programlama dillerinden faydalanır.

python
import statistics

data = [4, 8, 6, 5, 3, 2, 8, 9, 2, 5]

# Örneklem standart sapmasını hesapla (varsayılan)
sample_sd = statistics.stdev(data)
print(f"Sample SD: {sample_sd:.2f}")

# Yığın (popülasyon) standart sapmasını hesapla
pop_sd = statistics.pstdev(data)
print(f"Population SD: {pop_sd:.2f}")

Ampirik Kural ve Standart Sapma

Veriler normal dağılım (çan eğrisi) gösterdiğinde, standart sapma inanılmaz derecede tahmin edici bir hale gelir. 68-95-99.7 kuralı olarak da bilinen Ampirik Kural, verilerin neredeyse tamamının ortalamadan üç standart sapma içinde kalacağını belirtir. Bu sayede analistler aykırı değerleri hızlıca tespit edebilir ve belirli bir gözlemin gerçekleşme olasılığını anlayabilir.

Ortalamadan MesafeVerinin YüzdesiKullanım Alanı
±1σ68.27%Tipik, günlük değerleri belirleme
±2σ95.45%Güven aralıkları oluşturma
±3σ99.73%Aşırı aykırı değerleri tespit etme

Standart Sapma ve Varyans Farkı

Varyans ve standart sapma, birbiriyle yakından ilişkili yayılma ölçüleridir. Varyans (σ² veya s²), ortalamadan olan karesel farkların ortalamasıyken, standart sapma bu varyansın kareköküdür. Varyans karesel birimlerle (örneğin TL², cm²) ifade edildiğinden, orijinal veri bağlamında yorumlanması zor olabilir. Standart sapma, ölçüyü orijinal birimlere geri dönüştürerek bu sorunu çözer.

Verinizi Raporlarken

Verinizi tanımlarken her zaman ortalamanın yanında standart sapmayı da raporlayın. SS, ortalama ile aynı birimlerde olduğundan (örneğin TL, cm, kilogram), hedef kitlenizin hemen anlayabileceği sezgisel bir yayılma ölçüsü sunar.

Dikkat Edilmesi Gereken Yaygın Hatalar

Standart sapma güçlü bir araç olsa da, sıklıkla yanlış kullanılmaktadır. Formüllerin yanlış uygulanması veya değerin neyi temsil ettiğinin yanlış anlaşılması, hatalı veri analizine ve yanlış sonuçlara yol açabilir.

  • Örneklem için yığın formülünü kullanmak: Örneklemlerde n - 1 kullanmayı unutmak, hesaplanan yayılmayı yapay olarak düşürür ve gerçek yığın varyansını olduğundan az tahmin etmenize neden olur.
  • SD'yi normal olmayan dağılımlara uygulamak: Ampirik Kural yalnızca normal dağılımlar için geçerlidir. Çarpık veriler için SD, yayılmayı doğru yansıtmayabilir.
  • SD ile Standart Hatayı Karıştırmak: Standart hata, bir örneklem ortalaması tahmininin hassasiyetini ölçerken, standart sapma temel verinin kendi yayılmasını ölçer.

Aykırı Değerlere Dikkat Edin

Standart sapma aşırı aykırı değerlere karşı son derece hassastır. Formül, ortalamadan olan farkların karesini aldığından, tek bir devasa aykırı değer standart sapmayı orantısız bir şekilde şişirerek verinin olduğundan daha değişken görünmesine neden olabilir.

Further Reading

Sources

References and further authoritative reading used in preparing this article.

  1. Vikipedi: Standart Sapma
  2. NIST/SEMATECH İstatistiksel Yöntemler e-Kitabı
  3. Khan Academy: İstatistik ve Olasılık