İstatistik Sözlüğü
Temel istatistik terimleri ve tanımları
Standart Sapma (σ / s)
Bir değerler kümesindeki değişim veya dağılım miktarının bir ölçüsü. Varyansın kareköküdür ve verilerle aynı birimde ifade edilir.
Varyans (σ² / s²)
Ortalamadan kare farkların ortalaması. Varyans, bir veri setindeki yayılım derecesini ölçer ve standart sapmanın karesidir.
Ortalama (μ / x̄)
Bir değerler kümesinin aritmetik ortalaması, tüm değerlerin toplanıp sayıya bölünmesiyle hesaplanır. Verilerin merkezi eğilimini temsil eder.
Medyan
Sıralanmış bir veri setindeki orta değer. Çift sayıda değer varsa medyan, iki orta değerin ortalamasıdır. Aykırı değerlere karşı dirençlidir.
Mod
Bir veri setinde en sık görülen değer. Bir veri seti tek modlu (unimodal), çok modlu (multimodal) olabilir veya hiç modu olmayabilir.
Aralık
Bir veri setindeki en büyük ve en küçük değerler arasındaki fark. Hesaplaması basit olsa da yalnızca iki uç değeri dikkate alır ve aykırı değerlere duyarlıdır.
Anakütle
Bir çalışmada ilgilenilen tüm bireylerin veya gözlemlerin tam kümesi. Anakütle parametreleri genellikle Yunan harfleriyle (μ, σ) gösterilir.
Örneklem
Analiz için seçilen bir anakütlenin alt kümesi. Örneklem istatistikleri genellikle Latin harfleriyle (x̄, s) gösterilir ve anakütle parametrelerini tahmin etmek için kullanılır.
Bessel Düzeltmesi
Örneklem varyansı hesaplanırken paydada n yerine n−1 kullanılması. Bu düzeltme, bir örneklemden anakütle varyansının yansız bir tahminini sağlar.
Normal Dağılım
Ortalama, medyan ve modun tümünün eşit olduğu simetrik, çan şeklinde bir olasılık dağılımı. Birçok doğal olgu yaklaşık olarak normal dağılım gösterir.
Ampirik Kural (68-95-99,7)
Normal dağılıma sahip veriler için değerlerin yaklaşık %68'i ±1σ, %95'i ±2σ ve %99,7'si ±3σ içinde kalır.
Z-Skoru
Bir veri noktasının ortalamadan kaç standart sapma uzakta olduğu, Z = (X − μ) / σ olarak hesaplanır. Z-skorları, farklı dağılımlardaki değerlerin karşılaştırılmasına olanak tanır.
Standart Hata (SE)
Bir istatistiğin örnekleme dağılımının standart sapması, en yaygın olarak ortalamanın. SE = σ/√n, örneklem büyüklüğü arttıkça azalır.
Güven Aralığı
Belirli bir güven düzeyinde (örn. %95) gerçek anakütle parametresini içermesi muhtemel bir değer aralığı. Daha geniş aralıklar daha az hassasiyet gösterir.
Aykırı Değer
Diğer gözlemlerden önemli ölçüde farklı olan bir veri noktası. Yaygın tespit yöntemleri, ortalamadan ±2 veya ±3 standart sapma ötesindeki değerleri içerir.
Değişim Katsayısı (CV)
Standart sapmanın ortalamaya oranı, yüzde olarak ifade edilir (CV = σ/μ × 100%). Farklı ölçeklere sahip veri setleri arasında değişkenliğin karşılaştırılmasına olanak tanır.
Çarpıklık
Bir olasılık dağılımının asimetrisinin bir ölçüsü. Pozitif çarpıklık, kuyruğun sağa uzandığı; negatif çarpıklık, sola uzandığı anlamına gelir.
Basıklık
Bir olasılık dağılımının kuyruk ağırlığının bir ölçüsü. Yüksek basıklık, ağır kuyruklar ve keskin bir tepe; düşük basıklık, hafif kuyruklar ve düz bir tepe gösterir.
Serbestlik Derecesi (df)
İstatistiksel bir hesaplamada değişebilen bağımsız değerlerin sayısı. Örneklem standart sapması için df = n − 1 olup Bessel düzeltmesini yansıtır.
Merkezi Limit Teoremi
Örneklem ortalamasının örnekleme dağılımının, anakütlenin dağılımından bağımsız olarak, örneklem büyüklüğü arttıkça normal dağılıma yaklaştığını belirtir.
Hipotez Testi
Verilere dayalı karar verme için bir istatistiksel yöntem. Sıfır hipotezinin reddedilip reddedilmeyeceğini belirlemek için bir test istatistiğinin kritik değer veya p-değeri ile karşılaştırılmasını içerir.
P-Değeri
Sıfır hipotezinin doğru olduğu varsayılarak, test istatistiği kadar aşırı bir sonuç gözlemleme olasılığı. Daha küçük p-değerleri, sıfır hipotezine karşı daha güçlü kanıt sağlar.
Korelasyon Katsayısı (r)
İki değişken arasındaki doğrusal ilişkinin gücünü ve yönünü ölçen −1 ile 1 arasında bir değer. ±1'e yakın değerler güçlü bir doğrusal ilişkiyi gösterir.
Çeyrekler Arası Aralık (IQR)
75. yüzdelik dilim (Q3) ile 25. yüzdelik dilim (Q1) arasındaki fark. IQR, verilerin orta %50'sinin yayılımını ölçer ve aykırı değerlere karşı dirençlidir.
Yüzdelik Dilim
Gözlemlerin belirli bir yüzdesinin altında kaldığı değer. Örneğin, 90. yüzdelik dilim, veri noktalarının %90'ının altında bulunduğu değerdir.