Glosar statistic
Termeni și definiții statistice cheie
Abatere standard (σ / s)
O măsură a cantității de variație sau dispersie într-un set de valori. Este rădăcina pătrată a varianței și este exprimată în aceleași unități ca datele.
Varianță (σ² / s²)
Media pătratelor diferențelor față de medie. Varianța cuantifică gradul de dispersie într-un set de date și este pătratul abaterii standard.
Medie (μ / x̄)
Media aritmetică a unui set de valori, calculată prin însumarea tuturor valorilor și împărțirea la numărul lor. Reprezintă tendința centrală a datelor.
Mediană
Valoarea din mijloc într-un set de date ordonat. Dacă există un număr par de valori, mediana este media celor două valori din mijloc. Este rezistentă la valori aberante.
Mod
Valoarea care apare cel mai frecvent într-un set de date. Un set de date poate avea un singur mod (unimodal), mai multe moduri (multimodal) sau niciun mod.
Amplitudine
Diferența dintre cea mai mare și cea mai mică valoare dintr-un set de date. Deși simplă de calculat, ia în considerare doar cele două valori extreme și este sensibilă la valori aberante.
Populație
Setul complet al tuturor indivizilor sau observațiilor de interes într-un studiu. Parametrii populației sunt de obicei notați cu litere grecești (μ, σ).
Eșantion
Un subset al unei populații selectat pentru analiză. Statisticile eșantionului sunt de obicei notate cu litere latine (x̄, s) și sunt folosite pentru a estima parametrii populației.
Corecția lui Bessel
Utilizarea n−1 în loc de n la numitor când se calculează varianța eșantionului. Această corecție oferă o estimare nedeplasată a varianței populației din eșantion.
Distribuție normală
O distribuție de probabilitate simetrică, în formă de clopot, unde media, mediana și modul sunt toate egale. Multe fenomene naturale urmează aproximativ o distribuție normală.
Regula empirică (68-95-99,7)
Pentru date distribuite normal, aproximativ 68% din valori se află în intervalul ±1σ, 95% în ±2σ și 99,7% în ±3σ de la medie.
Scor Z
Numărul de abateri standard la care un punct de date se află de la medie, calculat ca Z = (X − μ) / σ. Scorurile Z permit compararea valorilor din distribuții diferite.
Eroare standard (SE)
Abaterea standard a distribuției de eșantionare a unei statistici, cel mai frecvent a mediei. SE = σ/√n, scăzând pe măsură ce dimensiunea eșantionului crește.
Interval de încredere
Un interval de valori care este probabil să conțină adevăratul parametru al populației cu un nivel specificat de încredere (de ex., 95%). Intervalele mai largi indică o precizie mai mică.
Valoare aberantă
Un punct de date semnificativ diferit de celelalte observații. Metodele comune de detectare includ valori dincolo de ±2 sau ±3 abateri standard de la medie.
Coeficient de variație (CV)
Raportul dintre abaterea standard și medie, exprimat ca procent (CV = σ/μ × 100%). Permite compararea variabilității între seturi de date cu scale diferite.
Asimetrie
O măsură a asimetriei unei distribuții de probabilitate. Asimetria pozitivă înseamnă că coada se extinde spre dreapta; asimetria negativă înseamnă că se extinde spre stânga.
Curtoză
O măsură a greutății cozilor unei distribuții de probabilitate. Curtoza ridicată indică cozi grele și un vârf ascuțit; curtoza scăzută indică cozi ușoare și un vârf plat.
Grade de libertate (df)
Numărul de valori independente care pot varia într-un calcul statistic. Pentru abaterea standard a eșantionului, df = n − 1, reflectând corecția lui Bessel.
Teorema limită centrală
Afirmă că distribuția de eșantionare a mediei eșantionului se apropie de o distribuție normală pe măsură ce dimensiunea eșantionului crește, indiferent de distribuția populației.
Testarea ipotezelor
O metodă statistică pentru luarea deciziilor pe baza datelor. Implică compararea unei statistici de test cu o valoare critică sau valoare-p pentru a determina dacă ipoteza nulă trebuie respinsă.
Valoare-P
Probabilitatea de a observa un rezultat la fel de extrem ca statistica de test, presupunând că ipoteza nulă este adevărată. Valorile-p mai mici oferă dovezi mai puternice împotriva ipotezei nule.
Coeficient de corelație (r)
O valoare între −1 și 1 care măsoară puterea și direcția relației liniare dintre două variabile. Valorile apropiate de ±1 indică o relație liniară puternică.
Amplitudine intercuartilă (IQR)
Diferența dintre percentila 75 (Q3) și percentila 25 (Q1). IQR măsoară dispersia celor 50% din mijloc ale datelor și este rezistentă la valori aberante.
Percentilă
O valoare sub care se află un anumit procent de observații. De exemplu, percentila 90 este valoarea sub care se află 90% din punctele de date.