Σ
SDCalc
ŚredniozaawansowanySamouczki·15 min

Obliczanie odchylenia standardowego w Excelu i Pythonie

Samouczki krok po kroku dotyczące obliczania odchylenia standardowego w Excelu (STDEV.S, STDEV.P) oraz Pythonie (numpy, pandas, statistics). Z przykładami kodu.

Excel: Przegląd

Microsoft Excel udostępnia wbudowane funkcje do obliczania odchylenia standardowego zarówno próbkowego, jak i populacyjnego. Funkcje te są dostępne we wszystkich nowoczesnych wersjach Excela.

Funkcje Excela

FunkcjaTypOpis
`STDEV.S()`PróbkaOdchylenie standardowe próbki (dzieli przez n-1)
`STDEV.P()`PopulacjaOdchylenie standardowe populacji (dzieli przez N)
`STDEV()`PróbkaStarsza funkcja, identyczna z STDEV.S
`STDEVP()`PopulacjaStarsza funkcja, identyczna z STDEV.P

Przykłady w Excelu

Excel Formulas
// Data in cells A1:A10
=STDEV.S(A1:A10)     // Sample SD
=STDEV.P(A1:A10)     // Population SD

// For specific values
=STDEV.S(4, 8, 6, 5, 3)    // Returns 1.924

// Ignoring text and logical values
=STDEV.S(A1:A10)    // Ignores text
=STDEVA(A1:A10)     // Includes text as 0

Wskazówka

Używaj STDEV.S do większości analiz z życia. Stosuj STDEV.P tylko wtedy, gdy masz pewność, że posiadasz pełną populację.

Python: Przegląd

Python oferuje wiele sposobów obliczania odchylenia standardowego. Najczęściej używane biblioteki to NumPy, Pandas oraz wbudowany moduł statistics.

Użycie NumPy

Python (NumPy)
import numpy as np

data = [4, 8, 6, 5, 3]

# Population standard deviation (default)
pop_sd = np.std(data)
print(f"Population SD: {pop_sd}")  # 1.720

# Sample standard deviation
sample_sd = np.std(data, ddof=1)
print(f"Sample SD: {sample_sd}")  # 1.924

Czym jest ddof?

ddof oznacza “Delta Degrees of Freedom” (zmiana stopni swobody). Ustawienie ddof=1 nakazuje NumPy dzielić przez (n-1) dla odchylenia próbkowego. Domyślna wartość ddof=0 daje odchylenie populacyjne.

Użycie Pandas

Python (Pandas)
import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'scores': [85, 90, 78, 92, 88]})

# Sample SD (default in pandas)
sample_sd = df['scores'].std()
print(f"Sample SD: {sample_sd}")

# Population SD
pop_sd = df['scores'].std(ddof=0)
print(f"Population SD: {pop_sd}")

# Multiple columns at once
df.std()  # Returns SD for all numeric columns

Szybkie porównanie

NarzędzieOdchylenie próbkiOdchylenie populacji
Excel`STDEV.S()``STDEV.P()`
NumPy`np.std(data, ddof=1)``np.std(data)`
Pandas`df.std()``df.std(ddof=0)`
Python statistics`stdev()``pstdev()`