Σ
SDCalc
СереднійПосібники·15 min

Обчислення стандартного відхилення в Excel та Python

Покрокові посібники з обчислення стандартного відхилення в Excel (STDEV.S, STDEV.P) та Python (numpy, pandas, statistics). З прикладами коду.

Excel: Огляд

Microsoft Excel надає вбудовані функції для обчислення як вибіркового, так і генерального стандартного відхилення. Ці функції доступні в усіх сучасних версіях Excel.

Функції Excel

ФункціяТипОпис
`STDEV.S()`ВибірковеВибіркове стандартне відхилення (ділить на n-1)
`STDEV.P()`ГенеральнеГенеральне стандартне відхилення (ділить на N)
`STDEV()`ВибірковеЗастаріла функція, аналогічна STDEV.S
`STDEVP()`ГенеральнеЗастаріла функція, аналогічна STDEV.P

Приклади Excel

Excel Formulas
// Data in cells A1:A10
=STDEV.S(A1:A10)     // Sample SD
=STDEV.P(A1:A10)     // Population SD

// For specific values
=STDEV.S(4, 8, 6, 5, 3)    // Returns 1.924

// Ignoring text and logical values
=STDEV.S(A1:A10)    // Ignores text
=STDEVA(A1:A10)     // Includes text as 0

Порада

Використовуйте STDEV.S для більшості реальних аналізів. Використовуйте STDEV.P лише тоді, коли ви впевнені, що маєте повну генеральну сукупність.

Python: Огляд

Python пропонує кілька способів обчислення стандартного відхилення. Найпоширеніші бібліотеки — NumPy, Pandas та вбудований модуль statistics.

Використання NumPy

Python (NumPy)
import numpy as np

data = [4, 8, 6, 5, 3]

# Population standard deviation (default)
pop_sd = np.std(data)
print(f"Population SD: {pop_sd}")  # 1.720

# Sample standard deviation
sample_sd = np.std(data, ddof=1)
print(f"Sample SD: {sample_sd}")  # 1.924

Що таке ddof?

ddof означає “Delta Degrees of Freedom” (зміна ступенів свободи). Встановлення ddof=1 вказує NumPy ділити на (n-1) для вибіркового СВ. За замовчуванням ddof=0 дає генеральне СВ.

Використання Pandas

Python (Pandas)
import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'scores': [85, 90, 78, 92, 88]})

# Sample SD (default in pandas)
sample_sd = df['scores'].std()
print(f"Sample SD: {sample_sd}")

# Population SD
pop_sd = df['scores'].std(ddof=0)
print(f"Population SD: {pop_sd}")

# Multiple columns at once
df.std()  # Returns SD for all numeric columns

Швидке порівняння

ІнструментВибіркове СВГенеральне СВ
Excel`STDEV.S()``STDEV.P()`
NumPy`np.std(data, ddof=1)``np.std(data)`
Pandas`df.std()``df.std(ddof=0)`
Python statistics`stdev()``pstdev()`