Σ
SDCalc
进阶教程·15 min

在 Excel 和 Python 中计算标准差

分步教程:在 Excel(STDEV.S、STDEV.P)和 Python(numpy、pandas、statistics)中计算标准差,附完整代码示例。

Excel 概述

Microsoft Excel 提供了内置函数来计算样本标准差和总体标准差。这些函数在所有现代版本的 Excel 中都可使用。

Excel 函数

函数类型说明
`STDEV.S()`样本样本标准差(除以 n-1)
`STDEV.P()`总体总体标准差(除以 N)
`STDEV()`样本旧版函数,等同于 STDEV.S
`STDEVP()`总体旧版函数,等同于 STDEV.P

Excel 示例

Excel Formulas
// Data in cells A1:A10
=STDEV.S(A1:A10)     // Sample SD
=STDEV.P(A1:A10)     // Population SD

// For specific values
=STDEV.S(4, 8, 6, 5, 3)    // Returns 1.924

// Ignoring text and logical values
=STDEV.S(A1:A10)    // Ignores text
=STDEVA(A1:A10)     // Includes text as 0

小贴士

在大多数实际分析中使用 STDEV.S。只有当你确定拥有完整总体数据时,才使用 STDEV.P。

Python 概述

Python 提供了多种计算标准差的方式。最常用的库是 NumPyPandas 和内置的 statistics 模块。

使用 NumPy

Python (NumPy)
import numpy as np

data = [4, 8, 6, 5, 3]

# Population standard deviation (default)
pop_sd = np.std(data)
print(f"Population SD: {pop_sd}")  # 1.720

# Sample standard deviation
sample_sd = np.std(data, ddof=1)
print(f"Sample SD: {sample_sd}")  # 1.924

什么是 ddof?

ddof 代表“自由度差值”(Delta Degrees of Freedom)。设置 ddof=1 告诉 NumPy 除以 (n-1) 以计算样本标准差。默认 ddof=0 计算的是总体标准差。

使用 Pandas

Python (Pandas)
import pandas as pd

# Create a DataFrame
df = pd.DataFrame({'scores': [85, 90, 78, 92, 88]})

# Sample SD (default in pandas)
sample_sd = df['scores'].std()
print(f"Sample SD: {sample_sd}")

# Population SD
pop_sd = df['scores'].std(ddof=0)
print(f"Population SD: {pop_sd}")

# Multiple columns at once
df.std()  # Returns SD for all numeric columns

快速对比

工具样本标准差总体标准差
Excel`STDEV.S()``STDEV.P()`
NumPy`np.std(data, ddof=1)``np.std(data)`
Pandas`df.std()``df.std(ddof=0)`
Python statistics`stdev()``pstdev()`