Excel 概述
Microsoft Excel 提供了内置函数来计算样本标准差和总体标准差。这些函数在所有现代版本的 Excel 中都可使用。
Excel 函数
| 函数 | 类型 | 说明 |
|---|---|---|
| `STDEV.S()` | 样本 | 样本标准差(除以 n-1) |
| `STDEV.P()` | 总体 | 总体标准差(除以 N) |
| `STDEV()` | 样本 | 旧版函数,等同于 STDEV.S |
| `STDEVP()` | 总体 | 旧版函数,等同于 STDEV.P |
Excel 示例
Excel Formulas
// Data in cells A1:A10
=STDEV.S(A1:A10) // Sample SD
=STDEV.P(A1:A10) // Population SD
// For specific values
=STDEV.S(4, 8, 6, 5, 3) // Returns 1.924
// Ignoring text and logical values
=STDEV.S(A1:A10) // Ignores text
=STDEVA(A1:A10) // Includes text as 0小贴士
在大多数实际分析中使用 STDEV.S。只有当你确定拥有完整总体数据时,才使用 STDEV.P。
Python 概述
Python 提供了多种计算标准差的方式。最常用的库是 NumPy、Pandas 和内置的 statistics 模块。
使用 NumPy
Python (NumPy)
import numpy as np
data = [4, 8, 6, 5, 3]
# Population standard deviation (default)
pop_sd = np.std(data)
print(f"Population SD: {pop_sd}") # 1.720
# Sample standard deviation
sample_sd = np.std(data, ddof=1)
print(f"Sample SD: {sample_sd}") # 1.924什么是 ddof?
ddof 代表“自由度差值”(Delta Degrees of Freedom)。设置 ddof=1 告诉 NumPy 除以 (n-1) 以计算样本标准差。默认 ddof=0 计算的是总体标准差。
使用 Pandas
Python (Pandas)
import pandas as pd
# Create a DataFrame
df = pd.DataFrame({'scores': [85, 90, 78, 92, 88]})
# Sample SD (default in pandas)
sample_sd = df['scores'].std()
print(f"Sample SD: {sample_sd}")
# Population SD
pop_sd = df['scores'].std(ddof=0)
print(f"Population SD: {pop_sd}")
# Multiple columns at once
df.std() # Returns SD for all numeric columns快速对比
| 工具 | 样本标准差 | 总体标准差 |
|---|---|---|
| Excel | `STDEV.S()` | `STDEV.P()` |
| NumPy | `np.std(data, ddof=1)` | `np.std(data)` |
| Pandas | `df.std()` | `df.std(ddof=0)` |
| Python statistics | `stdev()` | `pstdev()` |