Was ist die Varianz?
Die Varianz misst, wie weit eine Menge von Zahlen um ihren Durchschnittswert gestreut ist. Sie ist der Mittelwert der quadrierten Abweichungen vom Mittelwert — und bildet das Fundament, auf dem die Standardabweichung aufgebaut ist.
Jeder Balken zeigt die quadrierte Abweichung vom Mittelwert. Varianz = Durchschnitt dieser Balken.
Varianzformel
Populationsvarianz
σ² = Σ(xᵢ - μ)² / N
Stichprobenvarianz
s² = Σ(xᵢ - x̄)² / (n-1)
1
Mittelwert berechnen
Alle Werte addieren und durch die Anzahl teilen.
2
Abweichungen bestimmen
Den Mittelwert von jedem Datenpunkt subtrahieren.
3
Abweichungen quadrieren
Dadurch werden negative Werte eliminiert und große Abweichungen stärker gewichtet.
4
Quadrierte Abweichungen mitteln
Durch N (Population) oder n-1 (Stichprobe) teilen.
Warum quadrieren wir Abweichungen?
Drei wesentliche Gründe
1. Negative Werte eliminieren: Ohne Quadrierung würden sich positive und negative Abweichungen gegenseitig aufheben und die Summe wäre null.
2. Ausreißer stärker gewichten: Durch das Quadrieren erhalten Werte, die weit vom Mittelwert entfernt sind, mehr Gewicht.
3. Mathematische Eigenschaften: Die Varianz besitzt nützliche algebraische Eigenschaften für die statistische Inferenz.
Beispiel: Warum nicht einfach Absolutwerte verwenden?
Datensatz: 2, 4, 4, 4, 5, 5, 7, 9 (Mittelwert = 5)
Mittlere absolute Abweichung:
|2-5| + |4-5| + ... = 14
MAD = 14/8 = 1,75
Varianz (quadriert):
(2-5)² + (4-5)² + ... = 32
Var = 32/8 = 4
Varianz vs. Standardabweichung
Die Beziehung
Standard Deviation = √Variance → σ = √σ²
Varianz (σ²)
- Einheiten sind quadriert (z. B. cm², €²)
- Schwerer direkt zu interpretieren
- Nützlich für mathematische Operationen
- Additiv für unabhängige Variablen
Standardabweichung (σ)
- Gleiche Einheit wie die Originaldaten
- Leichter zu interpretieren
- Besser für die Kommunikation
- Wird für Z-Werte und Konfidenzintervalle verwendet
Anwendungen der Varianz
Obwohl die Standardabweichung häufiger berichtet wird, hat die Varianz spezifische Einsatzgebiete:
- ANOVA:Die Varianzanalyse vergleicht Mittelwerte über Gruppen hinweg
- Portfoliotheorie:Varianzen der Renditen werden zur Optimierung verwendet
- Regression:R² ist die erklärte Varianz geteilt durch die Gesamtvarianz
- PCA:Die Hauptkomponentenanalyse maximiert die erklärte Varianz