Korrelation & Scatter Plots
Zusammenhänge erkennen, den Korrelationskoeffizienten r verstehen und sehen, wann eine lineare Beziehung passt; und wann nicht.
Was ist Korrelation?
Korrelation misst, wie stark zwei Variablen linear zusammenhängen. Der Korrelationskoeffizient r (nach Pearson) liegt immer zwischen -1 und +1:
- r = +1. Perfekter positiver Zusammenhang: wenn x steigt, steigt y proportional.
- r = -1. Perfekter negativer Zusammenhang: wenn x steigt, sinkt y proportional.
- r = 0. Kein linearer Zusammenhang. Aber Vorsicht: es kann trotzdem ein nicht-lineares Muster existieren!
Korrelation ≠ Kausalität
Ein hoher r-Wert bedeutet nicht, dass x die Ursache von y ist. Eisverkäufe und Sonnenbrand korrelieren stark, aber Eis verursacht keinen Sonnenbrand. Beide werden von der Temperatur beeinflusst.
Probieren Sie es aus:
- Wechseln Sie zwischen Datensätzen und beobachten Sie, wie sich r und die Punktwolke verändern.
- Ziehen Sie Datenpunkte, um zu sehen, wie ein einzelner Ausreißer r beeinflusst.
- Klicken Sie ins Diagramm, um neue Punkte hinzuzufügen. Umschalt+Klick entfernt einen Punkt.
- Schalten Sie die Regressionslinie ein, um zu sehen, ob eine Gerade Sinn macht.
Datenpunkte
Klicken: neu · Ziehen = verschieben · Umschalt+Klick = entfernen
Korrelationskoeffizient r
-1
0
+1
negativer Zusammenhang
–
positiver Zusammenhang
–
Wählen Sie einen Datensatz, um zu starten.
Datensatz wählen
Pearson-Korrelation
$r = \frac{\sum(x_i - \bar{x})(y_i - \bar{y})}{\sqrt{\sum(x_i - \bar{x})^2 \cdot \sum(y_i - \bar{y})^2}}$
$\bar{x}$ (Mittelwert)
–
$\bar{y}$ (Mittelwert)
–
$r$
–
$r^2$
–
$r^2$ = Anteil der erklärten Varianz (– %)
Datenpunkte (n = 0)
| # | x | y |
|---|