Kovarianz vs. Korrelation
Die Kovarianz misst, ob zwei Variablen gemeinsam schwanken ("variieren"). Sie wird berechnet, indem man punktweise die Produkte der Abweichungen aus der vorherigen Übung bildet, dx[n]*dy[n], und anschließend den Mittelwert all dieser Produkte bestimmt.
Die Korrelation ist im Kern die normalisierte Kovarianz. In dieser Übung bekommst du zwei Datenarrays, die stark korreliert sind. Du wirst sowohl die covariance als auch die correlation visualisieren und berechnen.

Diese Übung ist Teil des Kurses
<Kurs>Einführung in lineares Modellieren mit Python</Kurs>Übungsanweisungen
- Berechne die Abweichungen
dxunddy, indem du den Mittelwert mitnp.mean()abziehst, und berechne diecovarianceals Mittelwert ihres Produktsdx*dy. - Berechne die normalisierten Abweichungen
zxundzy, indem du durch die Standardabweichung mitnp.std()teilst, und berechne diecorrelationals Mittelwert ihres Produktszx*zy. - Verwende
plot_normalized_deviations(zx, zy), um das Produkt der normalisierten Abweichungen zu plotten und es visuell mit dem Korrelationswert abzugleichen.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)
# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)
# Plot the normalized deviations for visual inspection.
fig = plot_normalized_deviations(zx, zy)