Kovarianz vs. Korrelation
Die Kovarianz misst, ob zwei Variablen gemeinsam schwanken ("variieren"). Sie wird berechnet, indem man punktweise die Produkte der Abweichungen aus der vorherigen Übung bildet, dx[n]*dy[n], und anschließend den Mittelwert all dieser Produkte bestimmt.
Die Korrelation ist im Kern die normalisierte Kovarianz. In dieser Übung bekommst du zwei Datenarrays, die stark korreliert sind. Du wirst sowohl die covariance als auch die correlation visualisieren und berechnen.

Diese Übung ist Teil des Kurses
Einführung in lineares Modellieren mit Python
Anleitung zur Übung
- Berechne die Abweichungen
dxunddy, indem du den Mittelwert mitnp.mean()abziehst, und berechne diecovarianceals Mittelwert ihres Produktsdx*dy. - Berechne die normalisierten Abweichungen
zxundzy, indem du durch die Standardabweichung mitnp.std()teilst, und berechne diecorrelationals Mittelwert ihres Produktszx*zy. - Verwende
plot_normalized_deviations(zx, zy), um das Produkt der normalisierten Abweichungen zu plotten und es visuell mit dem Korrelationswert abzugleichen.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)
# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)
# Plot the normalized deviations for visual inspection.
fig = plot_normalized_deviations(zx, zy)