Kovarianz berechnen
Die Kovarianz kann mit der Numpy-Funktion np.cov() berechnet werden. Haben wir beispielsweise zwei Datensätze x und y, liefert np.cov(x, y) ein 2D-Array, in dem die Einträge [0,1] und [1,0] die Kovarianzen sind. Der Eintrag [0,0] ist die Varianz der Daten in x, und der Eintrag [1,1] ist die Varianz der Daten in y. Dieses 2D-Ausgabe-Array heißt Kovarianzmatrix, da es die Selbst- und Gegenkovarianzen organisiert.
Zur Erinnerung an den Zusammenhang zwischen Kelchblattlänge und -breite von I. versicolor fügen wir das Streudiagramm ein, das du in einer vorherigen Übung erstellt hast.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 1)
Anleitung zur Übung
- Verwende
np.cov(), um die Kovarianzmatrix für die Kelchblattlänge (versicolor_petal_length) und -breite (versicolor_petal_width) von I. versicolor zu berechnen. - Gib die Kovarianzmatrix aus.
- Extrahiere die Kovarianz aus dem Eintrag
[0,1]der Kovarianzmatrix. Beachte, dass aufgrund der Symmetrie der Eintrag[1,0]dem Eintrag[0,1]entspricht. - Gib die Kovarianz aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compute the covariance matrix: covariance_matrix
# Print covariance matrix
# Extract covariance of length and width of petals: petal_cov
# Print the length/width covariance