Den Pearson-Korrelationskoeffizienten berechnen
Wie im Video erwähnt, ist der Pearson-Korrelationskoeffizient, auch Pearson r genannt, oft leichter zu interpretieren als die Kovarianz. Er wird mit der Funktion np.corrcoef() berechnet. Wie np.cov() nimmt sie zwei Arrays als Argumente und gibt ein 2D-Array zurück. Die Einträge [0,0] und [1,1] sind zwangsläufig 1 (kannst du dir überlegen, warum?), und der Wert, an dem wir interessiert sind, ist der Eintrag [0,1].
In dieser Übung schreibst du eine Funktion pearson_r(x, y), die zwei Arrays entgegennimmt und den Pearson-Korrelationskoeffizienten zurückgibt. Danach verwendest du diese Funktion, um ihn für die Kelchblattlängen und -breiten von I. versicolor zu berechnen.
Zur Auffrischung fügen wir erneut das Streudiagramm aus einer früheren Übung ein, damit du sehen kannst, wie Kelchblattbreite und -länge zusammenhängen.
Diese Übung ist Teil des Kurses
Statistical Thinking in Python (Teil 1)
Anleitung zur Übung
- Definiere eine Funktion mit der Signatur
pearson_r(x, y).- Verwende
np.corrcoef(), um die Korrelationsmatrix vonxundyzu berechnen (übergebe sie in dieser Reihenfolge annp.corrcoef()). - Die Funktion gibt den Eintrag
[0,1]der Korrelationsmatrix zurück.
- Verwende
- Berechne die Pearson-Korrelation zwischen den Daten in den Arrays
versicolor_petal_lengthundversicolor_petal_width. Weisen den Wert der Variablenrzu. - Gib das Ergebnis aus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
def ____(____, ____):
"""Compute Pearson correlation coefficient between two arrays."""
# Compute correlation matrix: corr_mat
# Return entry [0,1]
return corr_mat[0,1]
# Compute Pearson correlation coefficient for I. versicolor: r
# Print the result