Den Pearson-Korrelationskoeffizienten berechnen

Wie im Video erwähnt, ist der Pearson-Korrelationskoeffizient, auch Pearson r genannt, oft leichter zu interpretieren als die Kovarianz. Er wird mit der Funktion np.corrcoef() berechnet. Wie np.cov() nimmt sie zwei Arrays als Argumente und gibt ein 2D-Array zurück. Die Einträge [0,0] und [1,1] sind zwangsläufig 1 (kannst du dir überlegen, warum?), und der Wert, an dem wir interessiert sind, ist der Eintrag [0,1].

In dieser Übung schreibst du eine Funktion pearson_r(x, y), die zwei Arrays entgegennimmt und den Pearson-Korrelationskoeffizienten zurückgibt. Danach verwendest du diese Funktion, um ihn für die Kelchblattlängen und -breiten von I. versicolor zu berechnen.

Zur Auffrischung fügen wir erneut das Streudiagramm aus einer früheren Übung ein, damit du sehen kannst, wie Kelchblattbreite und -länge zusammenhängen.

Diese Übung ist Teil des Kurses

Statistical Thinking in Python (Teil 1)

Kurs anzeigen

Anleitung zur Übung

Definiere eine Funktion mit der Signatur pearson_r(x, y).
- Verwende np.corrcoef(), um die Korrelationsmatrix von x und y zu berechnen (übergebe sie in dieser Reihenfolge an np.corrcoef()).
- Die Funktion gibt den Eintrag [0,1] der Korrelationsmatrix zurück.
Berechne die Pearson-Korrelation zwischen den Daten in den Arrays versicolor_petal_length und versicolor_petal_width. Weisen den Wert der Variablen r zu.
Gib das Ergebnis aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

def ____(____, ____):
    """Compute Pearson correlation coefficient between two arrays."""
    # Compute correlation matrix: corr_mat


    # Return entry [0,1]
    return corr_mat[0,1]

# Compute Pearson correlation coefficient for I. versicolor: r


# Print the result

Code bearbeiten und ausführen