1. Nauka
  2. /
  3. Kursy
  4. /
  5. Myślenie statystyczne w Pythonie (część 1)

Connected

ćwiczenie

Obliczanie współczynnika korelacji Pearsona

Jak wspomniano w filmie, współczynnik korelacji Pearsona – zwany też r Pearsona – jest często łatwiejszy w interpretacji niż kowariancja. Oblicza się go za pomocą funkcji np.corrcoef(). Podobnie jak np.cov(), przyjmuje ona dwie tablice jako argumenty i zwraca dwuwymiarową tablicę. Elementy [0,0] i [1,1] są zawsze równe 1 (czy potrafisz powiedzieć dlaczego?), a interesująca nas wartość to element [0,1].

W tym ćwiczeniu napiszesz funkcję pearson_r(x, y), która przyjmuje dwie tablice i zwraca współczynnik korelacji Pearsona. Następnie użyjesz jej do obliczenia tego współczynnika dla długości i szerokości płatków I. versicolor.

Ponownie dołączamy wykres punktowy wygenerowany we wcześniejszym ćwiczeniu, który przypomina, jak szerokość i długość płatków są ze sobą powiązane.

Instrukcje

100 XP
  • Zdefiniuj funkcję o sygnaturze pearson_r(x, y).
    • Użyj np.corrcoef(), aby obliczyć macierz korelacji dla x i y (przekaż je do np.corrcoef() w tej kolejności).
    • Funkcja powinna zwracać element [0,1] macierzy korelacji.
  • Oblicz korelację Pearsona między danymi z tablic versicolor_petal_length i versicolor_petal_width. Wynik przypisz do zmiennej r.
  • Wyświetl wynik.