1. Nauka
  2. /
  3. Kursy
  4. /
  5. Symulacje Monte Carlo w Pythonie

Connected

ćwiczenie

Związek między macierzą korelacji a macierzą kowariancji

Wcześniej w kursie korzystałeś z .cov() do wyznaczania macierzy kowariancji oraz z .corr() do wyznaczania macierzy korelacji. Łatwo je ze sobą pomylić i błędnie zastosować w symulacjach. Wyjaśnijmy to!

Macierz korelacji to ustandaryzowana macierz kowariancji, w której współczynniki korelacji przyjmują wartości od 0 do 1.

\(cov(x,y) = corr(x,y) \times std(x) \times std(y)\)

Powyższe równanie mówi, że \(cov(x,y)\), czyli wartość kowariancji, można obliczyć jako iloczyn współczynnika korelacji \(corr(x,y)\), odchylenia standardowego \(x\), czyli \(std(x)\), oraz odchylenia standardowego \(y\), czyli \(std(y)\). W tym ćwiczeniu sprawdzisz tę zależność w praktyce!

Zbiór danych dotyczący cukrzycy został wczytany jako DataFrame dia, a biblioteki pandas jako pd i numpy jako np są już zaimportowane.

Instrukcje

100 XP
  • Oblicz macierz kowariancji dla dia[["bmi", "tc"]] i zapisz wynik jako cov_dia2.
  • Oblicz macierz korelacji dla dia[["bmi", "tc"]] i zapisz wynik jako corr_dia2.