1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Monte Carlo simulace v Pythonu

Connected

cvičení

Vztah mezi korelační a kovarianční maticí

Dříve v kurzu jsi používal/a .cov() k získání kovarianční matice a .corr() k získání korelační matice. Tyto dvě metody se snadno pletou a při simulacích je lze použít nesprávně. Pojďme si to ujasnit!

Korelační matice je standardizovaná kovarianční matice, kde korelační koeficienty nabývají hodnot od 0 do 1.

\(cov(x,y) = corr(x,y) \times std(x) \times std(y)\)

Výše uvedený vzorec říká, že \(cov(x,y)\), tedy hodnota kovariance, se vypočítá vynásobením korelačního koeficientu \(corr(x,y)\) směrodatnou odchylkou \(x\), \(std(x)\), a směrodatnou odchylkou \(y\), \(std(y)\). V tomto cvičení si tento vztah vyzkoušíš v praxi!

Dataset diabetes je načten jako DataFrame dia a jsou pro tebe naimportovány pandas jako pd a numpy jako np.

Pokyny

100 XP
  • Vypočítej kovarianční matici dia[["bmi", "tc"]] a ulož ji jako cov_dia2.
  • Vypočítej korelační matici dia[["bmi", "tc"]] a ulož ji jako corr_dia2.