MulaiMulai sekarang secara gratis

Hubungan antara matriks korelasi dan kovarians

Sebelumnya dalam kursus ini, Anda menggunakan .cov() untuk memperoleh matriks kovarians dan .corr() untuk memperoleh matriks korelasi. Keduanya mudah tertukar dan dapat digunakan keliru dalam simulasi. Mari kita perjelas!

Matriks korelasi adalah matriks kovarians yang telah distandardisasi, di mana koefisien korelasi dalam matriks korelasi bernilai antara 0 hingga 1.

\(cov(x,y) = corr(x,y) \times std(x) \times std(y)\)

Persamaan di atas menyatakan bahwa \(cov(x,y)\), nilai kovarians, dapat dihitung dengan mengalikan koefisien korelasi \(corr(x,y)\) dengan simpangan baku \(x\), \(std(x)\), dan simpangan baku \(y\), \(std(y)\). Anda akan menguji hubungan ini dalam latihan ini!

Himpunan data diabetes telah dimuat sebagai DataFrame, dia, dan pandas sebagai pd serta numpy sebagai np telah diimpor untuk Anda.

Latihan ini adalah bagian dari kursus

Simulasi Monte Carlo di Python

Lihat Kursus

Petunjuk latihan

  • Hitung matriks kovarians dari dia[["bmi", "tc"]], simpan sebagai cov_dia2.
  • Hitung matriks korelasi dari dia[["bmi", "tc"]], simpan sebagai corr_dia2.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Calculate the covariance matrix of bmi and tc
cov_dia2 = ____

# Calculate the correlation matrix of bmi and tc
corr_dia2 = ____
std_dia2 = dia[["bmi","tc"]].std()

print(f'Covariance of bmi and tc from covariance matrix :{cov_dia2.iloc[0,1]}')
print(f'Covariance of bmi and tc from correlation matrix :{corr_dia2.iloc[0,1] * std_dia2[0] * std_dia2[1]}')
Edit dan Jalankan Kode