Hubungan antara matriks korelasi dan kovarians
Sebelumnya dalam kursus ini, Anda menggunakan .cov() untuk memperoleh matriks kovarians dan .corr() untuk memperoleh matriks korelasi. Keduanya mudah tertukar dan dapat digunakan keliru dalam simulasi. Mari kita perjelas!
Matriks korelasi adalah matriks kovarians yang telah distandardisasi, di mana koefisien korelasi dalam matriks korelasi bernilai antara 0 hingga 1.
\(cov(x,y) = corr(x,y) \times std(x) \times std(y)\)
Persamaan di atas menyatakan bahwa \(cov(x,y)\), nilai kovarians, dapat dihitung dengan mengalikan koefisien korelasi \(corr(x,y)\) dengan simpangan baku \(x\), \(std(x)\), dan simpangan baku \(y\), \(std(y)\). Anda akan menguji hubungan ini dalam latihan ini!
Himpunan data diabetes telah dimuat sebagai DataFrame, dia, dan pandas sebagai pd serta numpy sebagai np telah diimpor untuk Anda.
Latihan ini merupakan bagian dari kursus
Simulasi Monte Carlo di Python
Instruksi latihan
- Hitung matriks kovarians dari
dia[["bmi", "tc"]], simpan sebagaicov_dia2. - Hitung matriks korelasi dari
dia[["bmi", "tc"]], simpan sebagaicorr_dia2.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Calculate the covariance matrix of bmi and tc
cov_dia2 = ____
# Calculate the correlation matrix of bmi and tc
corr_dia2 = ____
std_dia2 = dia[["bmi","tc"]].std()
print(f'Covariance of bmi and tc from covariance matrix :{cov_dia2.iloc[0,1]}')
print(f'Covariance of bmi and tc from correlation matrix :{corr_dia2.iloc[0,1] * std_dia2[0] * std_dia2[1]}')