Korelasi dan R-squared
Korelasi linear dari dua variabel, \(x\) dan \(y\), mengukur kekuatan hubungan linear di antara keduanya. Ketika \(x\) dan \(y\) masing-masing adalah:
- keluaran dari sebuah model regresi yang meminimalkan galat kuadrat (seperti regresi linear), dan
- keluaran sebenarnya dari data latih,
kuadrat dari korelasi sama dengan \(R^2\). Anda akan memverifikasinya dalam latihan ini.
unemployment dan unemployment_model tersedia untuk Anda gunakan.
Latihan ini adalah bagian dari kursus
Supervised Learning di R: Regresi
Petunjuk latihan
- Gunakan
cor()(docs) untuk mendapatkan korelasi antara prediksi dan pengangguran perempuan. Simpan ke variabelrhodan cetak. Pastikan Anda menggunakan korelasi Pearson (bawaan/default). - Kuadratkan
rhodan simpan kerho2. Cetak. - Bandingkan
rho2dengan \(R^2\) dari model (menggunakanglance()). Apakah sama?
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# unemployment is available
summary(unemployment)
# unemployment_model is available
summary(unemployment_model)
# Get the correlation between the prediction and true outcome: rho and print it
(rho <- ___)
# Square rho: rho2 and print it
(rho2 <- ___)
# Get R-squared from glance and print it
(rsq_glance <- ___(___)$___)