Variabel berkorelasi
Dalam latihan ini, Anda akan meninjau himpunan data terkait variabel yang berkorelasi. Penting untuk menghapusnya sebelum menerapkan pengklasifikasi biner, khususnya pada regresi logistik. Ketika dua atau lebih variabel memiliki korelasi yang sangat tinggi, Anda sebaiknya menghapus semuanya kecuali satu.
Pertama, kita akan menggunakan fungsi corrplot() pada paket corrplot untuk memvisualisasikan korelasi.
Dalam plot korelasi, warna biru menunjukkan korelasi positif dan merah menunjukkan korelasi negatif.
Semakin gelap warnanya, semakin tinggi korelasinya.
Terakhir, Anda akan menghapus variabel yang sangat berkorelasi dari himpunan data.
Latihan ini adalah bagian dari kursus
Analitik Prediktif menggunakan Data Berjejaring di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Remove the Future column from studentnetworkdata
no_future <- ___
# Load the corrplot package
library(___)
# Generate the correlation matrix
M <- ___(no_future)
# Plot the correlations
___(M, method = "circle")