MulaiMulai sekarang secara gratis

Variabel berkorelasi

Dalam latihan ini, Anda akan meninjau himpunan data terkait variabel yang berkorelasi. Penting untuk menghapusnya sebelum menerapkan pengklasifikasi biner, khususnya pada regresi logistik. Ketika dua atau lebih variabel memiliki korelasi yang sangat tinggi, Anda sebaiknya menghapus semuanya kecuali satu.

Pertama, kita akan menggunakan fungsi corrplot() pada paket corrplot untuk memvisualisasikan korelasi. Dalam plot korelasi, warna biru menunjukkan korelasi positif dan merah menunjukkan korelasi negatif. Semakin gelap warnanya, semakin tinggi korelasinya. Terakhir, Anda akan menghapus variabel yang sangat berkorelasi dari himpunan data.

Latihan ini adalah bagian dari kursus

Analitik Prediktif menggunakan Data Berjejaring di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Remove the Future column from studentnetworkdata 
no_future <- ___

# Load the corrplot package
library(___)

# Generate the correlation matrix
M <- ___(no_future)

# Plot the correlations
___(M, method = "circle")
Edit dan Jalankan Kode