Mulai sekarangMulai gratis

Variabel berkorelasi

Dalam latihan ini, Anda akan meninjau himpunan data terkait variabel yang berkorelasi. Penting untuk menghapusnya sebelum menerapkan pengklasifikasi biner, khususnya pada regresi logistik. Ketika dua atau lebih variabel memiliki korelasi yang sangat tinggi, Anda sebaiknya menghapus semuanya kecuali satu.

Pertama, kita akan menggunakan fungsi corrplot() pada paket corrplot untuk memvisualisasikan korelasi. Dalam plot korelasi, warna biru menunjukkan korelasi positif dan merah menunjukkan korelasi negatif. Semakin gelap warnanya, semakin tinggi korelasinya. Terakhir, Anda akan menghapus variabel yang sangat berkorelasi dari himpunan data.

Latihan ini merupakan bagian dari kursus

Analitik Prediktif menggunakan Data Berjejaring di R

Lihat Kursus

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Remove the Future column from studentnetworkdata 
no_future <- ___

# Load the corrplot package
library(___)

# Generate the correlation matrix
M <- ___(no_future)

# Plot the correlations
___(M, method = "circle")
Edit dan Jalankan Kode