MulaiMulai sekarang secara gratis

Fitur mutual information

Data frame credit_df berisi sejumlah fitur kontinu. Ketika dua fitur kontinu berkorelasi, keduanya memuat informasi yang sama — ini disebut mutual information. Fitur yang sangat berkorelasi bukan hanya berlebihan. Fitur tersebut dapat menimbulkan masalah dalam pemodelan. Misalnya, dalam regresi, fitur yang sangat berkorelasi (yaitu multikolinearitas) dapat menghasilkan keluaran yang tidak masuk akal. Untuk mendapatkan gambaran tentang mutual information, Anda akan membuat plot korelasi untuk mengidentifikasi fitur-fitur dengan mutual information.

Paket tidyverse dan corrr telah dimuat untuk Anda.

Latihan ini adalah bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Petunjuk latihan

  • Gunakan correlate() dan rplot() untuk membuat plot korelasi dari fitur numerik pada credit_df.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a correlation plot
___ %>% 
  select(where(is.numeric)) %>% 
  ___() %>% 
  shave() %>% 
  ___(print_cor = TRUE) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Edit dan Jalankan Kode