Mulai sekarangMulai gratis

Fitur mutual information

Data frame credit_df berisi sejumlah fitur kontinu. Ketika dua fitur kontinu berkorelasi, keduanya memuat informasi yang sama — ini disebut mutual information. Fitur yang sangat berkorelasi bukan hanya berlebihan. Fitur tersebut dapat menimbulkan masalah dalam pemodelan. Misalnya, dalam regresi, fitur yang sangat berkorelasi (yaitu multikolinearitas) dapat menghasilkan keluaran yang tidak masuk akal. Untuk mendapatkan gambaran tentang mutual information, Anda akan membuat plot korelasi untuk mengidentifikasi fitur-fitur dengan mutual information.

Paket tidyverse dan corrr telah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Reduksi Dimensi di R

Lihat Kursus

Instruksi latihan

  • Gunakan correlate() dan rplot() untuk membuat plot korelasi dari fitur numerik pada credit_df.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a correlation plot
___ %>% 
  select(where(is.numeric)) %>% 
  ___() %>% 
  shave() %>% 
  ___(print_cor = TRUE) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Edit dan Jalankan Kode