Fitur mutual information
Data frame credit_df berisi sejumlah fitur kontinu. Ketika dua fitur kontinu berkorelasi, keduanya memuat informasi yang sama — ini disebut mutual information. Fitur yang sangat berkorelasi bukan hanya berlebihan. Fitur tersebut dapat menimbulkan masalah dalam pemodelan. Misalnya, dalam regresi, fitur yang sangat berkorelasi (yaitu multikolinearitas) dapat menghasilkan keluaran yang tidak masuk akal. Untuk mendapatkan gambaran tentang mutual information, Anda akan membuat plot korelasi untuk mengidentifikasi fitur-fitur dengan mutual information.
Paket tidyverse dan corrr telah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Reduksi Dimensi di R
Instruksi latihan
- Gunakan
correlate()danrplot()untuk membuat plot korelasi dari fitur numerik padacredit_df.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a correlation plot
___ %>%
select(where(is.numeric)) %>%
___() %>%
shave() %>%
___(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))