Fitur mutual information
Data frame credit_df berisi sejumlah fitur kontinu. Ketika dua fitur kontinu berkorelasi, keduanya memuat informasi yang sama — ini disebut mutual information. Fitur yang sangat berkorelasi bukan hanya berlebihan. Fitur tersebut dapat menimbulkan masalah dalam pemodelan. Misalnya, dalam regresi, fitur yang sangat berkorelasi (yaitu multikolinearitas) dapat menghasilkan keluaran yang tidak masuk akal. Untuk mendapatkan gambaran tentang mutual information, Anda akan membuat plot korelasi untuk mengidentifikasi fitur-fitur dengan mutual information.
Paket tidyverse dan corrr telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Gunakan
correlate()danrplot()untuk membuat plot korelasi dari fitur numerik padacredit_df.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a correlation plot
___ %>%
select(where(is.numeric)) %>%
___() %>%
shave() %>%
___(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))