Caratteristiche con informazione mutua
Il data frame credit_df contiene diverse caratteristiche continue. Quando due caratteristiche continue sono correlate, condividono la stessa informazione — detta informazione mutua. Caratteristiche altamente correlate non sono solo ridondanti: possono creare problemi in fase di modellazione. Per esempio, nella regressione, caratteristiche molto correlate (ossia multicollinearità) possono portare a risultati privi di senso. Per farti un’idea dell’informazione mutua, creerai un grafico di correlazione per identificare le caratteristiche con informazione mutua.
I pacchetti tidyverse e corrr sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Usa
correlate()erplot()per creare un grafico di correlazione delle caratteristiche numeriche dicredit_df.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a correlation plot
___ %>%
select(where(is.numeric)) %>%
___() %>%
shave() %>%
___(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))