IniziaInizia gratis

Caratteristiche con informazione mutua

Il data frame credit_df contiene diverse caratteristiche continue. Quando due caratteristiche continue sono correlate, condividono la stessa informazione — detta informazione mutua. Caratteristiche altamente correlate non sono solo ridondanti: possono creare problemi in fase di modellazione. Per esempio, nella regressione, caratteristiche molto correlate (ossia multicollinearità) possono portare a risultati privi di senso. Per farti un’idea dell’informazione mutua, creerai un grafico di correlazione per identificare le caratteristiche con informazione mutua.

I pacchetti tidyverse e corrr sono già stati caricati per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza il corso

Istruzioni dell'esercizio

  • Usa correlate() e rplot() per creare un grafico di correlazione delle caratteristiche numeriche di credit_df.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a correlation plot
___ %>% 
  select(where(is.numeric)) %>% 
  ___() %>% 
  shave() %>% 
  ___(print_cor = TRUE) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Modifica ed esegui il codice