Individua le feature altamente correlate
Usando i dati in house_sales_df, esercitati a individuare le feature con alta correlazione. Una forte correlazione tra feature indica informazioni ridondanti e può creare problemi nel modeling, come la multicollinearità nei modelli di regressione. Deciderai quali delle feature altamente correlate rimuovere. Una matrice di correlazione ti aiuterà a identificare le feature altamente correlate.
I pacchetti tidyverse e corrr sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Crea un grafico di correlazione con i valori di correlazione stampati sul grafico.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a correlation plot of the house sales
house_sales_df %>%
___() %>%
___() %>%
___(print_cor = ___) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))