Identificar features altamente correlacionadas
Usando os dados em house_sales_df, você vai praticar a identificação de features com alta correlação. Correlações altas entre features indicam informação redundante e podem causar problemas na modelagem, como multicolinearidade em modelos de regressão. Você vai determinar quais das features altamente correlacionadas remover. Uma matriz de correlação ajudará você a identificar essas features.
Os pacotes tidyverse e corrr já foram carregados para você.
Este exercício faz parte do curso
Redução de Dimensionalidade em R
Instruções do exercício
- Crie um gráfico de correlação com os coeficientes de correlação impressos no gráfico.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create a correlation plot of the house sales
house_sales_df %>%
___() %>%
___() %>%
___(print_cor = ___) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))