ComeçarComece de graça

Identificar features altamente correlacionadas

Usando os dados em house_sales_df, você vai praticar a identificação de features com alta correlação. Correlações altas entre features indicam informação redundante e podem causar problemas na modelagem, como multicolinearidade em modelos de regressão. Você vai determinar quais das features altamente correlacionadas remover. Uma matriz de correlação ajudará você a identificar essas features.

Os pacotes tidyverse e corrr já foram carregados para você.

Este exercício faz parte do curso

Redução de Dimensionalidade em R

Ver curso

Instruções do exercício

  • Crie um gráfico de correlação com os coeficientes de correlação impressos no gráfico.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Create a correlation plot of the house sales
house_sales_df %>% 
  ___() %>% 
  ___() %>% 
  ___(print_cor = ___) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Editar e executar o código