Identificar características altamente correlacionadas
Con los datos de house_sales_df, practicarás cómo identificar características con alta correlación. Una alta correlación entre características indica información redundante y puede causar problemas en el modelado, como multicolinealidad en modelos de regresión. Determinarás cuáles de las características altamente correlacionadas conviene eliminar. Una matriz de correlación te ayudará a identificar estas características.
Los paquetes tidyverse y corrr ya están cargados.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Crea un gráfico de correlación con los coeficientes impresos en el propio gráfico.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a correlation plot of the house sales
house_sales_df %>%
___() %>%
___() %>%
___(print_cor = ___) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))