ComenzarEmpieza gratis

Identificar características altamente correlacionadas

Con los datos de house_sales_df, practicarás cómo identificar características con alta correlación. Una alta correlación entre características indica información redundante y puede causar problemas en el modelado, como multicolinealidad en modelos de regresión. Determinarás cuáles de las características altamente correlacionadas conviene eliminar. Una matriz de correlación te ayudará a identificar estas características.

Los paquetes tidyverse y corrr ya están cargados.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Crea un gráfico de correlación con los coeficientes impresos en el propio gráfico.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a correlation plot of the house sales
house_sales_df %>% 
  ___() %>% 
  ___() %>% 
  ___(print_cor = ___) +
  theme(axis.text.x = element_text(angle = 90, hjust = 1))
Editar y ejecutar código