Características con información mutua
El data frame credit_df contiene varias características continuas. Cuando dos características continuas están correlacionadas, comparten la misma información; a esto se le llama información mutua. Las características muy correlacionadas no solo son redundantes: pueden causar problemas al modelar. Por ejemplo, en regresión, características muy correlacionadas (es decir, multicolinealidad) pueden producir resultados sin sentido. Para hacerte una idea de la información mutua, crearás un gráfico de correlaciones para identificar características con información mutua.
Los paquetes tidyverse y corrr ya están cargados.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Usa
correlate()yrplot()para crear un gráfico de correlación de las características numéricas decredit_df.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a correlation plot
___ %>%
select(where(is.numeric)) %>%
___() %>%
shave() %>%
___(print_cor = TRUE) +
theme(axis.text.x = element_text(angle = 90, hjust = 1))