Descubrir predictores correlacionados
Las variables predictoras correlacionadas aportan información redundante y pueden afectar negativamente al proceso de ajuste del modelo. Cuando dos variables están muy correlacionadas, sus valores cambian linealmente entre sí y, por tanto, aportan la misma información a tus algoritmos de Machine Learning. Este fenómeno se conoce como multicolinealidad.
Antes de empezar a ajustar modelos, es importante explorar tu conjunto de datos para detectar estas relaciones y eliminarlas durante los pasos de ingeniería de características.
En este ejercicio, explorarás el conjunto de datos telecom_training creando una matriz de correlación de todas las variables predictoras numéricas.
Los datos de telecom_training se han cargado en tu sesión.
Este ejercicio forma parte del curso
Modelado con tidymodels en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
telecom_training %>%
# Select numeric columns
___(___) %>%
# Calculate correlation matrix
___