ComenzarEmpieza gratis

Descubrir predictores correlacionados

Las variables predictoras correlacionadas aportan información redundante y pueden afectar negativamente al proceso de ajuste del modelo. Cuando dos variables están muy correlacionadas, sus valores cambian linealmente entre sí y, por tanto, aportan la misma información a tus algoritmos de Machine Learning. Este fenómeno se conoce como multicolinealidad.

Antes de empezar a ajustar modelos, es importante explorar tu conjunto de datos para detectar estas relaciones y eliminarlas durante los pasos de ingeniería de características.

En este ejercicio, explorarás el conjunto de datos telecom_training creando una matriz de correlación de todas las variables predictoras numéricas.

Los datos de telecom_training se han cargado en tu sesión.

Este ejercicio forma parte del curso

Modelado con tidymodels en R

Ver curso

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

telecom_training %>% 
  # Select numeric columns
  ___(___) %>% 
  # Calculate correlation matrix
  ___
Editar y ejecutar código