Eliminar predictores correlacionados con recipes
Eliminar variables predictoras correlacionadas de tus conjuntos de entrenamiento y prueba es un paso clave de feature engineering para que el ajuste del modelo vaya lo más fluido posible.
Ahora que has visto que monthly_charges y avg_data_gb están altamente correlacionadas, debes añadir un filtro de correlación con step_corr() a tu pipeline de feature engineering para los datos de telecomunicaciones.
En este ejercicio, crearás un objeto recipe que elimina predictores correlacionados de los datos de telecomunicaciones.
Los conjuntos telecom_training y telecom_test ya se han cargado en tu sesión.
Este ejercicio forma parte del curso
Modelado con tidymodels en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Specify a recipe object
telecom_cor_rec <- recipe(___,
data = ___) %>%
# Remove correlated variables
___(___, threshold = ___)