Proceso de feature engineering
Para incorporar el feature engineering en el proceso de modelado, los conjuntos de datos de entrenamiento y prueba deben preprocesarse antes de ajustar el modelo. Con las habilidades que has aprendido en este capítulo, podrás usar todas las variables predictoras disponibles en los datos de telecomunicaciones para entrenar tu modelo de regresión logística.
En este ejercicio, crearás una canalización de feature engineering sobre los datos de telecomunicaciones y la usarás para transformar los conjuntos de entrenamiento y prueba.
Los conjuntos telecom_training y telecom_test, así como tu especificación del modelo de regresión logística, logistic_model, ya se han cargado en tu sesión.
Este ejercicio forma parte del curso
Modelado con tidymodels en R
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)