Canalización completa de feature engineering
El paquete recipes está diseñado para codificar varios pasos de feature engineering en un solo objeto, lo que facilita mantener las transformaciones de datos en un flujo de trabajo de Machine Learning.
En este ejercicio, vas a entrenar una canalización de feature engineering para preparar los datos de telecomunicaciones para el modelado.
El tibble telecom_df, así como tus conjuntos telecom_training y telecom_test de los ejercicios anteriores, ya están cargados en tu espacio de trabajo.
Este ejercicio forma parte del curso
Modelado con tidymodels en R
Instrucciones del ejercicio
- Crea una receta que prediga
canceled_serviceusando todas las variables predictoras en los datos de entrenamiento. - Elimina las variables predictoras correlacionadas usando un umbral de 0.8.
- Normaliza todos los predictores numéricos.
- Crea variables ficticias (dummy) para todos los predictores nominales.
- Entrena tu receta con los datos de entrenamiento y aplícala a los datos de prueba.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___