ComenzarEmpieza gratis

Canalización completa de feature engineering

El paquete recipes está diseñado para codificar varios pasos de feature engineering en un solo objeto, lo que facilita mantener las transformaciones de datos en un flujo de trabajo de Machine Learning.

En este ejercicio, vas a entrenar una canalización de feature engineering para preparar los datos de telecomunicaciones para el modelado.

El tibble telecom_df, así como tus conjuntos telecom_training y telecom_test de los ejercicios anteriores, ya están cargados en tu espacio de trabajo.

Este ejercicio forma parte del curso

Modelado con tidymodels en R

Ver curso

Instrucciones del ejercicio

  • Crea una receta que prediga canceled_service usando todas las variables predictoras en los datos de entrenamiento.
  • Elimina las variables predictoras correlacionadas usando un umbral de 0.8.
  • Normaliza todos los predictores numéricos.
  • Crea variables ficticias (dummy) para todos los predictores nominales.
  • Entrena tu receta con los datos de entrenamiento y aplícala a los datos de prueba.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Editar y ejecutar código