Preprocesar
¡Hora de hacer feature engineering! Necesitas construir una receta para ocuparte de variables no informativas pero potencialmente útiles, como el ID de observación, o para tratar los valores ausentes. Esta también es una buena oportunidad para transformar algunos predictores. Por ejemplo, normaliza las características numéricas y crea variables ficticias para las categóricas.
El conjunto de datos attrition y las particiones train y test que creaste en el ejercicio anterior están disponibles en tu entorno.
Este ejercicio forma parte del curso
Ingeniería de características en R
Instrucciones del ejercicio
- Normaliza todas las características numéricas.
- Imputa los valores ausentes usando el algoritmo de imputación
knn. - Crea variables ficticias para todos los predictores nominales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe