Imputación de valores faltantes y creación de variables dummy
Tras detectar valores faltantes en el conjunto de datos attrition y determinar que faltan completamente al azar (MCAR), decides usar imputación con K vecinos más cercanos (KNN). Al configurar tu recipe de ingeniería de características, decides crear variables dummy para todas las variables nominales y actualizar el rol de la variable ...1 a "ID" para poder mantenerla en el conjunto de datos como referencia sin afectar a tu modelo.
Este ejercicio forma parte del curso
Ingeniería de características en R
Instrucciones del ejercicio
- Actualiza el rol de
...1a "ID". - Imputa valores a todos los predictores donde falten datos.
- Crea variables dummy para todos los predictores nominales.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe