ComenzarEmpieza gratis

Imputación de valores faltantes y creación de variables dummy

Tras detectar valores faltantes en el conjunto de datos attrition y determinar que faltan completamente al azar (MCAR), decides usar imputación con K vecinos más cercanos (KNN). Al configurar tu recipe de ingeniería de características, decides crear variables dummy para todas las variables nominales y actualizar el rol de la variable ...1 a "ID" para poder mantenerla en el conjunto de datos como referencia sin afectar a tu modelo.

Este ejercicio forma parte del curso

Ingeniería de características en R

Ver curso

Instrucciones del ejercicio

  • Actualiza el rol de ...1 a "ID".
  • Imputa valores a todos los predictores donde falten datos.
  • Crea variables dummy para todos los predictores nominales.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition ~., data = train) %>%

# Update the role of "...1" to "ID"
  ___(...1, new_role = "ID" ) %>%

# Impute values to all predictors where data are missing
  step_impute_knn(___) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())

lr_recipe
Editar y ejecutar código