Imputação de valores ausentes e criação de variáveis dummies
Depois de detectar valores ausentes no conjunto de dados attrition e determinar que estão ausentes completamente ao acaso (MCAR), você decide usar imputação por K Nearest Neighbors (KNN). Ao configurar sua recipe de feature engineering, você decide criar variáveis dummies para todas as variáveis nominais e atualizar a função (role) da variável ...1 para "ID" para mantê-la no conjunto de dados como referência, sem afetar o modelo.
Este exercício faz parte do curso
Feature Engineering em R
Instruções do exercício
- Atualize a função (role) de
...1para "ID". - Impute valores em todos os preditores onde houver dados ausentes.
- Crie variáveis dummies para todos os preditores nominais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe