ComeçarComece de graça

Imputação de valores ausentes e criação de variáveis dummies

Depois de detectar valores ausentes no conjunto de dados attrition e determinar que estão ausentes completamente ao acaso (MCAR), você decide usar imputação por K Nearest Neighbors (KNN). Ao configurar sua recipe de feature engineering, você decide criar variáveis dummies para todas as variáveis nominais e atualizar a função (role) da variável ...1 para "ID" para mantê-la no conjunto de dados como referência, sem afetar o modelo.

Este exercício faz parte do curso

Feature Engineering em R

Ver curso

Instruções do exercício

  • Atualize a função (role) de ...1 para "ID".
  • Impute valores em todos os preditores onde houver dados ausentes.
  • Crie variáveis dummies para todos os preditores nominais.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

lr_model <- logistic_reg()

lr_recipe <- 
  recipe(Attrition ~., data = train) %>%

# Update the role of "...1" to "ID"
  ___(...1, new_role = "ID" ) %>%

# Impute values to all predictors where data are missing
  step_impute_knn(___) %>%

# Create dummy variables for all nominal predictors
  ___(all_nominal_predictors())

lr_recipe
Editar e executar o código