Pré-processar
Hora de fazer feature engineering! Você precisa construir uma receita para lidar com variáveis não informativas, mas potencialmente úteis, como o ID da observação, ou tratar valores ausentes. Esta também é uma oportunidade para transformar alguns preditores. Por exemplo, normalizar as features numéricas e criar variáveis dummies para as categóricas.
O conjunto de dados attrition e as divisões train e test que você criou no exercício anterior estão disponíveis no seu ambiente.
Este exercício faz parte do curso
Feature Engineering em R
Instruções do exercício
- Normalize todas as features numéricas.
- Faça imputação dos valores ausentes usando o algoritmo de imputação
knn. - Crie variáveis dummies para todos os preditores nominais.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe