Preprocessen
Tijd voor feature engineering! Je gaat een recipe bouwen om niet-informatieve maar mogelijk waardevolle variabelen zoals een observatie-ID te verwerken en om te gaan met missende waarden. Dit is ook een kans om enkele voorspellers te transformeren. Normaliseer bijvoorbeeld numerieke features en maak dummyvariabelen voor categorische features.
De gegevensset attrition en de train- en test-splits die je in de vorige oefening hebt gemaakt, zijn beschikbaar in je omgeving.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Normaliseer alle numerieke features.
- Imputeer missende waarden met het
knn-imputatie-algoritme. - Maak dummyvariabelen voor alle nominale voorspellers.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe