Vorverarbeitung
Zeit fürs Feature Engineering! Du sollst ein Recipe erstellen, das sich um nicht informative, aber möglicherweise wertvolle Variablen wie eine Beobachtungs-ID kümmert oder mit fehlenden Werten umgeht. Das ist auch eine gute Gelegenheit, einige Prädiktoren zu transformieren, z. B. numerische Features zu normalisieren und für kategoriale Features Dummy-Variablen zu erstellen.
Der Datensatz attrition sowie die in der vorherigen Übung erstellten train- und test-Splits stehen in deiner Umgebung bereit.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Normalisiere alle numerischen Features.
- Imputiere fehlende Werte mit dem
knn-Imputationsalgorithmus. - Erstelle Dummy-Variablen für alle nominalen Prädiktoren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
recipe <- recipe(Attrition ~ ., data = train) %>%
update_role(...1, new_role = "ID") %>%
# Normalize all numeric features
___(all_numeric_predictors()) %>%
# Impute missing values using the knn imputation algorithm
___(all_predictors()) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
recipe