Fehlende Werte imputieren und Dummy-Variablen erstellen
Nachdem du im Datensatz attrition fehlende Werte entdeckt und festgestellt hast, dass sie vollständig zufällig fehlen (MCAR), entscheidest du dich für eine Imputation mit K-Nearest Neighbors (KNN). Beim Konfigurieren deiner Feature-Engineering-recipe möchtest du Dummy-Variablen für alle nominalen Variablen erstellen und die Rolle der Variable ...1 auf "ID" setzen, damit du sie als Referenz im Datensatz behältst, ohne dein Modell zu beeinflussen.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Setze die Rolle von
...1auf "ID". - Imputiere fehlende Werte für alle Prädiktoren.
- Erstelle Dummy-Variablen für alle nominalen Prädiktoren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
lr_model <- logistic_reg()
lr_recipe <-
recipe(Attrition ~., data = train) %>%
# Update the role of "...1" to "ID"
___(...1, new_role = "ID" ) %>%
# Impute values to all predictors where data are missing
step_impute_knn(___) %>%
# Create dummy variables for all nominal predictors
___(all_nominal_predictors())
lr_recipe