Vorbereiten und splitten
Du arbeitest mit dem vollständigen attrition-Datensatz mit 1470 Instanzen und 30 Features, die sich auf die Zielvariable Attrition beziehen, einschließlich fehlender Werte. Deine Aufgabe ist es, ein vollständiges End-to-End-Modell zur Vorhersage der Zielvariable zu erstellen. Der Datensatz ist bereits geladen.
Du beginnst mit der Vorbereitung und dem Splitten der Daten.
Diese Übung ist Teil des Kurses
Feature Engineering in R
Anleitung zur Übung
- Wandle zuerst alle Zeichenkettenwerte in Faktoren um.
- Erstelle Trainings- und Test-Splits.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Transform all character values to factors
attrition <-
attrition %>%
mutate(___(where(___), as_factor))
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)
glimpse(train)