LoslegenKostenlos starten

Vorbereiten und splitten

Du arbeitest mit dem vollständigen attrition-Datensatz mit 1470 Instanzen und 30 Features, die sich auf die Zielvariable Attrition beziehen, einschließlich fehlender Werte. Deine Aufgabe ist es, ein vollständiges End-to-End-Modell zur Vorhersage der Zielvariable zu erstellen. Der Datensatz ist bereits geladen.

Du beginnst mit der Vorbereitung und dem Splitten der Daten.

Diese Übung ist Teil des Kurses

<Kurs>Feature Engineering in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Wandle zuerst alle Zeichenkettenwerte in Faktoren um.
  • Erstelle Trainings- und Test-Splits.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Transform all character values to factors
attrition <- 
  attrition %>%
  mutate(___(where(___), as_factor))
  
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)

glimpse(train)
Code bearbeiten und ausführen