Voorbereiden en splitsen
Je werkt met de volledige attrition-gegevensset met 1470 rijen en 30 features die gerelateerd zijn aan de doelvariabele Attrition, inclusief missende waarden. Je opdracht is om een volledig end-to-end model te bouwen om je doel te voorspellen. De gegevensset is alvast voor je ingeladen.
Je begint met het voorbereiden en splitsen van de data.
Deze oefening maakt deel uit van de cursus
Feature engineering in R
Oefeninstructies
- Begin met het omzetten van alle character-waarden naar factors.
- Maak train- en test-splits.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Transform all character values to factors
attrition <-
attrition %>%
mutate(___(where(___), as_factor))
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)
glimpse(train)