Aan de slagGa gratis aan de slag

Voorbereiden en splitsen

Je werkt met de volledige attrition-gegevensset met 1470 rijen en 30 features die gerelateerd zijn aan de doelvariabele Attrition, inclusief missende waarden. Je opdracht is om een volledig end-to-end model te bouwen om je doel te voorspellen. De gegevensset is alvast voor je ingeladen.

Je begint met het voorbereiden en splitsen van de data.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Cursus bekijken

Oefeninstructies

  • Begin met het omzetten van alle character-waarden naar factors.
  • Maak train- en test-splits.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Transform all character values to factors
attrition <- 
  attrition %>%
  mutate(___(where(___), as_factor))
  
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)

glimpse(train)
Code bewerken en uitvoeren