Aan de slagBegin gratis

Voorbereiden en splitsen

Je werkt met de volledige attrition-gegevensset met 1470 rijen en 30 features die gerelateerd zijn aan de doelvariabele Attrition, inclusief missende waarden. Je opdracht is om een volledig end-to-end model te bouwen om je doel te voorspellen. De gegevensset is alvast voor je ingeladen.

Je begint met het voorbereiden en splitsen van de data.

Deze oefening maakt deel uit van de cursus

Feature engineering in R

Bekijk cursus

Oefeninstructies

  • Begin met het omzetten van alle character-waarden naar factors.
  • Maak train- en test-splits.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Transform all character values to factors
attrition <- 
  attrition %>%
  mutate(___(where(___), as_factor))
  
# Create train and test splits
set.seed(123)
split <- initial_split(attrition, strata = Attrition)
test <- ___(split)
train <- ___(___)

glimpse(train)
Code bewerken en uitvoeren