Train-test-validate-sets voorbereiden

In deze oefening ga je de tools gebruiken die je tot nu toe hebt geleerd om een classificatiemodel te bouwen dat personeelsverloop (attrition) voorspelt.

Je werkt met de gegevensset attrition, die 30 kenmerken over medewerkers bevat waarmee je voorspelt of ze het bedrijf hebben verlaten.

Je bereidt eerst de trainings- en testgegevens voor. Vervolgens splits je de trainingsgegevens verder met cross-validatie, zodat je het best presterende model voor deze taak kunt vinden.

Deze oefening maakt deel uit van de cursus

Machine Learning in de tidyverse

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

set.seed(42)

# Prepare the initial split object
data_split <- initial_split(___, prop = ___)

# Extract the training data frame
training_data <- training(___)

# Extract the testing data frame
testing_data <- testing(___)

Code bewerken en uitvoeren