Train-test-validate-sets voorbereiden
In deze oefening ga je de tools gebruiken die je tot nu toe hebt geleerd om een classificatiemodel te bouwen dat personeelsverloop (attrition) voorspelt.
Je werkt met de gegevensset attrition, die 30 kenmerken over medewerkers bevat waarmee je voorspelt of ze het bedrijf hebben verlaten.
Je bereidt eerst de trainings- en testgegevens voor. Vervolgens splits je de trainingsgegevens verder met cross-validatie, zodat je het best presterende model voor deze taak kunt vinden.
Deze oefening maakt deel uit van de cursus
Machine Learning in de tidyverse
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
set.seed(42)
# Prepare the initial split object
data_split <- initial_split(___, prop = ___)
# Extract the training data frame
training_data <- training(___)
# Extract the testing data frame
testing_data <- testing(___)