Model aanpassen op trainingsgegevens
Het is tijd om je gegevens te splitsen in een trainingsset om een model te fitten en een aparte testset om de voorspellende kracht van het model te evalueren. Voordat we deze splitsing maken, nemen we eerst een steekproef van 100% van de rijen van house_prices zonder terugleggen en wijzen dit toe aan house_prices_shuffled. Dit zorgt ervoor dat de rijen worden "geschud", zodat de trainings- en testset willekeurig worden getrokken.
Deze oefening maakt deel uit van de cursus
Modelleren met data in de Tidyverse
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)