Aan de slagGa gratis aan de slag

Model aanpassen op trainingsgegevens

Het is tijd om je gegevens te splitsen in een trainingsset om een model te fitten en een aparte testset om de voorspellende kracht van het model te evalueren. Voordat we deze splitsing maken, nemen we eerst een steekproef van 100% van de rijen van house_prices zonder terugleggen en wijzen dit toe aan house_prices_shuffled. Dit zorgt ervoor dat de rijen worden "geschud", zodat de trainings- en testset willekeurig worden getrokken.

Deze oefening maakt deel uit van de cursus

Modelleren met data in de Tidyverse

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Code bewerken en uitvoeren