Modell auf Trainingsdaten anpassen
Es ist Zeit, deine Daten in ein Training-Set zum Anpassen des Modells und ein separates Test-Set zur Bewertung der Vorhersageleistung zu splitten. Bevor wir diesen Split vornehmen, ziehen wir jedoch zunächst 100 % der Zeilen von house_prices ohne Zurücklegen und weisen das Ergebnis house_prices_shuffled zu. Dadurch werden die Zeilen „gemischt“, sodass Trainings- und Test-Set zufällig gezogen werden.
Diese Übung ist Teil des Kurses
Modellieren mit Daten im Tidyverse
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Set random number generator seed value for reproducibility
set.seed(76)
# Randomly reorder the rows
house_prices_shuffled <- house_prices %>%
sample_frac(size = 1, replace = FALSE)
# Train/test split
train <- house_prices_shuffled %>%
slice(___:___)
test <- house_prices_shuffled %>%
slice(___:___)