LoslegenKostenlos loslegen

Modell auf Trainingsdaten anpassen

Es ist Zeit, deine Daten in ein Training-Set zum Anpassen des Modells und ein separates Test-Set zur Bewertung der Vorhersageleistung zu splitten. Bevor wir diesen Split vornehmen, ziehen wir jedoch zunächst 100 % der Zeilen von house_prices ohne Zurücklegen und weisen das Ergebnis house_prices_shuffled zu. Dadurch werden die Zeilen „gemischt“, sodass Trainings- und Test-Set zufällig gezogen werden.

Diese Übung ist Teil des Kurses

Modellieren mit Daten im Tidyverse

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Set random number generator seed value for reproducibility
set.seed(76)

# Randomly reorder the rows
house_prices_shuffled <- house_prices %>% 
  sample_frac(size = 1, replace = FALSE)

# Train/test split
train <- house_prices_shuffled %>%
  slice(___:___)
test <- house_prices_shuffled %>%
  slice(___:___)
Code bearbeiten und ausführen