Validierungs-Set-Ansatz
Im Kapitel zur linearen Regression hast du ein lineares Regressionsmodell angepasst, das das Herzgewicht von Katzen durch ihr Körpergewicht erklärt. Der/die Interviewer:in bittet dich nun, zu bewerten, wie gut dein Modell ist.
Um diese Frage zu beantworten, brauchst du Vorhersagen, die du mit den tatsächlichen Werten vergleichen kannst. Beim Validierungs-Set-Ansatz teilst du deine Daten in zwei Teile.
Dazu kannst du zunächst eine Stichprobe von z. B. 80 % der Zeilennummern ziehen. Verwende die ausgewählten Zeilennummern, um das Trainings-Set zu bilden. Der Rest des Data Frames dient zum Testen.

Denk daran:
rows <- c(1, 3)
df[-rows, ]
wählt alle bis auf die erste und die dritte Zeile aus.
Der cats-Datensatz steht dir in deiner Umgebung zur Verfügung.
Diese Übung ist Teil des Kurses
Statistik-Interviewfragen in R üben
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
set.seed(123)
# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))