LoslegenKostenlos loslegen

Validierungs-Set-Ansatz

Im Kapitel zur linearen Regression hast du ein lineares Regressionsmodell angepasst, das das Herzgewicht von Katzen durch ihr Körpergewicht erklärt. Der/die Interviewer:in bittet dich nun, zu bewerten, wie gut dein Modell ist.

Um diese Frage zu beantworten, brauchst du Vorhersagen, die du mit den tatsächlichen Werten vergleichen kannst. Beim Validierungs-Set-Ansatz teilst du deine Daten in zwei Teile.

Dazu kannst du zunächst eine Stichprobe von z. B. 80 % der Zeilennummern ziehen. Verwende die ausgewählten Zeilennummern, um das Trainings-Set zu bilden. Der Rest des Data Frames dient zum Testen.

Denk daran:

rows <- c(1, 3)
df[-rows, ]

wählt alle bis auf die erste und die dritte Zeile aus.

Der cats-Datensatz steht dir in deiner Umgebung zur Verfügung.

Diese Übung ist Teil des Kurses

Statistik-Interviewfragen in R üben

Kurs anzeigen

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

set.seed(123)

# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))
Code bearbeiten und ausführen