5-fache Kreuzvalidierung
In diesem Kurs wirst du eine Vielzahl von Datensätzen nutzen, um die volle Flexibilität des caret-Pakets zu erkunden. Hier arbeitest du mit dem berühmten Boston-Housing-Datensatz, bei dem das Ziel ist, mediane Immobilienwerte in verschiedenen Vororten von Boston vorherzusagen.
Du kannst exakt denselben Code wie in der vorherigen Übung verwenden, musst aber den vom Modell genutzten Datensatz ändern:
model <- train(
medv ~ .,
Boston, # <- neu!
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Als Nächstes kannst du die Anzahl der Kreuzvalidierungs-Folds von 10 auf 5 reduzieren, und zwar über das Argument number von trainControl():
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit caret in R
Anleitung zur Übung
- Fitte ein
lm()-Modell auf denBoston-Housing-Datensatz, sodassmedvdie Zielvariable ist und alle anderen Variablen die erklärenden Variablen sind. - Verwende 5-fache statt 10-facher Kreuzvalidierung.
- Gib das Modell in der Konsole aus und inspiziere die Ergebnisse.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console