LoslegenKostenlos loslegen

5-fache Kreuzvalidierung

In diesem Kurs wirst du eine Vielzahl von Datensätzen nutzen, um die volle Flexibilität des caret-Pakets zu erkunden. Hier arbeitest du mit dem berühmten Boston-Housing-Datensatz, bei dem das Ziel ist, mediane Immobilienwerte in verschiedenen Vororten von Boston vorherzusagen.

Du kannst exakt denselben Code wie in der vorherigen Übung verwenden, musst aber den vom Modell genutzten Datensatz ändern:

model <- train(
  medv ~ ., 
  Boston, # <- neu!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Als Nächstes kannst du die Anzahl der Kreuzvalidierungs-Folds von 10 auf 5 reduzieren, und zwar über das Argument number von trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Diese Übung ist Teil des Kurses

Maschinelles Lernen mit caret in R

Kurs anzeigen

Anleitung zur Übung

  • Fitte ein lm()-Modell auf den Boston-Housing-Datensatz, sodass medv die Zielvariable ist und alle anderen Variablen die erklärenden Variablen sind.
  • Verwende 5-fache statt 10-facher Kreuzvalidierung.
  • Gib das Modell in der Konsole aus und inspiziere die Ergebnisse.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Code bearbeiten und ausführen