Aan de slagGa gratis aan de slag

5-voudige cross-validatie

In deze cursus gebruik je een brede variatie aan gegevenssets om de volledige flexibiliteit van het caret-pakket te verkennen. Hier werk je met de beroemde Boston housing-gegevensset, waarbij het doel is om de mediane woningwaarde in verschillende buitenwijken van Boston te voorspellen.

Je kunt exact dezelfde code gebruiken als in de vorige oefening, maar verander de gegevensset die door het model wordt gebruikt:

model <- train(
  medv ~ ., 
  Boston, # <- nieuw!
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = 10,
    verboseIter = TRUE
  )
)

Vervolgens kun je het aantal cross-validatie-folds verlagen van 10 naar 5 met het argument number van trainControl():

trControl = trainControl(
  method = "cv", 
  number = 5,
  verboseIter = TRUE
)

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Cursus bekijken

Oefeninstructies

  • Pas een lm()-model toe op de Boston housing-gegevensset, waarbij medv de responsvariabele is en alle andere variabelen verklarende variabelen zijn.
  • Gebruik 5-voudige cross-validatie in plaats van 10-voudige cross-validatie.
  • Print het model naar de console en bekijk de resultaten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit lm model using 5-fold CV: model
model <- train(
  ___, 
  ___,
  method = "lm",
  trControl = trainControl(
    method = "cv", 
    number = ___,
    verboseIter = TRUE
  )
)

# Print model to console
Code bewerken en uitvoeren