5-voudige cross-validatie
In deze cursus gebruik je een brede variatie aan gegevenssets om de volledige flexibiliteit van het caret-pakket te verkennen. Hier werk je met de beroemde Boston housing-gegevensset, waarbij het doel is om de mediane woningwaarde in verschillende buitenwijken van Boston te voorspellen.
Je kunt exact dezelfde code gebruiken als in de vorige oefening, maar verander de gegevensset die door het model wordt gebruikt:
model <- train(
medv ~ .,
Boston, # <- nieuw!
method = "lm",
trControl = trainControl(
method = "cv",
number = 10,
verboseIter = TRUE
)
)
Vervolgens kun je het aantal cross-validatie-folds verlagen van 10 naar 5 met het argument number van trainControl():
trControl = trainControl(
method = "cv",
number = 5,
verboseIter = TRUE
)
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
- Pas een
lm()-model toe op deBostonhousing-gegevensset, waarbijmedvde responsvariabele is en alle andere variabelen verklarende variabelen zijn. - Gebruik 5-voudige cross-validatie in plaats van 10-voudige cross-validatie.
- Print het model naar de console en bekijk de resultaten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit lm model using 5-fold CV: model
model <- train(
___,
___,
method = "lm",
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console