Train een random forest
Zoals je in de video zag, zijn random forest-modellen veel flexibeler dan lineaire modellen. Ze kunnen ingewikkelde niet-lineaire effecten modelleren en automatisch interacties tussen variabelen oppikken. Ze geven vaak hele goede resultaten op echte data, dus laten we er een proberen op de wine quality-gegevensset. Het doel is om de door mensen beoordeelde kwaliteit van een batch wijn te voorspellen op basis van enkele door machines gemeten chemische en fysieke eigenschappen van die batch.
Een random forest-model trainen werkt precies hetzelfde als een gegeneraliseerd lineair regressiemodel, zoals je in het vorige hoofdstuk deed. Je verandert alleen het argument method in de functie train naar "ranger". Het ranger-pakket is een herschrijving van R's klassieke randomForest-pakket en traint modellen veel sneller, maar levert vrijwel dezelfde resultaten op. We raden alle beginners aan om het ranger-pakket te gebruiken voor random forest-modellering.
Deze oefening maakt deel uit van de cursus
Machine Learning met caret in R
Oefeninstructies
- Train een random forest,
model, op de wine quality-gegevenssetwine, waarbijqualityde responsvariabele is en alle andere variabelen verklarende variabelen zijn. - Gebruik
method = "ranger". - Gebruik een
tuneLengthvan 1. - Gebruik 5 CV-folds.
- Print
modelnaar de console.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit random forest: model
model <- train(
___,
tuneLength = ___,
data = ___,
method = ___,
trControl = trainControl(
method = "cv",
number = ___,
verboseIter = TRUE
)
)
# Print model to console