Aan de slagGa gratis aan de slag

Train een random forest

Zoals je in de video zag, zijn random forest-modellen veel flexibeler dan lineaire modellen. Ze kunnen ingewikkelde niet-lineaire effecten modelleren en automatisch interacties tussen variabelen oppikken. Ze geven vaak hele goede resultaten op echte data, dus laten we er een proberen op de wine quality-gegevensset. Het doel is om de door mensen beoordeelde kwaliteit van een batch wijn te voorspellen op basis van enkele door machines gemeten chemische en fysieke eigenschappen van die batch.

Een random forest-model trainen werkt precies hetzelfde als een gegeneraliseerd lineair regressiemodel, zoals je in het vorige hoofdstuk deed. Je verandert alleen het argument method in de functie train naar "ranger". Het ranger-pakket is een herschrijving van R's klassieke randomForest-pakket en traint modellen veel sneller, maar levert vrijwel dezelfde resultaten op. We raden alle beginners aan om het ranger-pakket te gebruiken voor random forest-modellering.

Deze oefening maakt deel uit van de cursus

Machine Learning met caret in R

Cursus bekijken

Oefeninstructies

  • Train een random forest, model, op de wine quality-gegevensset wine, waarbij quality de responsvariabele is en alle andere variabelen verklarende variabelen zijn.
  • Gebruik method = "ranger".
  • Gebruik een tuneLength van 1.
  • Gebruik 5 CV-folds.
  • Print model naar de console.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console
Code bewerken en uitvoeren