Aan de slagGa gratis aan de slag

Random forest-model

In deze oefening ga je met de functie randomForest() uit het pakket randomForest een random forest-model bouwen om churn van klanten in de trainingsgegevensset training_set te voorspellen. De doelvariabele heet Future. Je bekijkt en visualiseert ook het belang van de variabelen in het model.

Deze oefening maakt deel uit van de cursus

Predictive Analytics met netwerkgdata in R

Cursus bekijken

Oefeninstructies

  • Laad het pakket randomForest.
  • Gebruik de functie set.seed() met seed 863.
  • Bouw een random forest met de functie randomForest() en alle variabelen in training_set. De responsvariabele Future moet een factor zijn, dus gebruik de functie as.factor().
  • Plot de variabele-importantie van het random forest-model met varImpPlot().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load package
___(randomForest)

# Set seed
set.seed(___)

# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)

# Plot variable importance
varImpPlot(___)
Code bewerken en uitvoeren