Random forest-model
In deze oefening ga je met de functie randomForest() uit het pakket randomForest een random forest-model bouwen om churn van klanten in de trainingsgegevensset training_set te voorspellen. De doelvariabele heet Future.
Je bekijkt en visualiseert ook het belang van de variabelen in het model.
Deze oefening maakt deel uit van de cursus
Predictive Analytics met netwerkgdata in R
Oefeninstructies
- Laad het pakket
randomForest. - Gebruik de functie
set.seed()met seed 863. - Bouw een random forest met de functie
randomForest()en alle variabelen intraining_set. De responsvariabeleFuturemoet een factor zijn, dus gebruik de functieas.factor(). - Plot de variabele-importantie van het random forest-model met
varImpPlot().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)