Aan de slagBegin gratis

Random forest-model

In deze oefening ga je met de functie randomForest() uit het pakket randomForest een random forest-model bouwen om churn van klanten in de trainingsgegevensset training_set te voorspellen. De doelvariabele heet Future. Je bekijkt en visualiseert ook het belang van de variabelen in het model.

Deze oefening maakt deel uit van de cursus

Predictive Analytics met netwerkgdata in R

Bekijk cursus

Oefeninstructies

  • Laad het pakket randomForest.
  • Gebruik de functie set.seed() met seed 863.
  • Bouw een random forest met de functie randomForest() en alle variabelen in training_set. De responsvariabele Future moet een factor zijn, dus gebruik de functie as.factor().
  • Plot de variabele-importantie van het random forest-model met varImpPlot().

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load package
___(randomForest)

# Set seed
set.seed(___)

# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)

# Plot variable importance
varImpPlot(___)
Code bewerken en uitvoeren