Random-Forest-Modell
In dieser Übung verwendest du die Funktion randomForest() aus dem Paket randomForest, um ein Random-Forest-Modell zur Vorhersage des Churns der Kundinnen und Kunden im Trainingsdatensatz training_set zu erstellen. Die Zielvariable heißt Future.
Außerdem untersuchst und visualisierst du die Wichtigkeit der Variablen im Modell.
Diese Übung ist Teil des Kurses
Predictive Analytics mit vernetzten Daten in R
Anleitung zur Übung
- Lade das Paket
randomForest. - Verwende
set.seed()mit dem Seed 863. - Erstelle einen Random Forest mit der Funktion
randomForest()und allen Variablen intraining_set. Die ZielvariableFuturemuss ein Factor sein, nutze dafür die Funktionas.factor(). - Plotte die Variablenwichtigkeit des Random-Forest-Modells mit
varImpPlot().
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)