LoslegenKostenlos loslegen

Random-Forest-Modell

In dieser Übung verwendest du die Funktion randomForest() aus dem Paket randomForest, um ein Random-Forest-Modell zur Vorhersage des Churns der Kundinnen und Kunden im Trainingsdatensatz training_set zu erstellen. Die Zielvariable heißt Future. Außerdem untersuchst und visualisierst du die Wichtigkeit der Variablen im Modell.

Diese Übung ist Teil des Kurses

Predictive Analytics mit vernetzten Daten in R

Kurs anzeigen

Anleitung zur Übung

  • Lade das Paket randomForest.
  • Verwende set.seed() mit dem Seed 863.
  • Erstelle einen Random Forest mit der Funktion randomForest() und allen Variablen in training_set. Die Zielvariable Future muss ein Factor sein, nutze dafür die Funktion as.factor().
  • Plotte die Variablenwichtigkeit des Random-Forest-Modells mit varImpPlot().

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Load package
___(randomForest)

# Set seed
set.seed(___)

# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)

# Plot variable importance
varImpPlot(___)
Code bearbeiten und ausführen