LoslegenKostenlos starten

Random-Forest-Modell

In dieser Übung verwendest du die Funktion randomForest() aus dem Paket randomForest, um ein Random-Forest-Modell zur Vorhersage des Churns der Kundinnen und Kunden im Trainingsdatensatz training_set zu erstellen. Die Zielvariable heißt Future. Außerdem untersuchst und visualisierst du die Wichtigkeit der Variablen im Modell.

Diese Übung ist Teil des Kurses

<Kurs>Predictive Analytics mit vernetzten Daten in R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Lade das Paket randomForest.
  • Verwende set.seed() mit dem Seed 863.
  • Erstelle einen Random Forest mit der Funktion randomForest() und allen Variablen in training_set. Die Zielvariable Future muss ein Factor sein, nutze dafür die Funktion as.factor().
  • Plotte die Variablenwichtigkeit des Random-Forest-Modells mit varImpPlot().

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Load package
___(randomForest)

# Set seed
set.seed(___)

# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)

# Plot variable importance
varImpPlot(___)
Code bearbeiten und ausführen