Einen Random Forest fitten

Wie du im Video gesehen hast, sind Random-Forest-Modelle deutlich flexibler als lineare Modelle. Sie können komplexe nichtlineare Effekte modellieren und automatisch Interaktionen zwischen Variablen erfassen. Auf realen Datensätzen liefern sie häufig sehr gute Ergebnisse. Probieren wir das am Wine-Quality-Datensatz aus. Ziel ist es, die von Menschen beurteilte Qualität eines Weins vorherzusagen, gegeben einige maschinell gemessene chemische und physikalische Eigenschaften der Charge.

Das Fitting eines Random-Forest-Modells funktioniert genauso wie das einer generalisierten linearen Regression, wie du im vorherigen Kapitel gemacht hast. Du änderst lediglich das Argument method in der Funktion train auf "ranger". Das Paket ranger ist eine Neufassung von Rs klassischem Paket randomForest, passt Modelle viel schneller an und liefert nahezu identische Ergebnisse. Wir empfehlen allen Einsteigerinnen und Einsteigern, für Random-Forest-Modellierung das Paket ranger zu verwenden.

Diese Übung ist Teil des Kurses

<Kurs>Maschinelles Lernen mit caret in R</Kurs>

Kurs ansehen

Übungsanweisungen

Trainiere einen Random Forest namens model auf dem Wine-Quality-Datensatz wine, sodass quality die Zielvariable ist und alle anderen Variablen als erklärende Variablen dienen.
Verwende method = "ranger".
Verwende eine tuneLength von 1.
Verwende 5 CV-Folds.
Gib model in der Konsole aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Fit random forest: model
model <- train(
  ___,
  tuneLength = ___,
  data = ___, 
  method = ___,
  trControl = trainControl(
    method = "cv", 
    number = ___, 
    verboseIter = TRUE
  )
)

# Print model to console

Code bearbeiten und ausführen